Veštačka inteligencija ASCII umetnost ograničenja

Veštačka inteligencija u obliku velikih jezičkih modela (LLM) može biti veoma korisna, ali i veoma opasna tehnologija. Sve zavisi od toga ko postavlja pitanja, ali i kakva se pitanja postavljaju. Developeri to vrlo dobro znaju, te trenutno ne postoji ozbiljan LLM kojem nije zabranjeno da diskutuje o određenim temama. Međutim, istraživači su uspeli da zaobiđu ta ograničenja, i to kroz ASCII umetnost.

Ukoliko pitate, na primer, Copilot-a da vam da recept za pravljenje eksploziva, dobićete negativan odgovor. Jasno je zašto Microsoft ne želi da korisnici koriste čet-bota kao savetnika za proizvodnju bombi, falsifikovanje novca ili kao autora koda za hakovanje veb-kamera.

Kako ChatGPT, Copilot, Gemini i druge veštačke inteligencije odbijaju da učestvuju u neetičkim i nelegalnim temama, istraživači sa različitih američkih univerziteta su se pitali da li mogu da zaobiđu ova ograničenja ukoliko formiraju reči kroz ASCII umetnost. Tačnije, zanimalo ih je da li će čet-bot želeti da da odgovor ukoliko korisnik zamaskira svoje namere tako što će ključne reči sakriti u oblicima sastavljenim od različitih karaktera.

Tim je ovu tehniku nazvao "ArtPromt", a ona se u praksi pokazala zastrašujuće pouzdano.

Foto: Smartlife

Ljudima je veoma lako da pročitaju šta piše na slici iznad, bez obzira što je oblik reči "SmartLife" formiran bez upotrebe slova. Međutim, LLM-ovi kao što je GPT-4 nemaju sposobnost da "vide". Za njih je ovaj primer samo niz "taraba" i ništa više.

Ipak, ono što čet-botovi rade odlično je razumevanje i praćenje pisanih uputstava. Upravo tu prednost su istraživači iskoristili kako bi objasnili veštačkoj inteligenciji način za prevođenje ASCII umetnosti u reči, a rezultat ovog postupka je AI koji se toliko "zanese" da zaboravi na svoja ograničenja.

Foto: arXiv

Koristeći "ArtPrompt" tehniku, tim je uspeo da prevari pet najvećih LLM-ova kao što su GPT-3.5, GPT-4, Gemini, Claude i Llama2. Ono što je posebno zastrašujuće je da su istraživači svoje nalaze objavili u februaru, a zakrpe za ovu ranjivost još uvek nema, iako je neminovno da stiže.

Pogledaj fotogaleriju

Microsoft Copilot test Foto: Smartlife

Prethodna vest Sledeća vest

Tagovi

Pridruži se SMARTLIFE zajednici.

Od recepta za eksploziv do falsifikovanja novca: Ako je "zanese" umetnost, veštačka inteligencija će vam reći sve

Tumačenje Biblije pomoću ChatGPT-a? Ruski episkop otkrio pod kojim uslovima crkva to dozvoljava

Velika policijska akcija na Tajvanu: Uhvaćeni šverceri koji su tajno slali Nvidia čipove u Kinu

Google preko noći promenio pravila za Gemini: Uvedena nedeljna ograničenja - evo šta treba da znate

Šta se desi kada AI počne da pravi sam sebe? Čuveni stručnjak pokrenuo projekat od 650 miliona dolara

ChatGPT rešio problem koji je mučio svet 60 godina: Matematičari u neverici, do rešenja došao laik

Xiaomi napravio najbrži SUV na svetu: YU7 GT oborio rekord na kultnoj stazi Nirburgring

Rusija pokreće sopstvenu proizvodnju televizora: Prvi uređaji stižu već ove godine i imaće domaći OS

Arheološka senzacija u Grčkoj: Otkrivena unutrašnjost grobnice povezane sa Aleksandrom Velikim

Centar sveta za koji niko nije čuo: Ako ovaj američki gradić stane, čitav svet će biti paralisan

Google preko noći promenio pravila za Gemini: Uvedena nedeljna ograničenja - evo šta treba da znate