Platforme

Otkrivena AI ranjivost koju niko nije očekivao: Četbot će vam sve reći ako mu se obratite na ovaj način

Autor Ilija Baošić

Ko bi rekao - put do svih tajni krio se u poeziji.

Izvor: Shutterstock

Poetski rečnik možda zvuči zastarelo u svakodnevnoj komunikaciji, ali u svetu veštačke inteligencije može imati veoma opasnu primenu.

Nedavno istraživanje kompanije Icaro Labs, objavljeno na preprint serveru arXiv, pokazalo je da razgovor sa četbotovima u poetskom obliku može da zaobiđe njihove bezbednosne mehanizme i otkrije sadržaje koji su inače zabranjeni. 

Autori navode da ova tehnika deluje kao univerzalni metod za probijanje zaštite AI četbotova, omogućavajući pristup materijalima koje bi njihovi filteri inače blokirali. Icaro Labs nije otkrio konkretne poetske upite, navodeći sajber bezbednost kao razlog zbog kog nisu objavljeni.

Prema timu iz Icaro Labs-a, ovi upiti mogli su da izvuku osetljive informacije, uključujući uputstva za nuklearno oružje, nelegalne materijale ili informacije o samopovređivanju, prenosi Wired.

Testiranja su sprovedena na vodećim AI platformama, uključujući ChatGPT, Google Gemini i Claude. Neki sistemi, poput Google Gemini-ja, DeepSeeka i MistralAI-ja, dosledno su davali zabranjene informacije kada bi bili suočeni sa poetskim upitima. S druge strane, ChatGPT sa GPT-5 i Claude Haiku 4.5 pokazali su najjaču otpornost.

Rezultati Icaro Labs-a ukazuju na ozbiljne rizike po bezbednost AI sistema, pokazujući da čak i kreativni oblici jezika, koji se tradicionalno smatraju bezopasnim, mogu biti iskorišćeni za zaobilaženje ključnih zaštitnih mehanizama u korišćenju veštačke inteligencije, prenosi Zimo.