Dobro došli u eru GPT-4o (omni) veštačke inteligencije.
OpenAI je predstavio GPT-4o, najnoviju multimodalnu veštačku inteligenciju koja kombinuje upite tekstom, glasom i slikom kako bi učinila komunikaciju između ljudi i kompjutera prirodnijom.
Novo rešenje ne predstavlja značajan skok u inteligenciji (po performansama je izjednačeno sa GPT-4 Turbo modelom), ali ono po čemu se ističe je brzina i unapređeno shvatanje audio i vizuelnih upita. OpenAI kaže da GPT-4o može da odgovori na glasovne upite za najmanje 232 milisekundi, a u proseku za 320 milisekundi, što je slično vremenu koje je potrebno ljudima.
Zapravo, prema demonstraciji koja je prikazana na zvaničnom OpenAI sajtu, GPT-4o neodoljivo podseća na veštačku inteligenciju iz filma "Her". U stanju je da detektuje i pokazuje emocije u glasu, odgovara bez kašnjenja i vodi razgovor koji deluje veoma prirodno.
U kombinaciji sa značajno unapređenim sposobnostima i brzini komunikacije na jezicima koji nisu engleski, jedna od mogućnosti koja će mnogima biti od velikog značaja je prevođenje u realnom vremenu.
Ukoliko korisnik to želi, uvek može uključiti kameru svog telefona kako bi postavljao pitanja o sebi ili svojoj okolini, a kao i kod glasa, GPT-4o će prepoznavati emocije - u ovom slučaju na osnovu izraza lica. Vizuelne sposobnosti idu dalje od korišćenja kamere, jer model poseduje i mogućnost razumevanja slika, dokumenata, grafikona i snimaka ekrana, između ostalog.
Najbolje od svega, GPT-4o će biti besplatan svim korisnicima ChatGPT aplikacije, dok će oni koji se odluče da plate mesečnu pretplatu dobiti pet puta veći kapacitet korišćenja.
API nove multimodalne veštačke inteligencije je sada dostupan svim kompanijama da implementiraju u svoja rešenja i aplikacije, a funkcije GPT-4o će postepeno stizati u ChatGPT aplikaciju.