AI počeo da dešifruje kod života: Novi model predviđa funkcije gena i skrivenu logiku DNK

Novi AI model treniran na DNK sekvencama predviđa funkcije gena i njihove veze, otkrivajući dublju logiku biologije.
Foto: YouTube / Sci- Inspi / SmartLife

Veštačka inteligencija je već transformisala način na koji obrađujemo tekst, slike, video i muziku, ali biologija se nameće kao sledeća velika granica. Umesto na rečenicama, istraživači sada treniraju modele na DNK i RNK nizovima, tretirajući genetske sekvence kao informacione sisteme koji se mogu analizirati u ogromnim razmerama.

Ovaj zaokret dolazi u trenutku kada količina genomskih podataka raste brže nego što tradicionalni statistički alati mogu da isprate. Tehnologija sekvenciranja postala je drastično jeftinija, ostavljajući naučnike sa ogromnom količinom podataka koje umeju da pročitaju, ali još uvek ne uspevaju da protumače na pravi način.

Upravo tu na scenu stupa kompanija Living Models sa svojom porodicom BOTANIC modela. Oni koriste transformer arhitekturu - istu tehnologiju koja pokreće ChatGPT - ali sa potpuno drugačijim ciljem. Umesto predviđanja sledeće reči u rečenici, ovi sistemi uče "gramatiku" biologije.

"Svako živo biće na Zemlji radi na istom programskom jeziku: DNK kodira RNK, koji kodira proteine, koji kodiraju fenotip. Mi ne gradimo još jedan četbot. Gradimo model koji može da čita i tumači taj kod, što je beskonačno korisnije od predviđanja sledeće reči u rečenici", izjavio je Bertran Gakijer, potpredsednik za biologiju u kompaniji Living Models.

Izbor biljaka kao polazne tačke, umesto ljudske medicine, je strateški potez. Podaci o biljnim genomima su javni i oslobođeni strogih pravila o privatnosti, što omogućava modelima da uče neverovatnom brzinom bez pravnih prepreka.

Takođe, regulatorni proces u poljoprivredi je daleko brži. Dok su u medicini potrebne decenije za klinička ispitivanja, u agrokulturi se rezultati predviđanja otpornosti na sušu mogu proveriti na terenu za samo jednu sezonu.

Ovo je ključno jer se čovečanstvo suočava sa hitnim problemom - predviđa se da ćemo do 2050. godine morati da nahranimo deset milijardi ljudi u klimi koja se nezaustavljivo menja. Tradicionalno ukrštanje sorti traje i do 12 godina, što je presporo za uslove koji nas čekaju.

BOTANIC funkcioniše kao "motor za hipoteze" koji dramatično skraćuje ovaj proces. On ne donosi odluke samostalno, već istraživačima nudi listu kandidata koji imaju najveće šanse da prežive ekstremne vreline ili nedostatak vode.

"Pitanje nije da li DNK ima 'nameru' na način na koji ljudski jezik ima. Nema je. Ali ima strukturu - regulatornu gramatiku, konzervirane motive, epistatičke interakcije između udaljenih genomskih regiona - i ta struktura se može naučiti iz samih podataka o sekvencama", navodi se u viziji kompanije.

Dosadašnji alati su se oslanjali na korelacije - znali su da određeni marker ide uz određenu osobinu, ali nisu znali zašto. Kada bi se uslovi u okruženju promenili, te statističke asocijacije bi se srušile. AI modeli to menjaju jer uče dubinske biološke veze koje važe čak i u nepredviđenim situacijama, piše TechRadar.

Kompanija je namerno objavila BOTANIC kao modele otvorenih parametara (Open Weights). Njihova logika je jasna: model je samo trenutni snimak znanja, dok je prava vrednost u protoku podataka i povratnim informacijama koje dobijaju kroz partnerstva sa velikim proizvođačima semena.

Budućnost koju Living Models gradi nije ograničena samo na biljke. Ime kompanije je odabrano svesno - njihova arhitektura je primenljiva na sve žive sisteme, od gljivica do ljudskih mikrobioma. Biljke su samo tamo gde je hitnost najveća, a strukturalne prednosti za AI istraživanje najuočljivije.