Kako AI pomiče granice mogućeg?

Što je to protein? Zašto se protein voli savijati? Kakve veze ima umjetna inteligencija sa savijanjem proteina? Ovo su samo neka od važnih pitanja, ali postoji još jedno važnije pitanje: „Kome je palo na pamet osmisliti olimpijadu u savijanju proteina?” Za to su krivci John Moult, Jan Pedersen, Richard Judson i Krzysztof Fidelis.

Budući da smo odgovorili na najvažnije pitanje u ovome članku, ima li smisla odgovarati na druga pitanja? To bi bio slučaj da je olimpijada savijanja proteina klasična olimpijada gdje se proteini natječu u skoku u dalj, ali to nije slučaj. CASP je olimpijada u kojoj se znanstvenici natječu u predviđanju savijanja proteina. Eto, sad smo gotovi.

Ali čekaj, kakve veze imaju proteini koje uzimam nakon vježbanja s olimpijadom u njihovom savijanju? Pa, proteini sirutke možda i jesu dobra opcija za rast mišićne mase, ali oni nisu jedini proteini. Ustvari, trenutno poznajemo nekoliko stotina milijuna proteinskih struktura, a njihova je uloga puno važnija od samog rasta mišićne mase.

Proteini su ključni sastojak života na Zemlji, a svoju ulogu ostvaruju podupirući gotovo sve životne funkcije. Ovi mali strojevi vrlo su kompleksne molekule, a sastoje se od lanaca aminokiselina koji su savijeni na raznorazne načine. Svaki protein može se sastojati od stotinjak aminokiselina povezanih u savijene lance, a postoji 20 različitih aminokiselina.

Možda bi sad bilo zgodno reći zašto je savijanje proteina toliko važno. Za razliku od savijanja studenata srijedom, savijanje proteina određuje svrhu njihovog postojanja. I sad je pitanje: „Ako imamo 20 aminokiselina, koje grade proteine, zašto je problem savijanja proteina toliko težak da nam treba olimpijada?”

Zato što ne postoji konkretno pravilo koje nam govori da je struktura proteina koju smo dobili točna ili netočna. To je kao igranje šaha s beskonačno mnogo figura, a nemamo način za utvrđivanje pobjednika. I kako je onda uopće moguće riješiti problem savijanja proteina? Uz AlphaFold 2 ispada vrlo lako, ali priča je puno kompleksnija.

Do pojave AlphaFolda i AlphaFolda 2 nismo nizali prevelike uspjehe na olimpijadama – točnosti predviđanja strukture proteina kretale su se ispod 40% preciznosti. AlphaFold je uspio pomaknuti granicu na nekih 60% preciznosti, što je 2018. godine bio veliki uspjeh. Ali ima još, AlphaFold 2 je 2020. uspio predvidjeti strukturu s preciznošću od gotovo 90%.

Ovo je ogroman iskorak u predviđanju proteinske strukture, ali što je uopće taj AlphaFold 2? Ukratko, to je sustav umjetne inteligencije sa sposobnošću samostalnog učenja i predviđanja proteinske strukture (savijanja proteina) u nekoliko minuta na visokim razinama kompleksnosti. Wow! Objasnit ću zašto uskoro.

Ovaj sustav kao ulaz prima sekvencu aminokiselina, u osnovi slijed slova na papiru, a kao izlaz daje kompleksnu trodimenzionalnu proteinsku strukturu. Ovo je iznimno teško jer slova koja su blizu na papiru ne moraju biti blizu i u trodimenzionalnom prostoru, štoviše postoji ogroman set važnih pravila koja određuju prostorni raspored.

Način na koji AlphaFold 2 predviđa proteinsku strukturu temeljen je na neuronskim mrežama. Ako ste upoznati s konvolucijskim neuronskim mrežama, onda znate da je njihova primjena savršena za klasifikaciju fotografija. Ovakve su mreže dobre jer znaju da su karakteristike nekog objekta na slici, poput oči i nosa, blizu jedna drugoj.

Dok se ovakav tip mreža temelji na bliskosti karakteristika, neuronske mreže čija se arhitektura temelji na pozornosti potpuno su neovisne o blizini karakteristika. Drugim riječima, ako obje mreže čitaju knjigu, onda nam potonja može ispričati radnju drugog poglavlja vraćajući se na bilo koju stranicu u knjizi, a konvolucijska je mreža ograničena na stranice bliske drugom poglavlju.

Arhitektura temeljena na pozornosti samo je dio sustava umjetne inteligencije AlphaFold 2, a njegova cjelovitost ne može biti pravedno opisana na ovim kratkim stranicama. U interdisciplinarnoj mješavini sastojaka, osim informatičara, važno je spomenuti fizičare, mikrobiologe, kemičare, matematičare i ostale genijalne tvorce ovakvog sustava.

DeepMind, koji stoji iza AlphaFold 2 sustava, omogućio je javni pristup predviđenim proteinskim strukturama proteina u ljudi, kvasaca, poznatih patogena i drugih. Ovo omogućava znanstvenicima ispitivanje i razvoj novih lijekova, a već postoje radovi na temu ubrzanja razvoja lijekova posredstvom umjetne inteligencije.

Naravno da je nemoguće spomenuti sve mogućnosti primjene rezultata AlphaFolda, ali njegova poanta jest pomicanje granica znanosti. Ovo su samo prvi koraci na dugom putovanju od tisuće koraka koji slijede za buduće generacije znanstvenika čija će istraživanja biti potpomognuta naprednim sustavima umjetne inteligencije.

Iako smo odgovorili na sva važna pitanja, i dalje nije pravedno da ovako važna tema u znanstvenoj zajednici bude ograničena na dvije stranice teksta. Zato u dizajnu ovog članka možete pronaći različite QR kodove koji će vas odvesti na istraživanje o ovoj temi, a možete se okušati i u izradi vlastitog AI sustava. Sretno savijanje!