Ovogodišnja Nobelova nagrada za fiziku dodijeljena je Johnu J. Hopfieldu i Geoffreyju E. Hintonu za njihov izuzetan doprinos razvoju vještačkih neuralnih mreža i mašinskog učenja.
Kraljevska švedska akademija nauka istakla je da su njihovi radovi postavili temelj današnjim moćnim metodama učenja računara putem podataka, omogućavajući mašinama da „nauče” iz iskustva, slično ljudskom mozgu. Ova tehnologija je danas ključna za oblasti poput prepoznavanja slike, prevođenja jezika i analize velikih podataka, a zahvaljujući Hopfieldu i Hintonu, mašine su sada sposobne da obavljaju funkcije koje su nekada smatrane mogućim samo za ljude. Nagrada je posebno priznanje pionirima čiji su radovi uveli statističke metode i fiziku u polje vještačke inteligencije, omogućivši napredak koji ima dubok uticaj na našu svakodnevicu.
Ovo je i odraz modernog doba u kojem se sve više priča o umjetnoj/vještačkoj inteligenciji (AI), velikim jezičkim modelima i mašinskom učenju te je omaž jednoj eri, koja je započela mnogo prije nego smo mi shvatili šta se događa.
John Hopfield je američki fizičar, rođen 15. juna 1933. u Chicagu, radi pri Princeton univerzitetu, a polje djelovanja mu je uglavnom statistička fizika i biofizika. Goeffrey Hinton je britansko-kanadski kompjuterski naučnik rođen 6. decembra 1947. u Velikoj Britaniji, u Wimbledonu, radi pri Univerzitetu Toronto te je radio nekad i za Google, a dobitnik je i Turingove nagrade.
No, mnogi se nakon ovoga pitaju da li je ovo odista Nobelova za fiziku, s obzirom da više pripada matematici i kompjuterskim naukama. Laureati jesu koristi principe fizike – Hopfield i Hinton su koristili principe iz statističke fizike i teorije sistema s mnogim komponentama da bi razvili svoje modele. Hopfieldove mreže, na primjer, oslanjaju se na teoriju energetskih sistema, dok su Hintonovi modeli inspirisani fizičkim konceptima koji se odnose na ravnotežu i energiju. Rad ovih naučnika bavi se razumijevanjem i modelovanjem kompleksnih sistema, što je značajan dio fizike. Njihova istraživanja doprinose razumijevanju načina na koji informacije mogu biti pohranjene i procesuirane u mrežama, slično kako fizički sistemi funkcioniraju.
Također, a bitno je naglasiti, tehnologije koje su razvijene kroz njihov rad imaju široku primjenu u fizici, uključujući razvoj novih materijala, analizu podataka i rješavanje kompleksnih problema, što ih čini relevantnim za fizičare.
Ovogodišnja Nobelova nagrada za fiziku podsjetila nas je koliko su fizika i matematike te statistika u osnovi kompjuterske nauke, algoritama, i posljedično, mašinskog učenja i vještačke inteligencije.
Dobitnici i njihovi doprinosi
John J. Hopfield i Geoffrey E. Hinton nisu samo pioniri vještačkih neuralnih mreža, već su i jedni od najuticajnijih naučnika u oblasti mašinskog učenja. Hopfield, fizičar i neurobiolog, napravio je 1982. godine osnovu za mašinsko učenje razvivši mrežu koja koristi pristup „asocijativne memorije” za čuvanje i rekonstrukciju informacija. Njegova mreža, poznata kao Hopfieldova mreža, omogućava sistemima da se ovi sistemi „sjete” i prepoznaju obrasce u podacima čak i kada su djelimično narušeni ili nekompletni.
S druge strane, Geoffrey Hinton, britansko-kanadski informatičar, razvio je Boltzmannovu mašinu, još jedan tip neuralne mreže koja koristi fiziku i statističke metode kako bi otkrila obrasce u podacima, što omogućava računaru da „nauči” karakteristike podataka koje mu se daju. Hintonov rad bio je presudan u širenju i razvoju neuralnih mreža i mašinskog učenja, a njegove metode danas su osnova za velike modele kao što su GPT i BERT koji se koriste za obradu prirodnog jezika.
Hinton je, u telefonskom razgovoru s Kraljevskom akademijom, za novinare, na pitanje o tome šta donosi ova tehnologija, kazao:
„Imaće veliki utjecaj, kao u industrijskoj revoluciji, ali umjesto povećanja naše fizičke sposobnost, povećaće naše intelektualne sposobnosti. Nemamo iskustva sa stvarima koje su pametnije od nas. U oblasti zdravstva će nam omogućiti bolju zdravstvenu zaštitu. (…) Ali moramo brinuti i za nekoliko loših posljedica. Posebno da ove stvari budu izvan kontrole.”
Hinton je radio u Google, ali je prošle godine Hinton je dao otkaz u Googleu kako bi mogao slobodno govoriti o opasnostima primjene umjetne inteligencije, i kaže da dio njega sada žali zbog svog životnog rada.
Šta je mašinsko učenje?
Mašinsko učenje je grana vještačke inteligencije koja omogućava računarima da uče iz podataka bez eksplicitnog programiranja. Tradicionalni programi funkcionišu po jasnim pravilima i algoritmima, dok mašinsko učenje koristi primjere i podatke da bi mašina sama prepoznala obrasce i naučila rješavati slične zadatke.
Ovaj proces je zasnovan na statističkim metodama i obično se odvija putem algoritama za obuku modela, koji prepoznaju strukture unutar podataka. Uz to, fizika ima važnu ulogu u modelovanju ovih procesa jer nam pomaže da razumijemo interakcije između čvorova unutar mreže, koji predstavljaju „neurone”, i njihovih veza, što je ključno za uspješno učenje.
Hopfieldova mreža: asocijativna memorija u mašinskom učenju
Hopfieldova mreža, razvijena 1982. godine, je tip neuralne mreže koja može da pamti i vraća obrasce čak i kada su nekompletni. Zamislimo ovu mrežu kao niz čvorova (neurona) koji su povezani različitim jačinama. Svaki čvor može zauzeti vrijednost, slično pikselima u slici. Mreža je dizajnirana tako da minimizira energiju sistema, što znači da će, kada se unese nepotpuni uzorak, mreža iterativno raditi na smanjenju svoje energije kako bi „prepoznala” obrazac koji najviše odgovara ulazu. Hopfieldova mreža koristi principe iz fizike, poput spina u magnetskim materijalima, kako bi formirala strukture koje nalikuju sinapsama u mozgu, omogućavajući mreži da funkcioniše kao ljudska memorija.
Šta je to Boltzmannova mašina?
Boltzmannove mašine su vrsta umjetne neuronske mreže koja koristi metode iz statističke fizike kako bi učila prepoznavati uzorke u podacima. Razvio ih je Geoffrey Hinton u cilju omogućavanja modela mašinskog učenja koji se temelji na pronalaženju značajki podataka bez eksplicitnih uputa. Nazvane su prema Ludwigu Boltzmannu, fizičaru koji je bio pionir u proučavanju termodinamike i entropije, jer ove mašine koriste matematičke principe vezane za distribuciju energije u sistemima s mnogo čestica.
U Boltzmannovoj mašini, čvorovi (ili „neuroni”) su povezani međusobno, te mogu biti u različitim stanjima (npr. uključen ili isključen). U procesu obuke, mašina analizira podatke, prilagođava težine između čvorova na osnovu prepoznatih obrazaca i na kraju “uči” prepoznavati karakteristične uzorke u podacima. Jedna od glavnih prednosti Boltzmannovih mašina je mogućnost generisanja novih primjera sličnih onima iz skupa podataka na kojem su trenirane, što je korisno u područjima kao što su prepoznavanje slika i generativno modeliranje.
U radu ove mreže bitno je i to da Boltzmannove mašine koriste princip minimizacije energije – nastoje postići stanje niže energije koje najbolje odgovara strukturi u podacima, što im omogućava prepoznavanje uzoraka ili struktura bez potrebe za detaljnim opisima ili pravilima unaprijed.
Izvor ilustracije: Nobel foundation
Statistička fizika i otkrivanje uzoraka
Razvoj mašinskog učenja usko je povezan sa statističkom fizikom jer fizičari koriste principe iz složenih sistema da modeliraju ponašanje mreža sa mnogo čvorova (neurona). Statistička fizika pomaže u razumijevanju kako mreže otkrivaju uzorke i prepoznaju strukture u podacima, čak i kada su podaci nejasni ili nepotpuni. U Hopfieldovoj mreži, čvorovi rade kao male magnetske čestice, a njihovo međusobno djelovanje omogućava mreži da „uči” i optimizuje svoju strukturu tako da prepozna slične obrasce iz podataka.
Kako funkcionišu vještačke neuralne mreže?
Vještačke neuralne mreže su strukturirane tako da oponašaju način na koji neuroni u mozgu procesuiraju informacije. Čvorovi (odnosno mašinski neuroni) u mreži su povezani „sinapsama” čija jačina može varirati. Mreža se „trenira” na način da poveća snagu između čvorova koji istovremeno imaju visoke vrijednosti, čime se omogućava mreži da prepozna specifične uzorke. Kada je mreža dovoljno „naučila” iz datih primjera, može prepoznati slične uzorke i u novim, do tada nepoznatim podacima. Ovaj pristup inspirisan je istraživanjima funkcije mozga iz 1940-ih i teorijom da se sinapse između neurona ojačavaju kada se aktiviraju istovremeno.
Doprinos Hintonove Boltzmannove mašine
Hintonov rad na Boltzmannovoj mašini predstavljao je prekretnicu u razvoju neuralnih mreža. Boltzmannova mašina koristi statističke metode kako bi identifikovala važne karakteristike u podacima, omogućavajući mašini da prepoznaje obrasce i klasifikuje podatke. Ova mašina takođe može generisati nove primjere obrazaca na osnovu onih na kojima je trenirana, što joj daje primjenu u oblastima poput obrade slika i prepoznavanja teksta. Hintonov doprinos bio je od presudne važnosti za napredak velikih modela učenja koji su temelj savremene vještačke inteligencije.
Širi značaj nagrađenih istraživanja
Radovi Johna Hopfielda i Geoffreyja Hintona predstavljaju prekretnicu u razvoju vještačkih inteligencija. Danas, zahvaljujući njihovim doprinosima, vještačke neuralne mreže koriste se u oblastima od medicine i ekonomije do svakodnevnih aplikacija kao što su prepoznavanje govora i slike. Hopfield i Hinton ne samo da su postavili osnovu za današnje napredne metode mašinskog učenja, već su otvorili vrata za buduća istraživanja i inovacije u polju vještačke inteligencije koje nastavljaju da oblikuju naš svijet.
Boltzmannove mašine i Hopfieldove mreže, kao rani modeli neuronskih mreža, imaju nekoliko specifičnih primjena koje su ih učinile korisnim u raznim oblastima, posebno u ranim fazama razvoja mašinskog učenja.
Boltzmannove mašine koriste se za prepoznavanje obrazaca i klasifikaciju podataka, npr. za identifikaciju rukom pisanih brojeva ili tekstura. U računalnoj grafici generišu nove primjere poput tekstura, dok u preporučivačkim sistemima analiziraju sklonosti korisnika, inspirisane Netflixovim i Amazonovim algoritmima. Hopfieldove mreže koriste se za korekciju šuma i rekonstrukciju slika, poput obnavljanja starih fotografija. Njihova asocijativna memorija omogućava prepoznavanje djelomičnih obrazaca, što je korisno u prepoznavanju glasa. Također, primjenjuju se u optimizacijskim problemima, kao što je problem trgovačkog putnika, tražeći optimalnu rutu.