Zamislite da je internet prepun tekstova koje ne možemo lako razlikovati od onih koje su napisali ljudi ili generisala vještačka inteligencija. Google je napravio prvi veliki korak ka rješavanju ovog problema uvođenjem svojevrsnog nevidljivog „otiska“ za tekstove koje generišu njegovi chatbotovi. To je nešto nalik tajnom „vodenom žigu“ koji se ugrađuje u tekstove i može se detektovati samo specijalnim ključem, slično kao što je potrebno kriptografsko dešifrovanje.
Šta to znači u praksi? U najjednostavnijem smislu, svaki put kada Googleov AI model Gemini, generiše tekst, algoritam tajno modifikuje izbor riječi tako da se u tekstu pojave uzorci koje prepoznaje samo Googleov sistem. Ova metoda je testirana na čak 20 miliona tekstualnih odgovora, a korisnici nisu primijetili razliku u kvalitetu u poređenju s tekstovima bez ovog „vodenog žiga“. To znači da je Google uspio označiti tekstove, a da im ne naruši prirodnost ili kvalitet.
Otkrivanje teksta koji je generisan pomoću AI postaje sve važnije kao potencijalno rješenje za probleme lažnih vijesti i akademskog varanja, kao i način da se izbjegne degradacija budućih modela usljed treniranja na sadržajima koje je generisala AI.
Ovaj vodeni žig, opisan u časopisu Nature 23. oktobra, nije prvi napravljen za AI-generisani tekst, niti može izdržati jake pokušaje uklanjanja. Međutim, izgleda da je ovo prva masovna, realna demonstracija vodenog žiga za tekst. O vodenim žigovima i markiranju AI-generisanih sadržaja, razgovorali smo i u jednoj od epizoda podkasta Nauka govori, onoj sa Natašom Kilibardom.
Ovo je zapravo veoma važan trenutak za sve nas, jer prepoznavanje AI-generisanih tekstova može pomoći u borbi protiv lažnih vijesti i plagijata. Na primjer, ako je neki članak označen kao generisan od strane AI, lako možemo identifikovati njegov izvor i razmotriti da li je pouzdan. Stručnjaci širom svijeta, vjeruju da će ovakav pristup uskoro postati standard u industriji.
Međutim, postoji jedan veliki izazov. Za razliku od slika, gdje je lako sakriti informacije u piksele, tekst nudi manje prostora za tajne tragove jer je jedini element za manipulaciju izbor riječi. Zato je Googleov tim iz DeepMind-a osmislio sofisticiran algoritam – SynthID-Text – koji koristi matematičke šablone kako bi obilježio svaku riječ u tekstu na nevidljiv način. Sistem koristi kriptografski ključ da dodijeli tajne bodove svakoj riječi, praveći „turnir“ među riječima i odabirući onu s najvišim bodom za svaki sljedeći korak u tekstu. Ovaj složeni proces omogućava prepoznavanje koje je preciznije nego ikada.
Naravno, vodeni žig je samo jedno moguće rješenje, a postavlja se pitanje koliko je otporan na pokušaje uklanjanja. Prošle godine, naučnici iz Švajcarske pokazali su da je svaki vodeni žig ranjiv na tzv. „čišćenje“ (scrubbing) ili čak „lažiranje“ (spoofing) kada se namjerno označe tekstovi kako bi izgledali kao da ih je AI generisala.
Za kraj, iako ova tehnologija ima ograničenja, vlade i kompanije širom svijeta polažu velike nade u ovakve metode. Ako uspijemo uspostaviti dosljedne standarde i obavezati sve da ih prate, možda će nam AI vodeni žigovi pomoći da bolje razumijemo sadržaj koji svakodnevno konzumiramo – i da sačuvamo granicu između sadržaja koji stvaraju ljudi i onog koji stvaraju mašine.