De ce inteligența artificială a Google nu poate scrie corect „Google” (sau orice alt cuvânt)

Google a investit masiv în inteligența artificială generativă, transformând motorul de căutare într-un asistent care răspunde direct întrebărilor utilizatorilor. Dar, în ciuda progreselor spectaculoase, noul sistem AI al Google face greșeli de ortografie jenante – chiar și atunci când este vorba de propriul nume. Utilizatorii au raportat că AI Overview, funcția care afișează răspunsuri generate automat în partea de sus a rezultatelor căutării, a scris „GoogLe” în loc de „Google”, a numărat greșit literele în cuvinte simple și a oferit definiții complet eronate. De exemplu, atunci când a fost întrebat câte litere „r” sunt în cuvântul „poop”, AI-ul a răspuns „exact 1”, deși cuvântul are două. În alt caz, a afirmat că în cuvântul „journalism” există două litere „d”, dar l-a scris „j-o-u-r-n-a-d-i-s-m”. Iar când a fost întrebat despre numele președintelui Statelor Unite, a scris „t-r-p-u-m” în loc de „Trump”. Aceste erori nu sunt doar amuzante – ele dezvăluie o limitare fundamentală a modelelor de limbaj mari (LLM-uri) care stau la baza acestor sisteme.

Problema nu este nouă. În urmă cu câțiva ani, când Google a lansat pentru prima dată AI Overviews, funcția a citat postări satirice de pe Reddit și The Onion, sfătuind oamenii să mănânce pietre sau să pună lipici pe pizza. De data aceasta, greșelile de ortografie persistă, iar Google recunoaște că „numărarea literelor în cuvinte este o provocare cunoscută pentru LLM-uri” și că lucrează la remedierea problemei. Dar, așa cum explică cercetătorii, această slăbiciune este inerentă arhitecturii modelelor.

Modelele de limbaj mari, precum cele care alimentează chatbot-uri și generatoare de text, nu „citesc” așa cum o facem noi. Ele nu percep cuvintele ca pe unități compuse din litere. În schimb, folosesc o arhitectură numită „transformer”, care descompune textul în „tokeni” – fragmente care pot fi cuvinte întregi, silabe sau chiar litere, în funcție de model. Acești tokeni sunt convertiți în reprezentări numerice, iar AI-ul învață să prezică următorul token pe baza contextului. „Când modelul vede cuvântul «the», are o singură codificare pentru sensul său, dar nu știe nimic despre literele T, H, E”, explică Matthew Guzdial, cercetător în AI la Universitatea din Alberta. „LLM-urile nu citesc efectiv textul – ele îl traduc într-o codificare.”

Această limitare face ca sarcinile simple de ortografie să fie extrem de dificile pentru AI. Sheridan Feucht, doctorand la Northeastern University, specializat în interpretabilitatea modelelor de limbaj, spune că „este greu să ocolești întrebarea ce înseamnă exact un «cuvânt» pentru un model de limbaj. Chiar dacă experții ar cădea de acord asupra unui vocabular perfect de tokeni, modelele ar găsi probabil util să «fărâmițeze» și mai mult lucrurile.” Potrivit ei, „nu există un tokenizator perfect din cauza acestei vaguități.”

Deși aceste eșecuri par ridicole, ele nu reprezintă o prioritate urgentă pentru cercetători, deoarece utilitatea LLM-urilor nu constă în capacitatea lor de a ortografia corect. Modelele pot scrie cod într-o aplicație în câteva secunde sau pot rezolva probleme matematice care i-au încurcat pe specialiști decenii întregi. Totuși, greșelile de ortografie ne reamintesc că AI-ul nu este perfect, chiar dacă uneori pare o putere atotștiutoare, dincolo de înțelegerea noastră. Nu putem avea încredere oarbă în rezultatele generate de AI fără a le verifica acuratețea.

Google a încercat să corecteze unele dintre probleme. De exemplu, săptămâna trecută a remediat o eroare prin care căutarea cuvântului „disregard” afișa o definiție care spunea „Înțeles. Anunță-mă când ai o nouă întrebare sau solicitare!” – un răspuns tipic de chatbot, nu un dicționar. Dar greșelile de ortografie rămân, pentru că ele sunt greu de eliminat complet.

În concluzie, deși Google își dublează angajamentul de a face din AI generativ piesa centrală a motorului său de căutare, aceste incidente arată că tehnologia are încă limite fundamentale. Ele ne obligă să fim critici și să nu tratăm răspunsurile AI ca pe adevăruri absolute. Pe măsură ce companii precum Google, Meta sau Amazon integrează tot mai mult AI în produsele lor, este esențial să înțelegem că perfecțiunea este încă departe.

De ce este important:

Acest articol evidențiază o limitare structurală a inteligenței artificiale generative, care afectează nu doar Google, ci toate sistemele bazate pe LLM-uri. Înțelegerea acestor limitări este crucială pentru utilizatori, dezvoltatori și factorii de decizie, deoarece ne ajută să evaluăm corect fiabilitatea informațiilor furnizate de AI și să nu cădem în capcana unei încrederi oarbe. Pe măsură ce AI devine omniprezent în căutări, asistenți virtuali și aplicații de zi cu zi, conștientizarea slăbiciunilor sale ne protejează de dezinformare și ne încurajează să menținem un spirit critic.

Filtrează articolele

De ce este important: