În episodul „Gnomi” din South Park, difuzat în 1998, Kenny, Kyle, Cartman și Stan descoperă o comunitate de gnomi care fură chiloți noaptea. De ce? Gnomi își prezintă planul de afaceri: „Faza 1: Colectează chiloți. Faza 2: ? Faza 3: Profit.” Planul gnomilor a devenit unul dintre cele mai celebre meme-uri de pe internet, folosit pentru a satiriza de la strategii de startup-uri până la propuneri politice. Însuși Elon Musk, maestrul meme-urilor, l-a invocat într-un discurs despre cum intenționa să finanțeze o misiune pe Marte.
Acum, acest meme surprinde perfect starea inteligenței artificiale. Companiile au construit tehnologia (Pasul 1) și au promis transformarea (Pasul 3). Cum ajung acolo rămâne un mare semn de întrebare. Pentru Pause AI, Pasul 2 trebuie să implice reglementări. Dar exact ce va cere și cine le va aplica este încă dezbătut. Pe de altă parte, susținătorii IA sunt convinși că Pasul 3 este salvarea și tind să treacă cu vederea partea de mijloc. Ei ne văd alergând spre pământuri însorite pe spinarea unei „tehnologii transformatoare din punct de vedere economic”, așa cum mi-a spus Jakub Pachocki, cercetătorul șef al OpenAI, acum câteva săptămâni. Știu unde vor să ajungă – mai mult sau mai puțin: este cețos acolo sus și încă departe. Dar fiecare ia o rută diferită. Vor reuși toți? Va reuși cineva?
Pentru fiecare afirmație grandioasă despre viitor, există o evaluare mai sobră a modului în care teoria se întâlnește cu realitatea – una care potolește entuziasmul. Să luăm două studii recente. Unul, de la Anthropic, a prezis ce tipuri de locuri de muncă vor fi cel mai mult afectate de modelele de limbaj mari (LLM-uri). (Concluzia: managerii, arhitecții și cei din media ar trebui să se pregătească pentru schimbare; grădinarii, muncitorii în construcții și cei din ospitalitate, nu atât.) Dar predicțiile lor sunt doar presupuneri, bazate pe ce fel de sarcini par LLM-urile să facă bine, nu pe cum se descurcă ele în realitate la locul de muncă.
Un alt studiu, publicat în februarie de cercetătorii de la Mercor, un startup de angajare în IA, a testat mai mulți agenți de IA bazați pe modele de top de la OpenAI, Anthropic și Google DeepMind pe 480 de sarcini de birou frecvent îndeplinite de bancheri, consultanți și avocați umani. Fiecare agent testat a eșuat în a-și îndeplini majoritatea sarcinilor.
De ce există o asemenea dezacord larg? Există mai mulți factori. În primul rând, este crucial să luăm în considerare cine face afirmațiile (și de ce). Anthropic are interes personal. Mai mult, majoritatea celor care ne spun că ceva mare este pe cale să se întâmple au ajuns la această concluzie în mare parte pe baza vitezei cu care se dezvoltă instrumentele de codare IA. Dar nu toate sarcinile pot fi rezolvate cu codare. Alte studii au descoperit că LLM-urile sunt slabe la a face judecăți strategice, de exemplu. Mai mult, atunci când sunt implementate, instrumentele nu sunt doar aruncate într-o cameră curată. Ele trebuie să funcționeze în locuri contaminate de oameni și fluxuri de lucru existente. Și uneori adăugarea IA poate înrăutăți lucrurile. Sigur, poate că acele fluxuri de lucru trebuie rescrise și remodelate în jurul noii tehnologii pentru ca aceasta să atingă statutul transformator, dar asta va necesita timp (și curaj).
Acea gaură mare? Exact acolo ar trebui să fie Pasul 2. Lipsa de acord asupra a ceea ce se va întâmpla exact – și cum – creează un vid informațional care este umplut de cea mai recentă afirmație sălbatică a săptămânii, indiferent de dovezi. Suntem atât de deconectați de orice înțelegere reală a ceea ce urmează și cum va fi implementat, încât o singură postare pe rețelele sociale poate (și face) să zguduie piețele. Avem nevoie de mai puține presupuneri și mai multe dovezi. Dar asta va necesita transparență din partea producătorilor de modele, coordonare între cercetători și afaceri și noi modalități de a evalua această tehnologie care să ne spună ce se întâmplă cu adevărat atunci când este lansată în lumea reală.
Industria tehnologică (și odată cu ea economia mondială) se bazează pe promisiunea susținută că IA va fi cu adevărat transformatoare. Dar aceasta nu este încă o certitudine. Data viitoare când auzi afirmații îndrăznețe despre viitor, amintește-ți că majoritatea afacerilor încă își dau seama ce să facă cu chiloții lor.
De ce este important:
Acest articol dezvăluie decalajul critic dintre entuziasmul exagerat din jurul inteligenței artificiale și realitatea implementării sale practice. În timp ce companii precum OpenAI, Anthropic și Google DeepMind promit o transformare economică majoră, studiile arată că agenții de IA eșuează în sarcini de bază din domenii precum banking, consultanță și drept. Lipsa unui „Pas 2” clar – adică a unei strategii concrete de tranziție – creează un vid informațional periculos, în care piețele pot fi destabilizate de simple postări pe rețelele sociale. Pentru ca IA să devină cu adevărat transformatoare, avem nevoie de transparență, coordonare între cercetători și companii și metode de evaluare care să reflecte performanța reală în medii de lucru complexe. Fără acestea, riscăm să rămânem cu promisiuni goale și investiții risipite.