Uber a epuizat întregul buget pentru AI pe 2026 încă din aprilie 2025. Microsoft a revocat licențele Claude Code pe care le activase pentru dezvoltatorii săi la doar câteva luni după ce le oferise. Un angajat Priceline a dezvăluit pentru TechCrunch că o reînnoire de rutină a contractului Cursor a venit cu o factură de 4-5 ori mai mare decât precedenta. Și nu sunt cazuri izolate – ele sunt simptomele unei epidemii de costuri care a cuprins întreaga industrie tech.
Deși prețurile per token au scăzut, consumul a explodat. În goana după productivitate, companiile au activat tot mai mulți agenți autonomi, au integrat AI în fiecare colț al aplicațiilor și au lăsat angajații să folosească fără limită cele mai scumpe modele. Rezultatul? O bulă a costurilor care amenință să spargă orice buget.
„Acum șase luni, discuțiile cu clienții erau despre «Ce poate face? Este suficient de bun?»”, povestește Alexander Embricos, șeful diviziei enterprise de la OpenAI, la un eveniment din New York. „Acum nu mai vorbim deloc despre asta. Acum întrebările sunt: «Cheltuim prea mult. Ce vizibilitate aveți? Ce auditabilitate? Ce controale asupra tokenurilor? Cât de eficiente sunt modelele voastre?»”
Această schimbare de ton a fost resimțită în toată industria. În aprilie și mai, J.R. Storment, directorul executiv al FinOps Foundation (un proiect sub egida Linux Foundation), a început să audă de la companii: „Doamne, am depășit de trei ori întregul buget de tokenuri pe 2026 și suntem abia în aprilie”. „Am început să auzim crize existențiale, iar întreaga conversație s-a mutat de la «maximizăm tokenurile și mergem repede» la «avem nevoie de garduri, cum controlăm asta?»”, spune Storment.
Epidemia de tokenuri
Chris Reed, director senior de finanțe IT la Priceline, compară situația cu „epidemia de cocaină-crack”. „Te lasă să încerci ca să te agați, iar acum ești dependent de ea.” Un CTO i-a spus lui Vitaly Gordon, CEO al Faros AI, că unul dintre inginerii săi a cheltuit 40.000 de dolari pe tokenuri într-o singură lună. „Nu știu sincer dacă ar trebui să-l opresc sau să le spun tuturor celorlalți să fie ca el.”
Un studiu Faros din martie, pe 20.000 de dezvoltatori, arată că producția de cod a crescut, dar și numărul de buguri și rescrieri. Jellyfish, o platformă de management al ingineriei, a descoperit că inginerii care foloseau cele mai multe tokenuri erau de aproximativ două ori mai productivi decât cei care foloseau mai puțin AI, dar consumau de 10 ori mai multe tokenuri pentru a ajunge acolo. Nicholas Arcolano, șeful cercetării la Jellyfish, spune că „cheltuielile cu AI explodează în mare parte din cauza funcțiilor agentice, consumul per dezvoltator crescând de aproximativ 18,6 ori în nouă luni”.
O piață nouă se naște
Pe măsură ce companiile își dau seama că nu mai pot ignora problema, începe să se contureze o piață pentru gestionarea costurilor AI. Startupuri, furnizori consacrați și un nou organism de standardizare – toți se întrec să ofere instrumente și un limbaj comun pentru a urmări cheltuielile.
Printre jucătorii puri se numără Pay-i, care urmărește, măsoară și optimizează costurile și performanța investițiilor GenAI. Paid le permite dezvoltatorilor să urmărească costurile, să măsoare utilizarea și să factureze utilizatorii pe baza valorii reale, nu a abonamentelor. Apoi sunt companii ca Jellyfish, Waydev și Faros AI, care oferă monitorizare a agenților AI pentru a demonstra ROI-ul instrumentelor de dezvoltare.
Furnizorii consacrați nu stau nici ei deoparte. Ramp a intrat recent în gestionarea cheltuielilor AI; Datadog și New Relic au adăugat servicii de gestionare a costurilor cloud, observabilitate la nivel de token și monitorizare GPU. La conferința FinOps X de săptămâna viitoare, AWS este așteptată să introducă noi funcții de management financiar pentru cheltuielile enterprise cu AI.
Tokenomics Foundation – noul FinOps pentru AI
În acest context, Linux Foundation a anunțat recent planurile pentru Tokenomics Foundation, un nou organism de standardizare care își propune să aducă aceeași disciplină a costurilor în jurul tokenurilor AI pe care FinOps a adus-o pentru cheltuielile cloud. „Urmărirea costurilor cloud este o problemă de date de sute de milioane de rânduri pe lună”, explică Storment. „Urmărirea costurilor tokenurilor este o problemă de trilioane de rânduri pe lună. Nu poți să bagi asta într-un spreadsheet sau într-un instrument de bază. Trebuie să regândești fundamental instrumentele, specificațiile și sistemele contabile.”
Fundația construiește o definiție canonică și un cadru pentru „tokenomics”: standarde deschise, specificații și metrici pentru utilizarea și facturarea tokenurilor AI, precum și noi metrici pentru economia AI, cum ar fi cost-per-inteligență sau tokeni-per-watt. De asemenea, plănuiește să definească metrici pentru eficiența fabricii de tokenuri și eficiența consumului. Grupul urmează să se lanseze oficial în iulie și va anunța noi membri la conferința FinOps X.
„Economia tokenurilor este fundamental mai abstractă și mai opacă decât orice am gestionat la această scară până acum”, spune Nishant Gupta, chief availability officer la Salesforce, într-o declarație. „Necesită un mușchi operațional diferit de cel pe care industria l-a construit pentru cloud.”
Provocări și perspective
Cu toate acestea, Goldman Sachs estimează că utilizarea globală a tokenurilor se va înmulți de 24 de ori până în 2030. Companiile deja peste buget au nevoie de soluții acum, iar prima livrare a fundației este încă la luni distanță. „Poate am creat un motor cu aburi, dar încă nu am inventat linia de asamblare”, spune Gordon. „Cel mai bun ROI vine din mutarea masei largi de la utilizare scăzută la moderată, nu din împingerea utilizatorilor grei și mai sus.”
La Priceline, Reed vede deja discrepanțe între utilizarea raportată de furnizor și datele interne. „Mi-am început cariera în gestionarea cheltuielilor de telecomunicații și văd aceleași paralele: de la telecom la cloud la AI. De fiecare dată când introduci ceva nou, apar erori de facturare și oportunități de audit și optimizare.”
Concluzie
Industria AI se confruntă cu o criză de maturizare. După ani de „go fast and break things”, vine momentul să plătească factura. Tokenurile, acele unități invizibile care alimentează modelele de limbaj, s-au dovedit a fi un cost ascuns care poate devora bugete întregi. Soluțiile încep să apară – de la startupuri agile la giganți tech și organisme de standardizare – dar întrebarea rămâne: vor reuși companiile să pună frâu cheltuielilor înainte ca AI să devină o povară financiară insuportabilă?
De ce este important:
Acest articol dezvăluie o problemă critică pentru orice companie care adoptă AI: costurile tokenurilor pot scăpa de sub control mult mai repede decât se așteaptă. Înțelegerea acestor dinamici și a soluțiilor emergente (precum Tokenomics Foundation) este esențială pentru a evita surprizele financiare și pentru a maximiza ROI-ul investițiilor în inteligența artificială. Pe măsură ce AI devine omniprezent, gestionarea eficientă a costurilor tokenurilor va fi la fel de importantă ca și gestionarea costurilor cloud.