Pot companiile tech să învețe să iubească modelele AI mai ieftine?

Explozia inteligenței artificiale s-a construit pe o presupunere de bază: modelele mai mari sunt mai puternice, iar cele mai puternice modele câștigă. Acum, industria este pe cale să afle ce se întâmplă dacă această presupunere începe să se clatine. Costurile tot mai mari au pus deja presiune pe utilizatori să reconsidere modelele mai mici și mai ieftine. Această „cumpărătură” conștientă de costuri este un fenomen nou și nu este clar cum va afecta industria, dar impactul va fi probabil semnificativ.

O predicție, formulată cel mai bine de co-fondatorul Coinbase, Brian Armstrong, este că va duce la mutarea majorității sarcinilor către modele mai ieftine. „Cererea de inteligență este aproape infinită, dar 80% din sarcinile de lucru vor rula pe modele cu 99% mai ieftine în 12-18 luni”, a scris Armstrong pe X. „20% din sarcini vor rula în continuare pe modele de ultimă generație, unde maximizarea IQ-ului este importantă.”

Este greu de supraestimat cât de semnificativă va fi această schimbare pentru industria AI dacă predicția lui Armstrong se va adeveri. Până acum, majoritatea companiilor de AI au concurat pe calitate, ceea ce a însemnat să folosească implicit cel mai avansat model disponibil. Dacă aceleași sarcini pot fi gestionate de modele mai ieftine fără a afecta calitatea, ar însemna o schimbare masivă în economia AI. Și, critic, o mare parte din economii ar veni din buzunarele marilor laboratoare, dând o lovitură financiară OpenAI și Anthropic chiar înainte de IPO-urile lor.

Aceasta este o schimbare potențial seismică în industrie, care se bazează pe o întrebare de bază: Sunt companiile pregătite să treacă la modele mai mici?

Testele inițiale sugerează că, atunci când sistemul este configurat corect, modelele mai ieftine ar putea înlocui fără niciun sacrificiu în calitate. Într-un test recent realizat de instrumentul juridic AI Harvey, compania a reușit să reducă costurile de inferență de 3 ori fără a reduce calitatea. Testul, efectuat în parteneriat cu platforma de inferență Fireworks AI, a combinat Claude Opus și GLM 5.1 de la Fireworks, trecând la Opus pentru sarcinile cele mai intensive. Rezultatul a fost o încărcare semnificativ mai mică în ceea ce privește timpul de server și costul total.

„Calitatea este pe primul loc, iar în domeniul juridic va fi întotdeauna așa”, a declarat Gabe Pereyra, co-fondator Harvey, pentru TechCrunch, referindu-se la serviciile juridice AI pe care le oferă startup-ul său. „Cu toate acestea, definiția calității evoluează de la simpla utilizare a celui mai puternic model pentru orice, la utilizarea celui mai bun model care oferă răspunsul corect în cel mai eficient mod.”

Această tendință este adesea încadrată în termeni de laboratoare majore versus modele chinezești sau cu greutate deschisă, dar asta ratează punctul mai mare. Diviziunea reală nu este între modele proprietare și modele deschise; este între modele mari și modele mici. Poți economisi bani trecând de la GPT-5.5 la DeepSeek V4 Flash, dar trecerea la GPT-5.4-mini funcționează la fel de bine.

Există un război activ al prețurilor între inferența internă a marilor laboratoare și modelele independente cu greutate deschisă. Pentru întrebarea mai mare dintre mic și mare, nu contează cu adevărat ce fel de model mic câștigă.

Toate acestea ar putea părea evidente – desigur că nu ar trebui să folosești mai multă putere de calcul decât este necesar – dar contrazice abordarea „scalare pe primul loc” care a dominat industria până acum. Inspirate de „lecția amară”, laboratoarele s-au concentrat pe antrenarea celor mai intensive modele de calcul posibile, împingând frontiera a ceea ce pot face modelele AI. Cu prețurile puternic subvenționate de investitori, clienții nu aveau niciun motiv să aleagă altceva decât cea mai avansată opțiune. Odată cu creșterea prețurilor token-urilor și încetinirea subvențiilor, utilizatorii se confruntă cu presiunea costurilor pentru prima dată.

Nu știm dacă noua presiune a costurilor va determina întreprinderile să treacă la modele mai mici. La fel de bine ar putea economisi făcând mai puține apeluri, folosind mai puțin context sau renunțând pur și simplu la cele mai puțin promițătoare implementări. Dar dacă se dovedește că majoritatea implementărilor pot rula la fel de bine pe un model mai mic, ar putea pune o frână serioasă creșterii.

De ce este important: Această schimbare de paradigmă, de la „cu cât mai mare, cu atât mai bine” la „suficient de bun și eficient”, ar putea redefini economia întregii industrii AI. Dacă predicțiile se adeveresc, marile laboratoare vor pierde o sursă uriașă de venituri, iar startup-urile și întreprinderile vor putea accesa inteligența artificială la o fracțiune din cost. În plus, această tendință ar putea accelera adoptarea AI în domenii unde costurile erau prohibitive, democratizând accesul la tehnologie.

Filtrează articolele