ComfyUI atinge o valoare de 500 de milioane de dolari, iar creatorii cer mai mult control asupra mediilor generate de AI

ComfyUI, un startup care ajută creatorii să controleze ieșirile de imagini, video și audio generate de modelele de difuzie printr-un flux de lucru bazat pe noduri, a anunțat o rundă de finanțare de 30 de milioane de dolari la o valoare de 500 de milioane de dolari. Rundă, condusă de Craft Ventures, a avut participarea altor investitori, inclusiv Pace Capital, Chemistry și TruArrow. ComfyUI a pornit ca un proiect open-source în 2023, imediat după introducerea modelelor de difuzie. În acel moment, modelele precum Midjourney și DALL-E ale OpenAI erau încă în fază incipientă, adesea făcând erori majore — de la adăugarea unui șasele de degete la mâini până la generarea de obiecte deformate sau contexte absurde. Pentru a aborda aceste limitări, fondatorii au dezvoltat un cadru modular care le permite creatorilor să aibă control granulat peste fiecare pas al procesului de generare. Instrumentul a câștigat atât de multă tracțiune printre profesioniști creativi încât a evoluat dintr-un proiect comunitari într-o startup formală. În ultimele luni ale anului 2024, ComfyUI a încasat 19 de milioane de dolari în financingul de tip Series A de la investitori precum Chemistry Ventures, Cursor Capital și Guillermo Rauch, fondatorul Vercel. Deși modelele de difuzie moderne au făcut progrese semnificative — reducând erorile evidente precum degetele suplimentare — nevoia pentru precizia granulată pe care o oferă ComfyUI a crescut, nu scăzut. "Dacă gândești la o soluție tipică bazată pe prompturi, precum Midjourney sau ChatGPT, tu întrebi pentru ceva, și obții doar între 60% și 80% din ceea ce vrei", a declarat Yoland Yan, cofondator și CEO al ComfyUI, în un interviu pentru TechCrunch. "Dar pentru a schimba acele rămași 20%, trebuie să joci la această mașină de sloturi." Yan a comparat procesul cu jocul într-un cazinou: deoarece o mică modificare a promptului poate duce la o ieșire complet diferită, inclusiv la suprascrierea părților care erau deja perfecte. ComfyUI rezolvă această problemă prin interfața sa bazată pe noduri, care permite creatorilor să leagă componente specifice ale procesului de generare — de la selecția semințului și ajustarea greutăților, până la aplicarea de filtre, controlul de zgomot și post-procesare — oferindu-le control total asupra calității ieșirii finale. "Nu poți ușor transmite acest mesaj în caseta de prompt a unui model de bază", a adăugat Yan. Instrumentul este utilizat de profesioniști creativi în efecte vizuale, animație, publicitate și chiar design industrial. ComfyUI afirmă că instrumentul său a devenit atâta de necesar pentru artiști tehnici și alți creativi încât nu este neobișnuit să se vadă anunțuri de job care menționează explicit "ComfyUI artist" sau "ComfyUI engineer" ca titlu de post. Deși modelele de bază pentru imagine și video continuă să se îmbunătățească, Yan sustine că sunt încă departe de perfecțiune, și un instrument precum ComfyUI va rămâne înalt de cerut. "În lumea în care "AI slop" va fi peste tot, abordarea ComfyUI de tip "human-in-the-loop" va câștiga în cele din urmă majoritatea ochilor", a declarat. Printre concurenții ComfyUI se numără și Weavy, un startup achiziționat de Figma anul trecut. Deși articolul original conține și alte știri — cum ar fi lansarea GPT-5.5 de către OpenAI, demisia lui Tim Cook de la Apple sau incidentul cu satelitul New Glenn al Blue Origin — acestea nu sunt relevante pentru analiza ComfyUI și au fost exclude din această prezentare pentru a menține focalizarea pe impactul tehnologic și de piață al acestui instrument esențial pentru era generativă a AI.

Filtrează articolele