Consilium: Când modelele de limbaj colaborează – O revoluție în inteligența artificială distribuită

De la Concept la Arhitectură: Construirea Fundației Vizuale

În peisajul în continuă evoluție al inteligenței artificiale, apariția platformelor care permit colaborarea între multiple modele de limbaj mari (LLM) reprezintă un salt cuantic în modul în care interacționăm cu aceste tehnologii. Consilium se naște din această necesitate imperioasă de a transcende limitările inerente ale unui singur model AI, propunând o arhitectură revoluționară unde inteligența artificială devine un organism colectiv, capabil să dezbată, să analizeze și să atingă consensuri care depășesc cu mult capacitățile individuale.

Gestionarea stării sesiunii reprezintă coloana vertebrală a acestui sistem complex. Platforma funcționează dual: ca o interfață vizuală Gradio intuitivă și ca un server MCP (Model Context Protocol) care se integrează direct cu aplicații precum Cline. Această dualitate arhitecturală nu este întâmplătoare, ci reflectă o viziune profundă despre accesibilitate și interoperabilitate. Nucleul ideii a fost întotdeauna despre modelele de limbaj care ajung la un consens prin discuție; de aici provine și numele Consilium – un termen latin care evocă deliberarea colectivă, înțelepciunea grupului și procesul decizional fundamentat pe multiple perspective. Ulterior, alte modalități de decizie precum votul majoritar și alegerea clasificată au fost adăugate pentru a face colaborarea mai sofisticată și mai nuanțată, permițând rezoluții mai complexe în situații unde consensul pur este dificil de atins.

De la Concept la Arhitectură: O Călătorie Neașteptată

Aceasta nu a fost ideea mea inițială pentru hackathon. Am vrut inițial să construiesc un server MCP simplu pentru a comunica cu proiectele mele în RevenueCat. Totuși, am reconsiderat această abordare când am realizat că o platformă multi-LLM, unde aceste modele discută întrebări și returnează răspunsuri bine fundamentate, ar fi mult mai convingătoare și mai impactantă. Timing-ul s-a dovedit perfect. La scurt timp după hackathon, Microsoft a publicat AI Diagnostic Orchestrator (MAI-DxO), care este esențial un panou de doctori AI cu roluri diferite, precum „Dr. Challenger Agent” care diagnostichează iterativ pacienții. În configurația lor cu OpenAI o3, aceștia au rezolvat corect 85.5% din cazurile de referință pentru diagnostic medical, în timp ce medicii practicieni au atins doar 20% acuratețe. Această statistică uluitoare validează exact ceea ce Consilium demonstrează: multiple perspective AI colaborând pot depăși dramatic analiza individuală, transformând modul în care abordăm rezolvarea problemelor complexe.

Construirea Fundației Vizuale: Componenta Gradio Personalizată

Componenta Gradio personalizată a devenit inima submission-ului; masa rotundă în stil poker unde participanții stau și afișează bule de vorbire arătând răspunsurile lor, starea de gândire și activitățile de cercetare a captat imediat atenția oricui vizita spațiul. Dezvoltarea componentei a fost remarcabil de fluidă datorită experienței excelente a dezvoltatorilor Gradio, deși am întâmpinat un gol în documentație în jurul publicării PyPI care a dus la prima mea contribuție la proiectul Gradio. Designul vizual s-a dovedit robust pe parcursul hackathon-ului; după implementarea inițială, doar caracteristici precum avatarele definite de utilizator și textul de pe masa centrală au fost adăugate, în timp ce modelul de interacțiune de bază a rămas neschimbat.

Gestionarea Stării Sesiunii: Complexitatea din Spatele Simplității

Masa rotundă vizuală menține starea printr-un sistem de dicționar bazat pe sesiuni, unde fiecare utilizator primește stocare izolată a stării prin user_sessions[session_id]. Obiectul de stare de bază urmărește participanții, mesajele, currentSpeaker, thinking și array-urile showBubbles care sunt actualizate prin callback-uri update_visual_state(). Când modelele gândesc, vorbesc sau se execută cercetare, motorul împinge actualizări incrementale ale stării către frontend prin adăugarea la array-ul de mesaje și comutarea stărilor speaker/thinking, creând fluxul vizual în timp real fără mașini de stare complexe – doar mutații directe ale stării JSON sincronizate între procesarea backend și randarea frontend.

Făcând LLM-urile să Discute Cu Adevărat: Roluri și Dinamici

În timpul implementării, am realizat că nu exista o discuție reală între LLM-uri deoarece le lipseau roluri clare. Ele primeau contextul complet al discuțiilor în curs, dar nu știau cum să se implice în mod semnificativ. Am introdus roluri distincte pentru a crea dinamici de dezbatere productive: expert_advocate pentru advocacy pasionat, critical_analyst pentru critică riguroasă, strategic_advisor pentru perspective practice, research_specialist pentru cunoștințe de domeniu și innovation_catalyst pentru abordări revoluționare. Această inovație a rezolvat problema discuției, dar a ridicat o nouă întrebare: cum să determinăm consensul sau să identificăm cel mai puternic argument? Am implementat un sistem de analist principal unde utilizatorii selectează un LLM pentru a sintetiza rezultatul final și a evalua dacă consensul a fost atins.

Selecția LLM și Integrarea Cercetării

Selecția actuală a modelelor include Mistral Large, DeepSeek-R1, Meta-Llama-3.3-70B și QwQ-32B. Deși modele notabile precum Claude Sonnet și o3 de la OpenAI sunt absente, acest lucru a reflectat disponibilitatea creditelor de hackathon și considerațiile privind premiile sponsorilor, mai degrabă decât limitări tehnice. Pentru modelele care suportă apeluri de funcții, am integrat un agent de cercetare dedicat care apare ca un alt participant la masa rotundă. Acest agent accesează cinci surse: Web Search, Wikipedia, arXiv, GitHub și SEC EDGAR, oferind claritate vizuală despre disponibilitatea resurselor externe și asigurând acces consistent.

Descoperirea Protocolului Open Floor și Lecții Învățate

După hackathon, Deborah Dahl m-a prezentat Open Floor Protocol, care se aliniază perfect cu viziunea Consilium. Lecțiile învățate sunt numeroase: colaborarea multi-model necesită nu doar infrastructură tehnică, ci și un cadru conceptual care să definească dinamici de grup productive. Viitorul aduce promisiunea unor sisteme și mai sofisticate, unde inteligența artificială nu doar răspunde întrebărilor noastre, ci le dezbat cu rigoare academică, aducând laolaltă perspective diverse pentru a atinge adevăruri mai profunde și mai nuanțate decât ar putea orice model individual să ofere.

Filtrează articolele