Experimentul s-a concentrat pe 76 de pacienți care s-au prezentat la urgențele spitalului Beth Israel. Cercetătorii au comparat diagnosticele oferite de doi medici curanți cu cele generate de modelele OpenAI o1 și 4o. Pentru a elimina orice părtinire, diagnosticele au fost evaluate de alți doi medici, care nu știau dacă provin de la oameni sau de la mașini. Rezultatul? La fiecare punct de contact diagnostic, modelul o1 s-a comportat fie nominal mai bine, fie la fel de bine ca medicii, iar diferențele au fost „deosebit de pronunțate la primul punct de contact diagnostic (triajul inițial din camera de gardă), acolo unde există cea mai puțină informație disponibilă despre pacient și cea mai mare urgență de a lua decizia corectă”.
Concret, modelul o1 a reușit să ofere „diagnosticul exact sau foarte apropiat” în 67% din cazurile de triaj, comparativ cu un medic care a avut diagnosticul exact sau apropiat în 55% din cazuri și cu celălalt medic care a atins ținta în 50% din cazuri. Arjun Manrai, care conduce un laborator de inteligență artificială la Harvard Medical School și este unul dintre autorii principali ai studiului, a declarat: „Am testat modelul AI împotriva practic a fiecărui reper, iar acesta a depășit atât modelele anterioare, cât și performanțele medicilor noștri de referință.”
Este important de subliniat că studiul nu susține că AI-ul este gata să ia decizii de viață și de moarte în camera de gardă. Dimpotrivă, cercetătorii subliniază că descoperirile arată o „nevoie urgentă de studii prospective pentru a evalua aceste tehnologii în medii reale de îngrijire a pacienților”. De asemenea, ei au remarcat că au studiat doar modul în care modelele s-au descurcat atunci când au primit informații bazate pe text, iar „studiile existente sugerează că modelele fundamentale actuale sunt mai limitate în raționamentul asupra intrărilor non-text”.
Adam Rodman, medic la Beth Israel și coautor al studiului, a declarat pentru The Guardian că „nu există în prezent un cadru formal de responsabilitate” în jurul diagnosticelor AI și că pacienții „își doresc în continuare ca oamenii să îi ghideze prin deciziile de viață și de moarte și prin deciziile dificile de tratament”.
Acest studiu vine într-un moment în care inteligența artificială pătrunde tot mai mult în domeniul medical, de la analiza imaginilor radiologice până la asistarea în diagnosticare. Însă, așa cum subliniază autorii, înainte de a implementa pe scară largă astfel de sisteme, este nevoie de mai multe cercetări care să evalueze siguranța, acuratețea și impactul asupra relației medic-pacient. De asemenea, rămâne întrebarea etică: cine poartă răspunderea atunci când un diagnostic AI se dovedește greșit?
Pe de altă parte, rezultatele sunt promițătoare. În condițiile în care sistemele de sănătate din întreaga lume se confruntă cu suprasolicitare și lipsă de personal, un instrument care poate ajuta la triajul rapid și corect al pacienților ar putea salva vieți. Imaginați-vă un scenariu în care, la intrarea în spital, un asistent AI analizează simptomele și istoricul medical și oferă medicului o listă de diagnostice posibile, ordonate după probabilitate. Medicul rămâne cel care ia decizia finală, dar are la dispoziție un sprijin puternic.
Studiul de la Harvard este un pas important în această direcție, dar nu este singurul. Alte echipe de cercetare explorează utilizarea AI-ului în dermatologie, oftalmologie sau chiar în sănătatea mintală. Provocarea majoră rămâne integrarea acestor tehnologii în fluxurile de lucru existente, fără a crea confuzie sau a submina încrederea pacienților.
În concluzie, deși mai avem mult până când un robot va înlocui medicul de la urgențe, acest studiu arată că inteligența artificială poate fi un aliat valoros. Cheia este să găsim echilibrul între eficiența mașinilor și empatia umană, între viteza de calcul și judecata clinică. Iar pentru asta, avem nevoie de mai multe studii, de reglementări clare și, mai ales, de o discuție deschisă cu pacienții și cu profesioniștii din domeniu.
De ce este important:
Acest studiu demonstrează că inteligența artificială poate depăși performanța medicilor umani în diagnosticarea de urgență, în special în faza de triaj, când informațiile sunt limitate și deciziile trebuie luate rapid. Deși nu este încă pregătită pentru utilizare clinică de sine stătătoare, această cercetare deschide calea către integrarea AI-ului ca instrument de sprijin pentru medici, cu potențialul de a reduce erorile de diagnostic și de a îmbunătăți rezultatele pacienților. Totodată, subliniază necesitatea unor cadre legale și etice solide înainte de implementarea pe scară largă.