Google a lansat luni, în liniște, o aplicație inovatoare de dictare denumită „Google AI Edge Eloquent" pe platforma iOS, marcând astfel o intrare directă pe o piață deja populată de competitori precum Wispr Flow, SuperWhisper, Willow și alte soluții similare. Această mișcare strategică demonstrează interesul crescând al gigantului tehnologic pentru segmentul aplicațiilor de transcriere vocală bazate pe inteligență artificială, un domeniu în plină expansiune datorită îmbunătățirilor semnificative aduse modelelor speech-to-text în ultimii ani.
Aplicația este disponibilă gratuit în App Store, iar după descărcarea modelelor de recunoaștere automată a vorbirii (ASR) bazate pe Gemma, utilizatorii pot începe imediat să dicteze direct de pe telefonul lor. Un aspect deosebit de important este faptul că întreaga procesare poate fi realizată local, fără necesitatea unei conexiuni la internet, ceea ce reprezintă un avantaj major pentru utilizatorii care acordă prioritate confidențialității sau care operează în zone cu conectivitate limitată.
Odată deschisă aplicația, utilizatorii pot vizualiza în timp real transcrierea vorbirii lor. Când utilizatorul apasă butonul de pauză, aplicația intervine automat pentru a filtra cuvintele de umplutură precum „hm", „ei", „adică" și alte expresii hesitative care altfel ar încărca текстul final. Rezultatul este un текст elegant, curat și profesional, gata pentru utilizare imediată.
Sub zona de transcriere, aplicația oferă multiple opțiuni de transformare a textului dictat. Utilizatorii pot alege între modurile „Puncte cheie", „Formal", „Scurt" și „Lung", fiecare dintre acestea modificând structura și stilul текului în funcție de necesitățile specifice. Această flexibilitate permite adaptarea rapidă a conținutului pentru diverse contexte: de la emailuri formale la note rapide sau rezumate concentrate.
Un element distinctiv al aplicației Google AI Edge Eloquent este capacitatea de a comuta între modul cloud și modul exclusiv local. Atunci când modul cloud este activat, aplicația folosește modelele Gemini bazate în cloud pentru curățarea și rafinarea текстului. În schimb, dezactivarea acestui mod asigură că toate datele rămân pe dispozitivul utilizatorului, oferind un nivel suplimentar de protecție a confidențialității.
De asemenea, aplicația integrează o funcționalitate interesantă care permite importarea automată a anumitor cuvinte cheie, nume și terminologie specializată din contul Gmail al utilizatorului. Această caracteristică este deosebit de utilă pentru profesioniștii care utilizează frecvent termeni tehnici, nume de clienți sau expresii specifice domeniului lor de activitate. Pe lângă aceasta, utilizatorii pot adăuga manual propriile cuvinte personalizate într-o listă dedicată, asigurând astfel o recunoaștere precisă a vocabului lor particular.
Aplicația dispune și de un sistem complet de istoric al sesiunilor de transcriere. Utilizatorii pot naviga prin toate sesiunile anterioare și pot căuta în arhiva lor pentru a găsi rapid anumite pasaje sau idei. În plus, interfața afișează statistici valoroase precum cuvintele dictated în ultima sesiune, viteza de dictare exprimată în cuvinte pe minut, precum și numărul total de cuvinte rostite de-a lungul timpului.
Descrierea oficială din App Store subliniază natura avansată a aplicației: „Google AI Edge Eloquent este o aplicație de dictare inginerească pentru a face legătura între vorbirea naturală și текстul profesional, gata de utilizare. Spre deosebire de software-ul standard de dictare care transcrie ezitările și cuvintele de umplutură verbatim, Eloquent utilizează AI pentru a capta sensul dorit. Editează automat „hm-urile", „ei-urile" și autocorecțiile din mijlocul propozițiilor, oferind un текст curat și precis."
În prezent, aplicația este disponibilă exclusiv pe iOS, însă descrierea din App Store menționează explicit o versiune viitoare pentru Android. Referințele la versiunea pentru Android sugerează că Google plănuiește o expansiune pe ambele platforme majore mobile. Se pare că aplicația va oferi „integrare seamless cu Android", permițând setarea sa ca tastatură implicită pentru acces sistem-wide în orice câmp de text. Mai mult, funcționalitatea de buton flotant, similară cu cea utilizată de Wispr Flow pe Android, va permite accesul rapid la transcriere din orice aplicație.
Aplicațiile de transcriere bazate pe AI câștigă tot mai multă popularitate printre utilizatori, pe măsură ce modelele speech-to-text devin mai precise și mai capabile. Prin această aplicație experimentală, Google se alătură tendinței și își consolidează poziția în acest segment emergent. Dacă acest experiment se dovedește de succes, am putea asista la îmbunătățirea semnificativă a funcționalităților de transcriere pe întreaga platformă Android, integrate direct în sistemul de operare.
Această lansare marchează un moment important în evoluția aplicațiilor de productivitate mobilă, demonstrând că procesarea AI avansată poate fi eficient realizată și pe dispozitive mobile, fără a compromite performanța sau confidențialitatea utilizatorilor. Odată cu disponibilitatea tot mai largă a modelelor open-source precum Gemma, granița dintre funcționalitățile cloud și cele locale continuă să se estompeze, oferind utilizatorilor opțiuni tot mai flexibile pentru stilul lor de lucru.
Google lansează discret o aplicație de dictare bazată pe AI, cu procesare offline, disponibilă acum pe iOS