Filtrează articolele

AI

Google aduce comenzi vocale în Docs, Keep și Gmail: cum va schimba modul în care lucrăm

Google aduce comenzi vocale în Docs, Keep și Gmail: cum va schimba modul în care lucrăm
La conferința Google I/O, gigantul din Mountain View a anunțat o funcție care promite să redefinească interacțiunea cu aplicațiile de birou: introducerea comenzilor vocale avansate în Docs, Keep și Gmail. Nu mai e vorba doar de dictare simplă – acum poți vorbi cu aplicațiile ca și cum ai discuta cu un asistent inteligent, iar acestea vor înțelege cerințe complexe, schimbări de planuri și chiar umor.

În Docs, de exemplu, poți crea un document complet folosind doar vocea. Într-o demonstrație oferită de TechCrunch, un utilizator a extras detalii dintr-un CV stocat în Drive, a adăugat informații logistice dintr-un e-mail și a inclus chiar anecdote amuzante – totul într-o singură comandă vocală. Până acum, pentru a realiza același lucru, trebuia să tastezi fiecare element separat, să faci mai multe iterații și să pierzi timp prețios. Google promite că noua funcție înțelege când te răzgândești la mijlocul frazei și ajustează rezultatul final în consecință.

CEO-ul Google, Sundar Pichai, a subliniat că în viitor utilizatorii vor putea crea și edita documente exclusiv cu vocea. Este un pas uriaș spre o interacțiune mai naturală cu tehnologia, mai ales pentru cei care preferă să vorbească în loc să tasteze – fie din comoditate, fie din motive de accesibilitate.

Keep, aplicația de notițe, primește și ea o actualizare similară. Poți „vărsa” gândurile cu vocea, iar AI-ul va transforma transcrierea într-o notă structurată sau într-o listă organizată. Deși aplicații precum Voicenote.com sau AudioPen oferă de câțiva ani funcții asemănătoare, integrarea directă în ecosistemul Google face diferența. Recent, Google a lansat și Rambler, un produs de dictare încorporat în Gboard, care funcționează în toate aplicațiile.

Gmail nu putea fi lăsat deoparte. Cu noua funcție, utilizatorii pot conversa cu Gemini – asistentul AI al Google – și pot cere detalii precum următorul zbor, codul de la Airbnb sau ora programării la medic. Totul, prin voce. Este o extensie firească a tendinței de a folosi interogări lungi și complexe, pe care modelele actuale de AI le înțeleg din ce în ce mai bine.

Ce înseamnă asta pentru utilizatori? În primul rând, productivitate crescută. În loc să tastezi fraze scurte și să aștepți răspunsuri, poți spune o propoziție lungă care cuprinde mai multe sarcini. În al doilea rând, accesibilitate – persoanele cu dificultăți de tastare sau cele care preferă inputul vocal vor beneficia enorm. În al treilea rând, este un semn clar că Google pariază pe interacțiunea vocală ca metodă principală de comunicare cu dispozitivele.

Desigur, nu sunt singurii. Startup-uri precum Wispr Flow, Monologue sau Aqua Voice au introdus deja funcții similare. Dar Google are avantajul integrării profunde în suitele sale de aplicații, folosite de milioane de oameni zilnic. Rămâne de văzut cât de bine va funcționa în practică – recunoașterea vocală poate fi problematică în medii zgomotoase sau cu accente diferite. Totuși, progresele în domeniul AI fac ca aceste bariere să fie tot mai mici.

Un aspect interesant este modul în care Google abordează schimbarea de planuri în mijlocul unei comenzi. Dacă spui „Adaugă un paragraf despre buget, de fapt nu, mai bine despre termene”, AI-ul va înțelege că ultima parte este cea corectă. Această flexibilitate este posibilă datorită modelelor de limbaj avansate, care pot urmări contextul și intenția chiar și în fraze contradictorii.

Pe termen lung, aceste funcții ar putea schimba fundamental modul în care lucrăm cu documentele. În loc să scriem, vom vorbi. În loc să căutăm în e-mailuri, vom întreba. Iar Google pare hotărât să facă această tranziție cât mai lină.

De ce este important:


Această actualizare marchează un pas semnificativ spre o interacțiune mai naturală cu tehnologia, reducând dependența de tastatură și accelerând fluxurile de lucru. Pentru utilizatorii obișnuiți, înseamnă mai puțin timp pierdut cu tastarea și mai mult timp pentru idei. Pentru persoanele cu dizabilități, deschide uși către o accesibilitate sporită. Iar pentru piața de AI, confirmă că vocea devine un canal principal de interacțiune, nu doar o opțiune secundară.

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.