Diallo, CEO-ul companiei, a lucrat anterior la Goldman Sachs și apoi la ModelML, un startup susținut de Y Combinator, unde s-a ocupat de produs și creștere. Odemuyiwa, CTO-ul, este absolvent al Caltech, a lucrat la Meta și s-a înscris la Stanford Business School înainte de a co-fonda AethexAI. Împreună, au identificat o oportunitate uriașă: în timp ce companiile din întreaga lume se grăbesc să adopte instrumente AI pentru a automatiza operațiunile, piețele emergente sunt adesea lăsate în urmă. „Am vrut să construim ceva pentru piețele emergente și am început să căutăm oportunități”, spune Diallo.
Și au găsit una. În Egipt, un centru de apeluri a automatizat o parte semnificativă a apelurilor, dar a revenit la sistemul manual din cauza rezultatelor slabe. În Africa, mai multe centre de suport le-au spus că găsirea și angajarea inginerilor pentru a automatiza apelurile la un cost rezonabil era o durere de cap constantă. Problema principală? Latența și instabilitatea conexiunii. „Latența și jitter-ul pe care le-am văzut la apelurile automate din această regiune erau scandaloase. Dacă am fi devenit orchestratori, am fi fost nevoiți să folosim modele mari găzduite în afara regiunii, ceea ce ar fi dus la o latență și mai mare. Ne-am dat seama că, pentru ca acest lucru să funcționeze, trebuie să folosim modele foarte mici și să reducem latența la fiecare pas”, explică Odemuyiwa.
Așa că au construit propria serie de modele, numită Kora, cu parametri cuprinși între 300 de milioane și 1,7 miliarde. Este o fracțiune din dimensiunea modelelor mari de limbaj (LLM-uri), dar exact asta este ideea. Modelele mici sunt suficient de rapide pentru a răspunde în timp real, chiar și pe infrastructura mai puțin performantă din regiune. Pentru a antrena aceste modele, startup-ul a folosit înregistrări anonimizate de la un partener centru de apeluri. De asemenea, a trimis hard disk-uri la posturi de radio din Africa pentru a colecta mai multe date audio. Pentru a menține costurile scăzute, a construit o rețea de contribuitori formată din studenți universitari care să adnoteze date și să pronunțe nume locale.
Pe partea de business, compania are grijă să îndrume clienții care sunt noi în domeniul AI vocal, oferind demonstrații la fața locului și ateliere pentru a-i ajuta să identifice cele mai bune cazuri de utilizare pentru automatizare. „Le spunem întotdeauna clienților că nu putem fi totul pentru toată lumea acum. Suntem mici. Când începem să vorbim cu o companie, le cerem să aleagă un singur caz de utilizare care este cel mai important pentru ei pentru a începe”, spune Diallo.
În prezent, startup-ul este deschis să colaboreze cu toate industriile, dar o mare parte din cazurile de utilizare implică apeluri pentru colectarea datoriilor, activarea clienților sau verificarea KYC (Know Your Customer) – procesul standard de verificare a identității folosit de bănci și companii de telecomunicații. Compania angajează ingineri pe bază de contract pentru a deservi piețele locale și construiește parteneriate cu furnizorii de telecomunicații pentru a gestiona telefonia pentru apelurile AI vocale. Soluțiile plug-and-play, spun ei, pur și simplu nu funcționează aici.
Walter Badoo, co-fondator și partener managing al 4DX Ventures, susține că piața din Africa și Orientul Mijlociu este fundamental diferită de piețele pentru care au fost construite majoritatea companiilor de AI vocal. „Întreprinderile din Africa și Orientul Mijlociu procesează de aproximativ trei ori volumul de apeluri al omologilor lor occidentali, deoarece vocea este încă canalul dominant pentru interacțiunea cu clienții”, spune el. „Sistemele existente au fost construite pentru piețele occidentale, caracterizate prin infrastructură GPU de ultimă generație, medii standard de vorbire în engleză și europeană și fluxuri de lucru tipice pentru întreprinderile din SUA și Europa. Acest lucru creează lacune reale atunci când întreprinderile au nevoie de sisteme care să gestioneze dialecte, schimbarea codurilor și modele informale de vorbire și care să funcționeze în cadrul infrastructurii lor telefonice existente și la prețurile lor reale.”
Cu alte cuvinte, în timp ce companii precum ElevenLabs, Deepgram, Sierra și Cognigy se extind global într-un ritm rapid, piețele pentru care au fost construite și piețele în care intră nu sunt întotdeauna același lucru. Startup-uri precum AethexAI pariază că lacunele – modele specializate în dialecte locale, parteneriate la fața locului, infrastructură construită pentru regiune – reprezintă o deschidere pe piață pe care giganții nu au nici stimulentul, nici arhitectura să o închidă.
De ce este important:
AethexAI demonstrează că inovația nu trebuie să vină doar din Silicon Valley. Prin construirea unor soluții adaptate nevoilor specifice ale piețelor emergente, startup-ul nu doar că rezolvă probleme reale de latență și costuri, dar și creează un model de business care poate fi replicat în alte regiuni ignorate. Într-o lume în care AI-ul devine din ce în ce mai central, accesul la tehnologie nu ar trebui să fie un privilegiu al câtorva. AethexAI arată că, uneori, cele mai bune soluții sunt cele care nu încearcă să fie totul pentru toată lumea, ci se concentrează pe ceea ce contează cu adevărat pentru comunitățile pe care le deservesc.