Filtrează articolele

AI

Stability AI lansează un nou model audio capabil să creeze piese muzicale de șase minute

Stability AI lansează un nou model audio capabil să creeze piese muzicale de șase minute
Stability AI, compania din spatele celebrului model de generare de imagini Stable Diffusion, a anunțat lansarea unei noi familii de modele audio, denumită Stability Audio 3.0. Conform declarațiilor oficiale, modelul de top al acestei serii poate genera muzică de calitate profesională, cu o durată de peste șase minute. Aceasta reprezintă o evoluție semnificativă față de versiunile anterioare și marchează un pas important în domeniul inteligenței artificiale aplicate creației muzicale.

Noua familie cuprinde patru modele distincte: Small SFX (459 de milioane de parametri), Small (459 de milioane de parametri), Medium (1,4 miliarde de parametri) și Large (2,7 miliarde de parametri). Primele două, cele „mici”, sunt optimizate pentru generarea de sunete și muzică pe dispozitive locale, putând produce compoziții de până la două minute. În schimb, modelele Medium și Large sunt capabile să creeze piese complete, de 6 minute și 20 de secunde, păstrând în același timp o structură muzicală coerentă și un ton melodic constant. Aceasta reprezintă o dublare a duratei maxime față de Stable Audio 2.0, lansat în 2024.

Un aspect remarcabil este decizia Stability AI de a face modelele Small SFX, Small și Medium disponibile cu greutăți deschise (open weights), permițând oricui să le utilizeze și să le modifice. Aceasta continuă tradiția companiei de a sprijini comunitatea open-source, după ce în 2024 lansase Stable Audio Open, care permitea generarea de muzică de până la 47 de secunde. Noul set de modele reprezintă un salt uriaș față de versiunile deschise anterioare.

Modelul Large, cel mai performant, este disponibil exclusiv prin API și servicii de self-hosting contra cost. În plus, companiile cu venituri anuale de peste un milion de dolari vor fi nevoite să achiziționeze o licență enterprise. Această strategie de monetizare este similară cu cea adoptată de alte firme din domeniu, cum ar fi Google sau ElevenLabs, care și ele lansează modele și instrumente pentru generarea muzicii.

Totuși, așa cum au demonstrat procesele în curs ale Suno și Udio, licențierea datelor și parteneriatele cu casele de discuri ar putea deveni un element-cheie pentru supraviețuirea pe termen lung a acestor servicii. Anul trecut, Stability AI a încheiat acorduri cu Warner Music Group și Universal Music Group pentru a dezvolta modele și instrumente de creație muzicală. Compania subliniază că ultimul său set de modele audio este construit pe date complet licențiate, ceea ce ar putea reduce riscurile legale.

Startup-ul AI dezvoltă, de asemenea, o nouă suită de produse destinate muzicienilor profesioniști, fără a oferi însă detalii suplimentare despre funcționalități. Ethan Kaplan, fost director digital la Universal Audio și Fender, se alătură companiei pentru a conduce oferta profesională de muzică. Această mișcare face parte dintr-un trend mai larg: tot mai multe companii AI încearcă să-și consolideze credibilitatea angajând directori din industria muzicală. De exemplu, Suno l-a angajat pe Jeremy Sirota, fost CEO al Merlin, ca director comercial, iar ElevenLabs l-a recrutat pe Derek Cournoyer de la editorul muzical independent Kobalt, ca responsabil de strategie pentru divizia de muzică.

Impactul acestor tehnologii asupra industriei muzicale este deja vizibil. Pe de o parte, artiștii independenți și producătorii mici pot beneficia de instrumente accesibile pentru a crea coloane sonore sau piese întregi fără a investi în studiouri scumpe. Pe de altă parte, marile case de discuri și artiștii consacrați privesc cu scepticism această evoluție, temându-se de încălcarea drepturilor de autor și de devalorizarea muncii creative.

Stability AI pare să fi înțeles aceste provocări și încearcă să construiască punți de colaborare cu industria tradițională. Parteneriatele cu Warner și Universal sunt un semn clar că firma dorește să evite litigiile care afectează concurenți precum Suno și Udio. În plus, angajarea unor nume sonore din domeniu, precum Ethan Kaplan, sugerează o orientare către produse profesionale, nu doar pentru amatori.

Din punct de vedere tehnic, modelele Stability Audio 3.0 folosesc arhitecturi avansate de deep learning, antrenate pe seturi vaste de date muzicale licențiate. Capacitatea de a menține coerența melodică pe durata a șase minute este o realizare notabilă, deoarece multe modele anterioare eșuau în a păstra structura pe termen lung. Acest lucru deschide posibilități noi pentru compozitori, care pot genera schițe complete de piese sau chiar coloane sonore pentru filme și jocuri.

Cu toate acestea, rămân întrebări legate de calitatea artistică și de originalitate. Poate o mașină să înlocuiască vreodată creativitatea umană? Probabil că nu, dar poate deveni un instrument valoros în procesul creativ. Stability AI își propune să ofere exact asta: unelte care să amplifice, nu să înlocuiască, talentul uman.

În concluzie, lansarea Stability Audio 3.0 reprezintă un moment important în evoluția AI-ului muzical. Cu modele open-source pentru comunitate și opțiuni premium pentru profesioniști, compania încearcă să echilibreze accesibilitatea cu sustenabilitatea financiară. Rămâne de văzut cum va evolua piața și dacă parteneriatele cu casele de discuri vor fi suficiente pentru a evita controversele legale. Cert este că viitorul muzicii va fi tot mai mult modelat de inteligența artificială, iar Stability AI se poziționează ca un jucător central în această transformare.

De ce este important:


Această lansare marchează un salt calitativ în generarea muzicii prin AI, permițând crearea de piese lungi, coerente, cu date licențiate. Pentru artiști, producători și dezvoltatori, modelele open-source oferă acces la tehnologie de ultimă oră, în timp ce parteneriatele cu casele de discuri sugerează o cale mai puțin litigioasă pentru integrarea AI în industrie. Este un semnal că viitorul muzicii va fi colaborativ între oameni și mașini.

Acest site folosește cookie-uri pentru a-ți oferi o experiență de navigare cât mai plăcută. Continuarea navigării implică acceptarea acestora.