Microsoft lansează trei modele de inteligență artificială multimodală, menite să genereze text, voce și imagini, într-o încercare de a-și consolida poziția pe piața AI și de a concura cu rivali din domeniu.
Modelele de AI anunțate
Cele trei modele sunt numite MAI-Transcribe-1, MAI-Voice-1 şi MAI-Image-2. Microsoft afirmă că MAI-Transcribe-1 convertește vorbirea în text în 25 de limbi diferite și funcționează de 2,5 ori mai rapid decât oferta „Azure Fast”. Modelul este adaptat pentru a elimina zgomotul de fond în mediile aglomerate și va fi integrat în aplicația Microsoft Teams.
Al doilea model poate genera conținut audio și promite că poate produce 60 de secunde de sunet într-o secundă, în vocea specificată. Nu au fost furnizate detalii despre capacitatea exactă a celui de-al treilea model, MAI-Image-2, dar rezultatul a fost indicat ca fiind generare de imagini.
Dezvoltarea și conducerea echipei
Modelele au fost dezvoltate de echipa MAI Superintelligence, condusă de Mustafa Suleyman, CEO al Microsoft AI, care a devenit liderul diviziei în 2024. Suleyman este recunoscut ca fiind un specialist în domeniu.
Investiții și infrastructură
Microsoft a investit 13 miliarde USD în laboratorul de cercetare AI pentru dezvoltarea acestor modele. Compania a început în octombrie să utilizeze un cluster de cipuri Nvidia GB200, extinzând resursele de calcul destinate cercetării AI.
Șeful diviziei a declarat că resursele de calcul vor fi sporite în următoarele 12-18 luni, pentru a atinge o capacitate de nivel de vârf. Microsoft intenționează să crească infrastructura pentru a susține dezvoltarea modelelor AI mai versatile.
Parteneriate și aplicații
Modelele vor fi integrate în diverse produse Microsoft, într-un parteneriat multianual, subliniind angajamentul companiei de a promova tehnologia AI în multiple domenii. Nu au fost furnizate detalii despre costurile sau calendarul implementării acestor modele.
Microsoft continuă să investească semnificativ în cercetarea și dezvoltarea AI, consolidându-și ecosistemul de modele multimodale, într-un context de competiție acerbă pe piața tehnologică globală.















