
De ceva vreme, discuțiile despre înlocuirea forței de muncă umane prin inteligența artificială au devenit tot mai îngrijorătoare. Un experiment recent al cercetătorilor de la Carnegie Mellon University aduce însă o doză de realism: inteligența artificială este încă departe de a prelua locurile de muncă.
În cadrul simulării „TheAgentCompany”, o întreagă echipă a unei presupuse companii de software a fost formată exclusiv din agenți AI de la companii precum Google, OpenAI, Anthropic și Meta. Rezultatul? Un dezordon sistem și performanțe dezamăgitoare, demonstrând că, deocamdată, inteligența artificială nu este pregătită să înlocuiască oamenii în sarcini complexe.
Cum a fost organizată compania și sarcinile agenților AI
Cercetătorii au vrut să vadă cum s-ar descurca modelele de inteligență artificială în mediul unei companii reale de software. Agenții AI au fost „angajați” pe posturi precum analisti financiari, ingineri software și manageri de proiect, cu structuri simulate de resurse umane și conducerea tehnică.
Sarcinile au fost diverse, incluzând navigarea în directoare de fișiere, vizualizări virtuale ale unor spații noi și redactarea evaluărilor de performanță pentru colegii ingineri. La prima vedere, sarcini simple, mai ales pentru modele promise de eficiență și autonomie.
Însă rezultatele au fost departe de a fi impresionante. Cel mai bun „angajat” AI, Claude 3.5 Sonnet de la Anthropic, a reușit să finalizeze doar 24% din sarcini. Chiar și această performanță modestă a avut un cost ridicat, fiecare sarcină necesitând în medie aproape 30 de pași și peste 6 dolari.
Limitările actuale ale inteligenței artificiale
Experimentul a evidențiat mai multe limitări ale agenților AI. În primul rând, aceștia au deficiențe majore în contextul social și operațional. De asemenea, au probleme semnificative în navigarea logică și eficientă pe internet.
O situație amuzantă a fost când un agent AI, neștiind cum să găsească persoana potrivită într-un chat intern, a decis să redenumească un alt utilizator cu numele celui căutat. Această formă de „autoînșelare” a dus la erori și confuzii.
Modelul Google Gemini 2.0 Flash a finalizat doar 11,4% din sarcini, având nevoie de peste 40 de pași pentru fiecare succes. Cel mai slab a fost Nova Pro v1 de la Amazon, care a finalizat un modest 1,7% din sarcini.
Esențial, ceea ce percepem astăzi ca inteligență artificială este o formă evoluată de completare automată, similară cu sugestiile din telefoane, lipsită de capacitatea reală de învățare din experiență sau rezolvare autonomă a problemelor complexe.
Impactul asupra viitorului locurilor de muncă
În ciuda promovării exagerate de către marile companii tehnologice, realitatea indică că AI nu constituie o amenințare imediată pentru majoritatea locurilor de muncă. Deși poate gestiona sarcini repetitive sau bine definite, inteligența artificială actuală se dovedește inadecvată în ceea ce privește adaptabilitatea, creativitatea și raționamentul complex.
Acest experiment oferă o perspectivă liniștitoare: roboții nu sunt încă pregătiți să ia locul oamenilor. AI-ul are deocamdată nevoie de supraveghere umană și nu poate funcționa independent în medii complexe.
Viitorul va aduce îmbunătățiri, însă rezultatele demonstrează că calea spre o adevărată autonomie a inteligenței artificiale este mult mai lungă și plină de provocări decât sugerează industria tehnologică.














