
Fondul Wikimedia a raportat o presiune semnificativă asupra serverelor Wikipedia din cauza activității roboților de antrenare a modelelor de inteligență artificială.
Începând din ianuarie 2024, nevoia de bandă pentru descărcarea conținutului multimedia a crescut cu 50%, generând costuri suplimentare semnificative.
Deși platforma oferă resurse esențiale, volumul de date procesate de roboți nu aduce un beneficiu direct pentru comunitatea Wikimedia.
Impactul roboților asupra infrastructurii Wikimedia
Wikimedia, platformă ce găzduiește Wikipedia și Wikimedia Commons, cu peste 144 de milioane de fișiere media sub licențe libere, se confruntă cu un fenomen crescând de preluare automată de date.
Roboții automatizați, care colectează date pentru modelele de inteligență artificială, accesează intens și rapid resursele Wikimedia. În ciuda contribuției esențiale pentru dezvoltarea AI, acest trafic automat pune la încercare sustenabilitatea platformei.
Problema este evidentă în perioadele de trafic intens. De exemplu, la decesul fostului președinte american Jimmy Carter, în decembrie 2024, pagina Wikipedia a fost vizitată de milioane de utilizatori.
Presiunea reală a apărut din cauza vizionării unui lung film de 1,5 ore de pe Wikimedia Commons. Acest lucru a dublat traficul obișnuit, punând unele conexiuni la încercare.
Surprinzător, o mare parte din banda utilizată a fost deja consumată de roboții de preluare înaintea accesului utilizatorilor, potrivit unor surse.
Soluții pentru echilibrarea accesului
Fondul Wikimedia subliniază că accesul liber la informații nu exclude costurile necesare pentru întreținerea infrastructurii.
Deși multe companii de inteligență artificială se bazează pe informațiile din Wikimedia pentru dezvoltarea modelelor comerciale, ele nu contribuie la susținerea infrastructurii care asigură acest acces liber. Această asimetrie constituie un risc pentru viabilitatea platformelor open-source.
Wikimedia a inițiat WE5, un proiect care promovează o utilizare responsabilă a resurselor.
Acesta încurajează dezvoltatorii să adopte metode de acces mai eficiente, menținând accesibilitatea liberă a informațiilor fără a pune în pericol viabilitatea platformei.
Colaborarea între creatorii de modele AI și furnizorii de resurse este crucială pentru găsirea unor soluții.
Prin API-uri dedicate, finanțarea infrastructurii sau optimizarea accesului, se poate păstra continuitatea fiabilității platformelor esențiale pentru progresul AI.














