AI ne može 96% poslova – tko očekivao drugačije?

AI ne može 96% poslova – tko očekivao drugačije?📷 © Tech&Space
- ★96% zadaća AI ne rješava bolje od ljudi
- ★Benchmark vs. stvarni posao: jaz od 96%
- ★Tko profitira od AI hypea – a tko gubi
Kad se studija objavljena na RemoteLabor.ai pojavila s podacima da AI ne uspijeva u 96% testiranih poslova, prvotna reakcija je bila: Pa naravno. Ne zato što je AI beskoristan – već zato što je većina 'AI revolucija' do sada bila pakiranje postojećih alata u sjajne prezentacije. Ovaj put, međutim, imamo direktnu usporedbu: ljude vs. AI na plaćenim zadacima iz stvarnog svijeta. Ne radi se o sintetičkim benchmarkovima, nego o poslovima kao što su pisanje kodova, analiza podataka ili čak jednostavni administrativni zadaci. Ironično, upravo ta 96% postaje zanimljivija od samog broja. Jer ako pogledamo što AI jesu uspjeli riješiti, radi se uglavnom o visoko struktuiranim, ponavljajućim zadacima – onim za koje već godinama znamo da ih algoritmi mogu automatizirati. Prema dostupnim informacijama, čak i tamo gdje je AI 'uspio', ljudska intervencija je bila potrebna u 87% slučajeva da se ispravi greška ili dopuni kontekst. Drugim riječima, ne radi se o 'zamjeni', nego o skupom nadziranju mašina koje i dalje zahtijevaju ljudski rad. Ovdje je ključno pitanje: tko zapravo gubi na ovoj priči? Ne radi se toliko o AI-ju, koliko o kompanijama koje prodaju 'automatizaciju' kao rješenje za sve – dok u stvarnosti prebacuju troškove na korisnike koji moraju popravljati AI-ove pogreške. Čak i Matt Ferrell u svojoj analizi ističe kako je realni ROI (povrat ulaganja) za većinu tvrtki koje uvođe AI još uvijek negativan kada se uzmu u obzir skriveni troškovi obuke, nadzora i ispravljanja.

Stvarni rezultati nasuprot marketinškom prikazu📷 © Tech&Space
Stvarni rezultati nasuprot marketinškom prikazu
Pravi signal ovdje nije da AI 'ne radi' – već da tržište prebrzo vjeruje marketinškim obećanjima o 'autonomnim agentima' koji će 'preuzeti posao'. Dok god ne vidimo nepristrane studije (a ne one koje financiraju isti igrači koji prodaju AI rješenja), ostajemo u sivi zoni između demo verzije i stvarne implementacije. Ako pogledamo ko profitira od ove priče, jasno je da velike cloud platforme (AWS, Azure, Google Cloud) imaju najviše interesa održavati narativ o 'neizbježnoj AI transformaciji' – jer im to donosi milijarde na infrastrukturi za treniranje modela. S druge strane, startupi koji prodaju 'AI-as-a-service' suočeni su s sve većim pritiskom da dokazuju stvarnu učinkovitost, a ne samo 'potencijal'. Developer community već reagira: raste broj open-source alata koji dekonstruiraju komercijalne modele i pokazuju njihove slabosti u realnim scenarijima. Zanimljivo je kako ova studija ne spominje koji su točno modeli testirani. Da li radi o najnovijim LLM-ovima ili o starijim verzijama? Koliko je konteksta bilo dostupno? Bez tih podataka, 96% ostaje zanimljiva, ali nepotpuna slika. Što je, međutim, sigurno: jaz između benchmarka i proizvodne upotrebe je i dalje ogroman. Kompanije koje očekuju da će AI 'smanjiti troškove' često zaboravljaju da ljudska intervencija i dalje čini 70-90% 'automatiziranog' procesa.
Konačno, ova studija pokazuje da je još uvijek potrebno mnogo istraživanja i razvoja da bi se AI tehnologije mogle koristiti na efektivan način. Potrebno je više transparentnosti i objektivnosti u evaluaciji AI tehnologija, kao i bolja razumljivost njihovih ograničenja i mogućnosti. Tek tako možemo očekivati da ćemo doći do stvarnih inovacija i poboljšanja u području AI-a.