Anthropic i 80% posla: teorija nasuprot realnosti

Anthropic i 80% posla: teorija nasuprot realnostiš· Ā© Tech&Space
- ā LLM-i bi mogli obaviti 80% zadataka u 22 kategorije posla
- ā Studija se oslanja na teorijske, ne dokazane sposobnosti
- ā Tko profitira od ovakvih procjena ā i zaÅ”to to nije neutralno
Anthropicova studija iz 2023. koja tvrdi kako bi veliki jezikovi modeli (LLM-i) mogli obaviti 80% pojedinaÄnih zadataka u 22 kategorije posla zvuÄi impresivno ā dok se ne pogleda Å”to se zapravo mjeri. RijeÄ je o teorijskim sposobnostima, a ne stvarnoj implementaciji, Å”to znaÄi da su brojevi izvuÄeni iz laboratorijskih uvjeta, a ne iz polja gdje AI susreÄe kaos realnih radnih okruženja.
IzvjeÅ”taj GPTs are GPTs, koji je koautorirala i OpenAI, ne analizira postojeÄe alate veÄ anticipirano softversko okruženje ā hipotezu o tome kako bi LLM-i mogli funkcionirati u idealnim uvjetima. To je kljuÄna razlika: dokazano je da modeli mogu simulirati obavljanje zadataka, ali ne i da ih mogu konzistentno, pouzdano i ekonomiÄno izvesti u produkciji.
Dakle, radi se viÅ”e o marketing-adjacentnom istraživanju nego o nepristranoj analizi. Äak i ako pretpostavimo da su procjene toÄne, ostaje pitanje tko od toga ima korist ā i Äije interese studija zapravo služi.
Odgovor nije teÅ”ko pogoditi: tvrtke koje razvijaju LLM-e dobivaju argument za ubrzano uvoÄenje svojih rjeÅ”enja, dok zaposlenici i regulatorni organi ostaju s pitanjima o realnim posljedicama. Razlika izmeÄu teorijske sposobnosti i stvarne izvedbe je poput razlike izmeÄu automobilskog prototipa koji vozi 300 km/h na testnoj stazi i serijskog modela koji mora izdržati svakodnevnu vožnju.
A upravo ta razlika Äesto biva zaboravljena u naslovima koji glase kao da je AI veÄ preuzeo kontrolu nad uredskim stolovima.

IzmeÄu akademskog modela i korporacijskog marketingaš· Ā© Tech&Space
IzmeÄu akademskog modela i korporacijskog marketinga
Zanimljivo je kako studija klasificira poslove prema izloženosti LLM-ima, ali ne uzima u obzir troÅ”kove implementacije, potrebnu prilagodbu postojeÄih sustava ili Äak osnovno pitanje: hoÄe li poslodavci uopÄe htjeti automatizirati 80% zadataka ako to znaÄi gubitak ljudske kontrole nad kljuÄnim procesima. IstraživaÄi s Penn Statea upozoravaju da takve procjene Äesto ignoriraju ljudski faktor ā od otpora zaposlenika do pravnih implikacija kada AI pogreÅ”i.
Dok korporacije poput Anthropica i OpenAI koriste ove studije za lobiranje u korist bržeg usvajanja svojih proizvoda, razvojna zajednica reagira s skepsom. Na GitHubu i Hacker Newsu se pojavljuju komentari o tome kako 80% zvoni kao broj izabran zbog marketinÅ”kog uÄinka, a ne kao rezultat rigorozne metodologije.
Jedan od Äesto spomenutih problema je Å”to studija ne razlikuje izmeÄu automatizacije (gde AI potpuno preuzima zadatak) i augmentacije (gde Äovjek i dalje ima kljuÄnu ulogu). JoÅ” zanimljivije je Å”to izvjeÅ”taj ne spominje koji poslovi bi zapravo nestali, a koji bi se samo transformirali.
To su pitanja koja studija ostavlja nerijeÅ”ena, dok se mediji bace na senzacionalne naslove o AI koji Äe uzeti vaÅ” posao. Pravi test za ove procjene bit Äe kada tvrtke pokuÅ”aju skalirati LLM-e u stvarnim uvjetima ā a tamo ih Äekaju problemi kao Å”to su troÅ”kovi obuke modela za specifiÄne poslove, potreba za ljudskom validacijom i, naravno, otpor sindikata.
KonaÄno, važno je razumjeti da LLM-i nisu joÅ” uvijek spremni za Å”iru uporabu u poslovnim okruženjima. Potrebno je joÅ” istraživanja i razvoja kako bi se rijeÅ”ili problemi povezani s implementacijom i skaliranjem. Do tada, 80% ostaje samo broj koji zvuÄi impresivno, ali nije temeljeno na stvarnosti.