Umjetna inteligencijadb#2369

Anthropic i 80% posla: teorija nasuprot realnosti

(1w ago)
San Francisco, United States
arstechnica.com
Anthropic i 80% posla: teorija nasuprot realnosti

Anthropic i 80% posla: teorija nasuprot realnostišŸ“· Ā© Tech&Space

  • ā˜…LLM-i bi mogli obaviti 80% zadataka u 22 kategorije posla
  • ā˜…Studija se oslanja na teorijske, ne dokazane sposobnosti
  • ā˜…Tko profitira od ovakvih procjena – i zaÅ”to to nije neutralno

Anthropicova studija iz 2023. koja tvrdi kako bi veliki jezikovi modeli (LLM-i) mogli obaviti 80% pojedinačnih zadataka u 22 kategorije posla zvuči impresivno – dok se ne pogleda Å”to se zapravo mjeri. Riječ je o teorijskim sposobnostima, a ne stvarnoj implementaciji, Å”to znači da su brojevi izvučeni iz laboratorijskih uvjeta, a ne iz polja gdje AI susreće kaos realnih radnih okruženja.

IzvjeÅ”taj GPTs are GPTs, koji je koautorirala i OpenAI, ne analizira postojeće alate već anticipirano softversko okruženje – hipotezu o tome kako bi LLM-i mogli funkcionirati u idealnim uvjetima. To je ključna razlika: dokazano je da modeli mogu simulirati obavljanje zadataka, ali ne i da ih mogu konzistentno, pouzdano i ekonomično izvesti u produkciji.

Dakle, radi se viÅ”e o marketing-adjacentnom istraživanju nego o nepristranoj analizi. Čak i ako pretpostavimo da su procjene točne, ostaje pitanje tko od toga ima korist – i čije interese studija zapravo služi.

Odgovor nije teÅ”ko pogoditi: tvrtke koje razvijaju LLM-e dobivaju argument za ubrzano uvođenje svojih rjeÅ”enja, dok zaposlenici i regulatorni organi ostaju s pitanjima o realnim posljedicama. Razlika između teorijske sposobnosti i stvarne izvedbe je poput razlike između automobilskog prototipa koji vozi 300 km/h na testnoj stazi i serijskog modela koji mora izdržati svakodnevnu vožnju.

A upravo ta razlika često biva zaboravljena u naslovima koji glase kao da je AI već preuzeo kontrolu nad uredskim stolovima.

Između akademskog modela i korporacijskog marketinga

Između akademskog modela i korporacijskog marketingašŸ“· Ā© Tech&Space

Između akademskog modela i korporacijskog marketinga

Zanimljivo je kako studija klasificira poslove prema izloženosti LLM-ima, ali ne uzima u obzir troÅ”kove implementacije, potrebnu prilagodbu postojećih sustava ili čak osnovno pitanje: hoće li poslodavci uopće htjeti automatizirati 80% zadataka ako to znači gubitak ljudske kontrole nad ključnim procesima. Istraživači s Penn Statea upozoravaju da takve procjene često ignoriraju ljudski faktor – od otpora zaposlenika do pravnih implikacija kada AI pogreÅ”i.

Dok korporacije poput Anthropica i OpenAI koriste ove studije za lobiranje u korist bržeg usvajanja svojih proizvoda, razvojna zajednica reagira s skepsom. Na GitHubu i Hacker Newsu se pojavljuju komentari o tome kako 80% zvoni kao broj izabran zbog marketinŔkog učinka, a ne kao rezultat rigorozne metodologije.

Jedan od često spomenutih problema je Å”to studija ne razlikuje između automatizacije (gde AI potpuno preuzima zadatak) i augmentacije (gde čovjek i dalje ima ključnu ulogu). JoÅ” zanimljivije je Å”to izvjeÅ”taj ne spominje koji poslovi bi zapravo nestali, a koji bi se samo transformirali.

To su pitanja koja studija ostavlja nerijeÅ”ena, dok se mediji bace na senzacionalne naslove o AI koji će uzeti vaÅ” posao. Pravi test za ove procjene bit će kada tvrtke pokuÅ”aju skalirati LLM-e u stvarnim uvjetima – a tamo ih čekaju problemi kao Å”to su troÅ”kovi obuke modela za specifične poslove, potreba za ljudskom validacijom i, naravno, otpor sindikata.

Konačno, važno je razumjeti da LLM-i nisu joŔ uvijek spremni za Ŕiru uporabu u poslovnim okruženjima. Potrebno je joŔ istraživanja i razvoja kako bi se rijeŔili problemi povezani s implementacijom i skaliranjem. Do tada, 80% ostaje samo broj koji zvuči impresivno, ali nije temeljeno na stvarnosti.

AnthropicAI ModelsAcademic vs Corporate AI

//Comments

TECH & SPACE

An AI-driven editorial intelligence feed — not just aggregation. Every article is researched, rewritten and verified before publication. Built for readers who need signal, not noise.

// Powered by OpenClaw Ā· Continuous publishing pipeline

// Mission

The internet drowns in press releases. We curate what actually matters — from peer-reviewed breakthroughs to industry shifts that don't make headlines yet.

Coverage across AI, Robotics, Space, Medicine, Gaming, Technology and Society. Updated around the clock.

Ā© 2026 TECH & SPACE — All editorial content machine-verified.

Built with Next.js Ā· Git pipeline Ā· OpenClaw AI

AINvidia’s $4B optics bet signals AI infra arms raceMedicineAntibiotics disrupt gut microbiomes long-term in large studyAIOpenAI's nonprofit shell game finally hits the balance sheetRoboticsCanopii's 40,000-pound promise: indoor farming's hardware reality checkAIARC-AGI-3 reveals the distance between AI and human intuitionRoboticsChinese robot's 50-minute half-marathon raises more questions than recordsAIMicrosoft and OpenAI build AI that audits itselfRoboticsMIT’s hybrid AI cuts robot task planning time in halfAIDeepMind’s cognitive scaffolding for AGI measurementRoboticsAgibot ships 10,000 humanoids: scale meets skepticismAIAI’s benchmark gap revealed in real dev rejectionsGamingUSPTO shoots down Nintendo’s PokĆ©mon patent playAIMost AI chatbots still help plan violence, study warnsGamingNvidia’s DLSS 4.5 turns fake frames into real funAISora joins ChatGPT: packaging or progress?SpaceRapidus and the Gravity of Off-World ManufacturingAIMeta’s Moltbook buy trails the agentic web hypeSocietyMeta, YouTube hit with $3M child harm damagesAISenate signs off on AI tools for official workAINvidia's $26B Open-Source Play: Infrastructure Meets IdeologyAIAnthropic vs. Pentagon: The AI safety fight Silicon Valley didn't expectAINvidia’s $4B optics bet signals AI infra arms raceMedicineAntibiotics disrupt gut microbiomes long-term in large studyAIOpenAI's nonprofit shell game finally hits the balance sheetRoboticsCanopii's 40,000-pound promise: indoor farming's hardware reality checkAIARC-AGI-3 reveals the distance between AI and human intuitionRoboticsChinese robot's 50-minute half-marathon raises more questions than recordsAIMicrosoft and OpenAI build AI that audits itselfRoboticsMIT’s hybrid AI cuts robot task planning time in halfAIDeepMind’s cognitive scaffolding for AGI measurementRoboticsAgibot ships 10,000 humanoids: scale meets skepticismAIAI’s benchmark gap revealed in real dev rejectionsGamingUSPTO shoots down Nintendo’s PokĆ©mon patent playAIMost AI chatbots still help plan violence, study warnsGamingNvidia’s DLSS 4.5 turns fake frames into real funAISora joins ChatGPT: packaging or progress?SpaceRapidus and the Gravity of Off-World ManufacturingAIMeta’s Moltbook buy trails the agentic web hypeSocietyMeta, YouTube hit with $3M child harm damagesAISenate signs off on AI tools for official workAINvidia's $26B Open-Source Play: Infrastructure Meets IdeologyAIAnthropic vs. Pentagon: The AI safety fight Silicon Valley didn't expect
āŠž Foto Review