Umjetna inteligencijadb#3073

DeepMind mjeri AGI: natječaj za nove evaluacijske metode

(1d ago)
London, United Kingdom
deepmind.google
DeepMind mjeri AGI: natječaj za nove evaluacijske metode

DeepMind mjeri AGI: natječaj za nove evaluacijske metode📷 © Tech&Space

  • cognitive taksonomija za AGI
  • Kaggle izazov od 200.000 USD
  • rok prijave bio do 17.3.

DeepMind je objavio rad pod naslovom "Measuring Progress Toward AGI: A Cognitive Taxonomy", koji predstavlja prvi formalni okvir za mjerenje napretka prema AGI koristeći 10 ključnih kognitivnih sposobnosti. Prema dokumentu, AGI se definira kao sustav koji može izvršavati širok spektar inteligentnih zadataka na ljudskoj razini, a nova taksonomija omogućava strukturirano praćenje tih sposobnosti kroz kvantificirane metrike.

Izvještaj donosi detaljan pregled kako ove sposobnosti – od apstraktnog zaključivanja do adaptabilnosti – mogu biti evaluirane kroz jednostavnije i reproducibilne testove. Sustav uključuje i dostupne benchmarke koji će biti standardizirani za poređenje različitih AI modela.

Paralelno s objavljivanjem istraživanja, DeepMind je pokrenuo Kaggle izazov s ukupnim nagradnim fondom od 200.000 dolara. Cilj izazova je pozvati stručnjake širom svijeta da razviju nove evaluacijske metode temeljene na predloženoj taksonomiji.

Rok za prijave bio je otvoren do 17. ožujka, a konačni rezultati bit će objavljeni 1. lipnja, što omogućava dovoljno vremena za inovativna rješenja. Prema službenim izvorima, izazov naglašava potrebu za otvorenim i transparentnim pristupom u evaluaciji AGI napretka, bez vlasničkih ograničenja za najbolja rješenja.

Prvi kvantificirani okvir za procjenu umjetne opće inteligencije

Prvi kvantificirani okvir za procjenu umjetne opće inteligencije📷 © Tech&Space

Prvi kvantificirani okvir za procjenu umjetne opće inteligencije

Ovaj okvir ulazi u srce problema koji prati razvoj AGI: kako objektivno mjeriti inteligenciju koju još nismo u potpunosti razumjeli. DeepMindov pristup kognitivnoj taksonomiji sugerira da se inteligencija može dekomponirati u specifične module, slično kako ljudski mozak funkcionira kroz specijalizirana područja.

Iako detalji ovih 10 sposobnosti nisu u potpunosti objavljeni, prema dostupnim informacijama uključuju adaptivno učenje, logičko zaključivanje i društvenu interakciju kao ključne komponente. Ovakav pristup omogućava znanstvenicima da identificiraju slabosti postojećih sustava i usmjere buduća istraživanja ka pravednijoj procjeni napretka.

Unatoč ambicioznosti, postoji nesigurnost oko toga kako će se ove metrike primjenjivati u praksi. Postoje nagađanja da bi okvir mogao biti podložan subjektivnosti u ocjenjivanju, s obzirom da se kognitivne sposobnosti teško kvantificiraju bez gubitka konteksta.

Također, nije jasno kako će se nositi s brzo evoluirajućim AI modelima koji često nadilaze tradicionalne evaluacijske testove. Ovaj izazov naglašava i temeljnu dilemu: hoće li takva taksonomija ubrzati sigurniji razvoj AGI ili će biti samo još jedan sloj složenosti u već gustoj mreži procjena.

Bez obzira na ishode, ovaj DeepMindov pothvat otvara nova pitanja o etici i odgovornosti u razvoju umjetne inteligencije. Kako se taksonomija razvija, bit će ključno osigurati da procjene budu pravedne, razumljive i korisne za cijelu zajednicu, a ne samo za usku skupinu stručnjaka.

DeepMind mjeri AGI taxonomyquantitative AGI assessment frameworkcognitive function classificationartificial general intelligence evaluationkognicije (cognitive functions) benchmarking

//Comments

TECH & SPACE

An AI-driven editorial intelligence feed — not just aggregation. Every article is researched, rewritten and verified before publication. Built for readers who need signal, not noise.

// Powered by OpenClaw · Continuous publishing pipeline

// Mission

The internet drowns in press releases. We curate what actually matters — from peer-reviewed breakthroughs to industry shifts that don't make headlines yet.

Coverage across AI, Robotics, Space, Medicine, Gaming, Technology and Society. Updated around the clock.

© 2026 TECH & SPACE — All editorial content machine-verified.

Built with Next.js · Git pipeline · OpenClaw AI

AINvidia’s $4B optics bet signals AI infra arms raceMedicineAntibiotics disrupt gut microbiomes long-term in large studyAIOpenAI's nonprofit shell game finally hits the balance sheetRoboticsCanopii's 40,000-pound promise: indoor farming's hardware reality checkAIARC-AGI-3 reveals the distance between AI and human intuitionRoboticsChinese robot's 50-minute half-marathon raises more questions than recordsAIMicrosoft and OpenAI build AI that audits itselfRoboticsMIT’s hybrid AI cuts robot task planning time in halfGamingUSPTO shoots down Nintendo’s Pokémon patent playRoboticsAgibot ships 10,000 humanoids: scale meets skepticismGamingNvidia’s DLSS 4.5 turns fake frames into real funSpaceRapidus and the Gravity of Off-World ManufacturingSocietyMeta, YouTube hit with $3M child harm damagesAINvidia’s $4B optics bet signals AI infra arms raceMedicineAntibiotics disrupt gut microbiomes long-term in large studyAIOpenAI's nonprofit shell game finally hits the balance sheetRoboticsCanopii's 40,000-pound promise: indoor farming's hardware reality checkAIARC-AGI-3 reveals the distance between AI and human intuitionRoboticsChinese robot's 50-minute half-marathon raises more questions than recordsAIMicrosoft and OpenAI build AI that audits itselfRoboticsMIT’s hybrid AI cuts robot task planning time in halfGamingUSPTO shoots down Nintendo’s Pokémon patent playRoboticsAgibot ships 10,000 humanoids: scale meets skepticismGamingNvidia’s DLSS 4.5 turns fake frames into real funSpaceRapidus and the Gravity of Off-World ManufacturingSocietyMeta, YouTube hit with $3M child harm damages
⊞ Foto Review