Umjetna inteligencijadb#1400

AlphaEvolve: Kada AI sam piše bolje algoritme od ljudi

(1w ago)
London, United Kingdom
marktechpost.com
AlphaEvolve: Kada AI sam piše bolje algoritme od ljudi

AlphaEvolve: Kada AI sam piše bolje algoritme od ljudi📷 © Tech&Space

  • Google DeepMind automatizira dizajn MARL algoritama
  • Testirano na pokeru i Goofspielu, pobjeđuje ljudske eksperte
  • Otvaraju se pitanja o budućnosti ručne optimizacije

Google DeepMind predstavio je AlphaEvolve, sustav koji koristi velik jezik model (LLM) da sam evoluira i optimizira algoritme za Multi-Agent Reinforcement Learning (MARL) u igrama s nepotpunim informacijama. Umjesto tradicionalnog ručnog podešavanja težinskih shema i pravila diskontiranja, AlphaEvolve završava cijeli proces putem automatske evolucijske pretrage.

Rezultati su jasni: sustav ne samo da je izjednačio, već je i nadmašio ljudske eksperte u dizajnu algoritama za Counterfactual Regret Minimization (CFR) i Policy Space Response Oracles (PSRO). Istraživači su testirali AlphaEvolve na nekoliko klasičnih igara, uključujući 3-player Kuhn poker, 2-player Leduc poker, 4-card Goofspiel i 5-sided Liars Dice.

Svaka od tih igara predstavlja različite izazove za MARL algoritme, a AlphaEvolve je uspješno pronašao nove varijante algoritama koje su se pokazale superiornima u odnosu na ručno dizajnirane baselineove. Ključna novost ovdje nije samo performansa, već činjenica da je AI preuzeo kreativnu ulogu koja je do sada bila rezervirana za ljudske stručnjake.

Ovaj pristup ne samo da ubrzava proces razvoja algoritama, već potencijalno otvara vrata za sve veću autonomiju AI sustava u istraživanju.

Što se zapravo dogodilo kad je LLM preuzeo kontrolu nad igrom teorijom

Što se zapravo dogodilo kad je LLM preuzeo kontrolu nad igrom teorijom📷 © Tech&Space

Što se zapravo dogodilo kad je LLM preuzeo kontrolu nad igrom teorijom

Međutim, kao i kod svakog napretka u AI-u, važno je postaviti pitanje: koliko je ovo zapravo novo, a koliko je samo dobro upakirano? AlphaEvolve ne otkriva fundamentalno nove principe u teoriji igara – on jednostavno automatizira ono što su ljudi već radili godinama.

Razlika je u brzini i preciznosti. Dok ljudski eksperti mogu provesti tjedne ili mjesece podešavajući algoritme, AlphaEvolve to radi u nekoliko iteracija.

Ipak, vrijedi napomenuti da se eksperimenti odvijaju u kontroliranim okruženjima poput OpenSpiel frameworka. To znači da još uvijek nema dokaza kako bi se AlphaEvolve ponašao u stvarnim, nepredvidivim scenarijima koji nisu dio igara s jasnim pravilima.

Od industrijske perspektive, Google DeepMind ovime potvrđuje svoju prednost u kombiniranju LLM tehnologije s konkretnim istraživačkim problemima. Dok konkurentski laboratoriji još uvijek eksperimentiraju s osnovnim primjenama LLM-a, DeepMind je već prešao na praktične primjene.

Ako AlphaEvolve može optimizirati algoritme za poker, čemu još može biti dorastao? I što to znači za budućnost istraživanja u domenama gdje ljudska intuicija i dalje igra ključnu ulogu? Ovo je samo početak istraživanja u ovom području, a rezultati će sigurno biti zanimljivi.

AlphaEvolveLLMAI Algorithm Development

//Comments

MedicineMuscles Turned MotorsSpaceArtemis 2 LaunchesMedicineInflammation’s Epigenetic Scars May Linger, Raising Colon Cancer RiskSpaceEarth Formed From Inner Solar SystemMedicineBrain aging’s genetic map: AI hype vs. Alzheimer’s realitySpaceYouTube’s AI cloning tool exposes a deeper problemMedicine$100M federal bet on joint regeneration—what the trials can (and can’t) proveSpaceSmile Mission to X-Ray Earth’s Magnetic ShieldMedicineRNA Sequencing UnifiesAIGemini 3.1 Flash-Lite UnveiledRoboticsBaidu robotaxis grounded: China’s traffic chaos exposes real-world limitsAIArm’s first solo chip: hype meets hardware realityGamingNvidia’s AI art war: Why players are sharpening the pitchforksAIDisney’s $1B AI bet collapses before the first frameTechnologyLeaked iPhone hacking tool exposes Apple’s zero-click blind spotAIMistral’s tiny speech model fits on a watch—so what?AIPorn’s AI Clones Aren’t Immortal—Just Better PackagedAIGitHub’s Copilot data grab: opt-out or be trainedAIAI’s dirty little secret: secure by default is a mythAI$70M for AI code verification—because shipping works, not just generating itMedicineMuscles Turned MotorsSpaceArtemis 2 LaunchesMedicineInflammation’s Epigenetic Scars May Linger, Raising Colon Cancer RiskSpaceEarth Formed From Inner Solar SystemMedicineBrain aging’s genetic map: AI hype vs. Alzheimer’s realitySpaceYouTube’s AI cloning tool exposes a deeper problemMedicine$100M federal bet on joint regeneration—what the trials can (and can’t) proveSpaceSmile Mission to X-Ray Earth’s Magnetic ShieldMedicineRNA Sequencing UnifiesAIGemini 3.1 Flash-Lite UnveiledRoboticsBaidu robotaxis grounded: China’s traffic chaos exposes real-world limitsAIArm’s first solo chip: hype meets hardware realityGamingNvidia’s AI art war: Why players are sharpening the pitchforksAIDisney’s $1B AI bet collapses before the first frameTechnologyLeaked iPhone hacking tool exposes Apple’s zero-click blind spotAIMistral’s tiny speech model fits on a watch—so what?AIPorn’s AI Clones Aren’t Immortal—Just Better PackagedAIGitHub’s Copilot data grab: opt-out or be trainedAIAI’s dirty little secret: secure by default is a mythAI$70M for AI code verification—because shipping works, not just generating it
⊞ Foto Review