AlphaEvolve: Kada AI sam piše bolje algoritme od ljudi

AlphaEvolve: Kada AI sam piše bolje algoritme od ljudi📷 © Tech&Space
- ★Google DeepMind automatizira dizajn MARL algoritama
- ★Testirano na pokeru i Goofspielu, pobjeđuje ljudske eksperte
- ★Otvaraju se pitanja o budućnosti ručne optimizacije
Google DeepMind predstavio je AlphaEvolve, sustav koji koristi velik jezik model (LLM) da sam evoluira i optimizira algoritme za Multi-Agent Reinforcement Learning (MARL) u igrama s nepotpunim informacijama. Umjesto tradicionalnog ručnog podešavanja težinskih shema i pravila diskontiranja, AlphaEvolve završava cijeli proces putem automatske evolucijske pretrage.
Rezultati su jasni: sustav ne samo da je izjednačio, već je i nadmašio ljudske eksperte u dizajnu algoritama za Counterfactual Regret Minimization (CFR) i Policy Space Response Oracles (PSRO). Istraživači su testirali AlphaEvolve na nekoliko klasičnih igara, uključujući 3-player Kuhn poker, 2-player Leduc poker, 4-card Goofspiel i 5-sided Liars Dice.
Svaka od tih igara predstavlja različite izazove za MARL algoritme, a AlphaEvolve je uspješno pronašao nove varijante algoritama koje su se pokazale superiornima u odnosu na ručno dizajnirane baselineove. Ključna novost ovdje nije samo performansa, već činjenica da je AI preuzeo kreativnu ulogu koja je do sada bila rezervirana za ljudske stručnjake.
Ovaj pristup ne samo da ubrzava proces razvoja algoritama, već potencijalno otvara vrata za sve veću autonomiju AI sustava u istraživanju.

Što se zapravo dogodilo kad je LLM preuzeo kontrolu nad igrom teorijom📷 © Tech&Space
Što se zapravo dogodilo kad je LLM preuzeo kontrolu nad igrom teorijom
Međutim, kao i kod svakog napretka u AI-u, važno je postaviti pitanje: koliko je ovo zapravo novo, a koliko je samo dobro upakirano? AlphaEvolve ne otkriva fundamentalno nove principe u teoriji igara – on jednostavno automatizira ono što su ljudi već radili godinama.
Razlika je u brzini i preciznosti. Dok ljudski eksperti mogu provesti tjedne ili mjesece podešavajući algoritme, AlphaEvolve to radi u nekoliko iteracija.
Ipak, vrijedi napomenuti da se eksperimenti odvijaju u kontroliranim okruženjima poput OpenSpiel frameworka. To znači da još uvijek nema dokaza kako bi se AlphaEvolve ponašao u stvarnim, nepredvidivim scenarijima koji nisu dio igara s jasnim pravilima.
Od industrijske perspektive, Google DeepMind ovime potvrđuje svoju prednost u kombiniranju LLM tehnologije s konkretnim istraživačkim problemima. Dok konkurentski laboratoriji još uvijek eksperimentiraju s osnovnim primjenama LLM-a, DeepMind je već prešao na praktične primjene.
Ako AlphaEvolve može optimizirati algoritme za poker, čemu još može biti dorastao? I što to znači za budućnost istraživanja u domenama gdje ljudska intuicija i dalje igra ključnu ulogu? Ovo je samo početak istraživanja u ovom području, a rezultati će sigurno biti zanimljivi.