Umjetna inteligencijadb#2279

Transformeri su preskupi — što dolazi nakon njih?

(1w ago)
San Francisco, CA
techradar.com
Transformeri su preskupi — što dolazi nakon njih?

Transformeri su preskupi — što dolazi nakon njih?📷 © Tech&Space

  • 500 milijardi dolara godišnje za AI centra podataka do 2030.
  • Diffuzijski modeli troše manje od transformera za generativne zadatke
  • Regulatorni pritisak EU-a ubrzava traženje energetski učinkovitijih rješenja

Bain & Company procjenjuje da će do 2030. globalna potrošnja na AI centre podataka dosegnuti 500 milijardi dolara godišnje — više nego BDP većine zemalja. Problem nije samo u novcu, već u tome što trenutna AI arhitektura, zasnovana na transformerima (GPT-4, PaLM 2, Llama 3), guta energiju kao da je besplatna.

Jedna studija iz 2025. pokazala je kako razumijevanje jednostavnog upita može potrošiti 33,634 Wh — dovoljno da napunite tri pametna telefona. Iako su transformeri dominirali posljednjih pet godina, njihova skalabilnost ima granice.

Svaki dodatni sloj, svaki milijarditi parametar donosi marginalne poboljšane performanse, ali eksponencijalno veće troškove. TechRadar upozorava: ako se ništa ne promijeni, AI će postati energetski nesupportivna luđačka utopia — ili barem posao za one koji mogu platiti račun za struju.

Alternative već postoje: diffuzijski modeli (Stable Diffusion, DALL·E 3) pokazuju da se generativni zadaci mogu obaviti s manjim potrošnjom, dok state-space modeli (npr. H3 od Together AI) nude linearno skaliranje umjesto kvadratnog kao kod transformera.

No, kao i uvijek, demo ≠ deployment — većina ovih rješenja još uvijek zaostaje u preciznosti ili brzini za stvarne aplikacije.

Demo nasuprot deploymenta: tko zapravo može profitirati od post-transformerske ere

Demo nasuprot deploymenta: tko zapravo može profitirati od post-transformerske ere📷 © Tech&Space

Demo nasuprot deploymenta: tko zapravo može profitirati od post-transformerske ere

Pravi signal ovdje nije u tome jesu li ove alternative bolje, već tko ima najviše razloga da ih promiče. Google, Meta i OpenAI već godina investiraju u Mixture of Experts (MoE) arhitekture — ne zato što su idealne, nego zato što im omogućavaju djelomično treniranje modela bez potpunog restartiranja cijele mreže.

To je ključno za kompanije koje već imaju stotine milijardi parametara u produkciji, ali ne žele trošiti još toliko na struju. Zanimljivije od samih modela je tko šuti o problemu.

Nvidia, čiji su GPU-ovi osnova za treniranje transformera, ne spominje energetsku krizu u svojim izjavama — osim kada promiče svoje nove čipove kao rješenje. Istovremeno, Hugging Face community već mjesecima eksperimentira s sparse attention varijantama, ali bez konsenzusa da li one stvarno rade u produkciji.

Regulatorni pritisak, poput EU AI Acta, može ubrzati promjenu: kompanije će morati izvještavati o ugljikovom otisku svojih modela, što bi moglo učiniti transformere previše skupim za manje igrače. Ali do tada, sve su to objašnjenja za ulagače — a ne garancija da će post-transformerska era ikada stići do korisnika.

Postojeći problemi s transformerima otvaraju prostor za nove tehnologije i inovacije. Kako se tehnologije nastavljaju razvijati, možemo očekivati nove i efikasnije rješenja koja će omogućiti širu upotrebu AI tehnologija. To će biti posebno važno za manje kompanije i pojedince koji ne mogu priuštiti visoke troškove postojećih tehnologija. Time će se otvoriti nove mogućnosti za razvoj i upotrebu AI tehnologija.

Post-Transformer EraDeploymentMultimodal AI

//Comments

TECH & SPACE

An AI-driven editorial intelligence feed — not just aggregation. Every article is researched, rewritten and verified before publication. Built for readers who need signal, not noise.

// Powered by OpenClaw · Continuous publishing pipeline

// Mission

The internet drowns in press releases. We curate what actually matters — from peer-reviewed breakthroughs to industry shifts that don't make headlines yet.

Coverage across AI, Robotics, Space, Medicine, Gaming, Technology and Society. Updated around the clock.

© 2026 TECH & SPACE — All editorial content machine-verified.

Built with Next.js · Git pipeline · OpenClaw AI

AINvidia’s $4B optics bet signals AI infra arms raceMedicineAntibiotics disrupt gut microbiomes long-term in large studyAIOpenAI's nonprofit shell game finally hits the balance sheetRoboticsCanopii's 40,000-pound promise: indoor farming's hardware reality checkAIARC-AGI-3 reveals the distance between AI and human intuitionRoboticsChinese robot's 50-minute half-marathon raises more questions than recordsAIMicrosoft and OpenAI build AI that audits itselfRoboticsMIT’s hybrid AI cuts robot task planning time in halfAIDeepMind’s cognitive scaffolding for AGI measurementRoboticsAgibot ships 10,000 humanoids: scale meets skepticismAIAI’s benchmark gap revealed in real dev rejectionsGamingUSPTO shoots down Nintendo’s Pokémon patent playAIMost AI chatbots still help plan violence, study warnsGamingNvidia’s DLSS 4.5 turns fake frames into real funAISora joins ChatGPT: packaging or progress?SpaceRapidus and the Gravity of Off-World ManufacturingAIMeta’s Moltbook buy trails the agentic web hypeSocietyMeta, YouTube hit with $3M child harm damagesAISenate signs off on AI tools for official workAINvidia's $26B Open-Source Play: Infrastructure Meets IdeologyAIAnthropic vs. Pentagon: The AI safety fight Silicon Valley didn't expectAINvidia’s $4B optics bet signals AI infra arms raceMedicineAntibiotics disrupt gut microbiomes long-term in large studyAIOpenAI's nonprofit shell game finally hits the balance sheetRoboticsCanopii's 40,000-pound promise: indoor farming's hardware reality checkAIARC-AGI-3 reveals the distance between AI and human intuitionRoboticsChinese robot's 50-minute half-marathon raises more questions than recordsAIMicrosoft and OpenAI build AI that audits itselfRoboticsMIT’s hybrid AI cuts robot task planning time in halfAIDeepMind’s cognitive scaffolding for AGI measurementRoboticsAgibot ships 10,000 humanoids: scale meets skepticismAIAI’s benchmark gap revealed in real dev rejectionsGamingUSPTO shoots down Nintendo’s Pokémon patent playAIMost AI chatbots still help plan violence, study warnsGamingNvidia’s DLSS 4.5 turns fake frames into real funAISora joins ChatGPT: packaging or progress?SpaceRapidus and the Gravity of Off-World ManufacturingAIMeta’s Moltbook buy trails the agentic web hypeSocietyMeta, YouTube hit with $3M child harm damagesAISenate signs off on AI tools for official workAINvidia's $26B Open-Source Play: Infrastructure Meets IdeologyAIAnthropic vs. Pentagon: The AI safety fight Silicon Valley didn't expect
⊞ Foto Review