Umjetna inteligencijadb#2541

Gemini 3.1 Flash-Lite: Brzina je lažna vijest, ali cijena ne laže

(1d ago)
Mountain View, United States
the-decoder.com
Gemini 3.1 Flash-Lite: Brzina je lažna vijest, ali cijena ne laže

Gemini 3.1 Flash-Lite: Brzina je lažna vijest, ali cijena ne laže📷 © Tech&Space

  • 2.5 puta brži od Gemini 2.5 Flash
  • Cijena izrade weba naglo poskupjela
  • Demo još nije proizvod za tržište

Google DeepMind je u demo-u pokazao kako Gemini 3.1 Flash-Lite generira kompletne web stranice gotovo u realnom vremenu. Brzina od 360 tokena u sekundi zvuči impresivno, ali brojke su uvijek bolje od stvarnosti.

Na papiru, model je 2,5 puta brži od prethodnika Gemini 2.5 Flash, no kako često biva, demo uvijek završava tamo gdje proizvod tek počinje. Iako je Flash-Lite dostupan u Google AI Studiju i Vertex AI-ju od početka ožujka, cijena tokena se udvostručila — od 0,40 na 1,50 dolara po milijunu tokena.

To nije sitnica za developere koji rade na brzom prototipiranju ili dinamičkim UI rješenjima. Tri puta veća cijena znači tri puta manje eksperimenata, i to je pravo usko grlo koje marketing rijetko spominje.

Demo generacije weba u stvarnom vremenu izazvao je znatiželju, ali i skepsu. Iako alat može biti koristan za brzo vizualiziranje ideja, pitanje je koliko je stvarno upotrebljiv izvan kontroliranih uvjeta Googleovog laboratorija.

Što se događa kad se suoči s nepredvidljivim korisničkim unosima, ograničenim resursima ili stvarnim mrežnim uvjetima?

Što Google zapravo prodaje kad obećava 'real-time' performanse

Što Google zapravo prodaje kad obećava 'real-time' performanse📷 © Tech&Space

Što Google zapravo prodaje kad obećava 'real-time' performanse

Gemini 3.1 Flash-Lite nadmašuje veće modele poput Claude Opus 4.6 na nekim multimodalnim zadacima, što je tehnički impresivno, ali i klasičan primjer kako benchmarkovi rijetko reflektiraju stvarnu upotrebu. Sintetički testovi su dizajnirani da pokažu najbolje moguće performanse, dok stvarni korisnici često nailaze na probleme koji u demo-u nikad nisu testirani.

Za sve navedene prednosti, Flash-Lite još uvijek nije alat koji bi mase developera odmah usvojile. Visoka cijena tokena i nedostatak jasnih primjera izvan Googleovog ekosustava stvaraju prepreku za širu adopciju.

To ne znači da je tehnologija beskorisna, nego da je trenutno dostupna samo onima koji imaju budžet za eksperimentiranje s AI-jem. Googleov demo sigurno privlači pažnju, ali pravi signal ovdje nije brzina ili cijena — već činjenica da se i giganti poput Googlea još uvijek bore s jazom između demoa i stvarnog proizvoda.

Što je samo drugi način da se kaže da tehnologija još nije spremna za masovno tržište.

Ovaj članak pokazuje kako inovacije u AI-u često započinju kao obećavajući demo, a završavaju kao komercijalna dilema. Dok Google trubi o brzini, stvarni troškovi i ograničenja govore drukčiju priču.

GeminiReal-time InferenceGoogle AI

//Comments

AIArm’s first solo chip: hype meets hardware realityRoboticsBaidu robotaxis grounded: China’s traffic chaos exposes real-world limitsAIDisney’s $1B AI bet collapses before the first frameMedicineInflammation’s Epigenetic Scars May Linger, Raising Colon Cancer RiskAIMistral’s tiny speech model fits on a watch—so what?MedicineBrain aging’s genetic map: AI hype vs. Alzheimer’s realityAIPorn’s AI Clones Aren’t Immortal—Just Better PackagedMedicine$100M federal bet on joint regeneration—what the trials can (and can’t) proveAIGitHub’s Copilot data grab: opt-out or be trainedMedicineRNA Sequencing UnifiesAIAI’s dirty little secret: secure by default is a mythSpaceEarth Formed From Inner Solar SystemAI$70M for AI code verification—because shipping works, not just generating itSpaceYouTube’s AI cloning tool exposes a deeper problemAIAI traffic now outpaces humans—but who’s really winning?SpaceSmile Mission to X-Ray Earth’s Magnetic ShieldGamingNvidia’s AI art war: Why players are sharpening the pitchforksSpaceGamma Cas’s X-Ray Mystery Solved After 40 YearsTechnologyLeaked iPhone hacking tool exposes Apple’s zero-click blind spotSpaceUK’s AI probe into Microsoft isn’t just about Windows—it’s about controlAIArm’s first solo chip: hype meets hardware realityRoboticsBaidu robotaxis grounded: China’s traffic chaos exposes real-world limitsAIDisney’s $1B AI bet collapses before the first frameMedicineInflammation’s Epigenetic Scars May Linger, Raising Colon Cancer RiskAIMistral’s tiny speech model fits on a watch—so what?MedicineBrain aging’s genetic map: AI hype vs. Alzheimer’s realityAIPorn’s AI Clones Aren’t Immortal—Just Better PackagedMedicine$100M federal bet on joint regeneration—what the trials can (and can’t) proveAIGitHub’s Copilot data grab: opt-out or be trainedMedicineRNA Sequencing UnifiesAIAI’s dirty little secret: secure by default is a mythSpaceEarth Formed From Inner Solar SystemAI$70M for AI code verification—because shipping works, not just generating itSpaceYouTube’s AI cloning tool exposes a deeper problemAIAI traffic now outpaces humans—but who’s really winning?SpaceSmile Mission to X-Ray Earth’s Magnetic ShieldGamingNvidia’s AI art war: Why players are sharpening the pitchforksSpaceGamma Cas’s X-Ray Mystery Solved After 40 YearsTechnologyLeaked iPhone hacking tool exposes Apple’s zero-click blind spotSpaceUK’s AI probe into Microsoft isn’t just about Windows—it’s about control
⊞ Foto Review