Nvidijin Vera Rubin: nova modularna galaksija za AI

Nvidijin Vera Rubin: nova modularna galaksija za AI📷 © Tech&Space
- ★7 čipova u punoj proizvodnji za Vera Rubin
- ★40 ormara s 60 ekzaflopsa AI performanse
- ★PrviArm-centrirani CPU Nvidije
Prošlog tjedna na GTC-u 2026 predstavljena je Vera Rubin platforma s 7 Nvidijinih čipova u punoj proizvodnji. Platforma se sastoji od Rubin GPU-a na 3nm TSMC procesu s 336 milijardi tranzistora i 288 GB HBM4 memorije, Rubin CPU-a s 88 Armovih jezgara i 1,5 TB LPDDR5X memorije, te Groq 3 LPU-a za inference niske latencije.
Ukupno se u jednom ormaru nalazi oko 1,5 ekzaflopsa, a 40-ormarna konfiguracija doseže 60 ekzaflopsa. Ključna promjena je u modularnosti: Vera Rubin nije samo novi GPU već cjelokupna arhitektura od pet tipova ormara koji zajedno rade kao koherentni sustav.
Ovo nije samo rebrandiranje već pomak u načinu skaliranja — umjesto zasebnih GPU-a, Nvidija sada računa u cijelim ormarima ili POD-ovima koji se samostalno dizajniraju za različite faze AI pipelinea, od treninga do inferenca. Čini se da je Nvidija konačno shvatila kako je AI infrastruktura postala predmetom ekonomije mjerila — gdje performanse ne ovise više o pojedinačnim čipovima već o cijelim arhitekturama.

Promjena jedinice računanja s GPU na ormar📷 © Tech&Space
Promjena jedinice računanja s GPU na ormar
Rani signali sugeriraju da je nova platforma optimizirana za velike cloud provajdere i istraživačke centre koji trebaju više od 10x povećanje performansi u odnosu na postojeća rješenja u idućih godinu dana.
Iako Nvidija etiketira Vera Rubin kao 'AI factory', pitanje je koliko će ovaj format biti otvoren za konkurenciju. AMD Instinct i Intel Gaudi već imaju vlastite ekosustave, a Groqova akvizicija sugerira da Nvidija pokušava pokriti sve faze AI procesiranja — od treninga do inferenca — pod jednom krovnom platformom.
Moguće je da će se novi sustavi suočiti s izazovima u optimizaciji realnih workloadova, posebno onih koji nisu trening velikih jezičnih modela. Što je još neizvjesno? Nema podataka o potrošnji energije — iako je Rubin GPU na 3nm, 22 TB/s memorijske propusnosti i 60 ekzaflopsa u 40 ormara ukazuju na masivne zahtjeve za napajanjem. Također, nitko ne zna koliko će ove ormare koštati, posebno s obzirom na to da Rubin CPU i Groq LPU dolaze kao prvi u svojim kategorijama.
Vera Rubin platforma veliki je korak naprijed za Nvidiju, ali još uvijek postoje brojni izazovi koji trebaju biti riješeni. Potrošnja energije, cijena i performanse ove platforme bit će ključni faktori koji će odrediti njezinu uspješnost. Međutim, s obzirom na Nvidijinu reputaciju i dosadašnje uspjehe, vjerojatno ćemo vidjeti da će ova platforma biti veliki uspjeh i da će promijeniti način na koji se razvijaju i koriste AI sustavi.