Etter AI-hysteriet: Hva Google Cloud Next '26 egentlig betyr for infrastrukturen din
Bakom AI-bølgen: Hva Google Cloud Next '26 betyr for infrastrukturen din
Hvert vår tar Google Cloud Next over tech-konferansene med keynotes, nye produkter og AI-demoer i fleng. Men for ingeniører og de som styrer infrastruktur: Det ekte gull ligger ikke i showet. Det handler om tekniske detaljer, nettverksarkitektur og ytelsestall som påvirker kostnader og app-ytelse neste par år.
I fjor april samlet Next '26 over 32 000 deltakere i Las Vegas og lanserte 260 nye ting. Vi har gravd i detaljene og plukket ut det som teller for din strategi.
Brikke-satsingen: Trening mot inferens
Google delte opp eighth-gen TPU-ene i to spesialiserte brikker – en smart grep som viser retningen for cloud.
TPU 8t er treningsmaskinen for store modeller. En superpod med 9600 brikker har 2 PB delt high-bandwidth memory og 121 exaflops – nesten tre ganger bedre enn forrige. Poenget? Nesten lineær skalering opp til 1 million TPUs over datasentre. Store ML-prosjekter blir raskere.
TPU 8i fokuserer på inferens og sanntid. 384 MB on-chip SRAM (tre ganger mer), 288 GB HBM og en Collectives Acceleration Engine som kutter kommunikasjonsforsinkelse med opptil 5x. Beste tall: 80 % bedre ytelse per dollar. Perfekt for hosting-selskaper og SaaS med AI-funksjoner – høyere marginer på inferens.
De rullet også ut tidlig tilgang til NVIDIA Vera Rubin NVL72-instanser (A5X), med opptil 80 000 GPUer i ett datasenter. NVIDIA-fans får tettere pakking og bedre priser i Google Cloud.
Nettverk: Den skjulte flaskehalsen
Sterk hardware hjelper lite uten nettverk som henger med. Verdens raskeste TPU blir ubrukelig hvis data flytter sakte.
Ny Virgo-arkitektur fikser dette. Fire ganger mer båndbredde, støtte for 134 000 TPUs i ett datasenter. "Collapsed fabric" dropper skaleringsskatten – effektivitet holder seg lineært selv i gigantklastre.
For hybrid- eller multi-cloud: Cloud Interconnect oppgraderes til 400 Gbps per link, opptil 3,2 Tbps totalt. Lavere latency og GB-kostnad ved dataflyt mellom on-prem, Google Cloud eller andre clouds. Gjør visse oppsett lønnsomme for bedrifter med dataresidens-krav eller migrasjoner.
Lagring: Tall som må leses to ganger
Managed Lustre når nå 10 TB/s throughput. Ja, ti terabyte per sekund.
Sammenlign: Typiske NAS-systemer stopper ved 1-2 GB/s. Dette er for vitenskap, genomikk, klimamodeller eller ML med petabyte-data.
Ikke luksus – det er ofte lagring som bremser tunge jobber som finansmodeller eller legemiddelanalyse. Google jagar nå de tøffeste oppgavene, ikke bare standard-cloud.
Konsekvenser for din arkitektur
Dette er ikke småoppdateringer. Det endrer hva Google Cloud takler:
ML-team: Kortere trenings tid, billigere per modell – spesielt for store eksperimenter.
SaaS og hosting: Bedre inferens-økonomi. AI i plattformen blir mer lønnsomt.
Hybrid/multi-cloud: Lavere nettverkskost og ventetid. Tidligere grenseoppsett løsner opp.
Datatunge jobber: Lagring slutter å være problemet. Fokuser på compute og nettverk.
Poenget
Next '26 solgte billetter med AI, men de viktige nyhetene endrer kost- og ytelsesgrunnlaget.
Vurderer du Google Cloud? Dropp demoene, sjekk spesifikasjonene. Spør teamet om TPU-tilgang, Virgo for ditt case og Lustre for dataflyten. Gode valg baseres på tall, ikke slides.
Cloud blir mer spesialisert. Google satser på at vinnere graver i hardware, nettverk og throughput. Bygger du seriøst? Gjør det samme.