Google Cloud Next ’26: Hypen takana – mitä se tarkoittaa sun infra:lle
Google Cloud Next '26: Mitä se tarkoittaa oikeasti infrastruktuurillesi – unohtamatta AI-hölynpölyä
Google Cloud Next kerää joka kevät tuhansia teknologia-alan tekijöitä yhteen. Keynotteja, uutuuksia ja AI-demoja riittää. Mutta insinöörille tai infra-päätöksentekijälle tärkeintä ei ole show. Se on tekniset speksit, verkkoarkkitehtuurit ja suorituskykyluvut, jotka vaikuttavat suoraan kuluihisi ja sovellustesi nopeuteen seuraavat pari vuotta.
Viime huhtikuussa Las Vegasiin tuli yli 32 000 osallistujaa. Google julkaisi 260 uutta tuotetta ja ominaisuutta. Kaivoin esiin sen, mikä vaikuttaa sun infra-strategiaan.
Siru-uutiset: Koulutus vs. inferenssi
Google panosti kahdeksannen sukupolven TPU-siruihin fiksusti: erilliset sirut eri tarpeisiin.
TPU 8t sopii massiiviseen mallien koulutukseen. Yksi superpod sisältää 9600 sirua ja 2 petatavua jaettua muistia. Teho on 121 exaflopsia – melkein kolminkertainen edelliseen verrattuna. Parasta on skaalaus: jopa miljoona TPU:ta useissa keskuksissa, ja koulutusaika kutistuu lineaarisesti. Jos pyörität isoja ML-projekteja, tämä muuttaa aikataulusi.
TPU 8i keskittyy inferenssiin ja reaaliaikaiseen palveluun. Sirussa on 384 MB SRAM-muistia (kolminkertainen edelliseen) ja 288 GB HBM-muistia. Uusi Collectives Acceleration Engine pudottaa viiveen jopa viisinkertaiseksi. Tärkein luku: 80 % parempi suorituskyky dollaria kohti. Hosting-tarjoajille ja SaaS-alustoille, jotka lisäävät AI-ominaisuuksia, tämä tarkoittaa parempia katteita.
Lisäksi Google avaa pian NVIDIA Vera Rubin NVL72 -pohjaisia instansseja (A5X-alusta), jopa 80 000 GPU:ta yhdessä keskuksessa. NVIDIA-faneille tämä tuo kilpailukykyistä hintaa ja tiheyttä.
Verkko: Hiljainen pullonkaula
Hyvä rauta on hyödytön ilman verkkoa. Nopea TPU muuttuu kalliiksi romuksi, jos data ei liiku.
Uusi Virgo-arkkitehtuuri korjaa tämän. Se nelinkertaistaa kaistan edelliseen verrattuna ja tukee 134 000 TPU:ta yhdessä keskuksessa. Ratkaisu on "collapsed fabric" – poistetaan skaalausvero, eli tehon häviö isoissa klustereissa. Tuloksena lineaarisempi skaalaus massiivisessa koossa.
Hybrid- ja multi-cloud-käyttäjille Cloud Interconnect -päivitys on iso juttu. Yhteys nousee 400 Gbps:iin, kokonaisuudessaan 3,2 Tbps:iin. Data siirtyy on-premistä tai toisesta pilvestä halvemmalla ja nopeammin. Yrityksille, joilla on tiukat residenssivaatimukset tai vaiheittainen migraatio, tämä tekee arkkitehtuurit kannattaviksi.
Tallennuksen teho: Luvut, jotka kannattaa tarkistaa kahdesti
Managed Lustre -tiedostojärjestelmä saavuttaa 10 TB/s kaistanleveyden. Vertailuksi: perusyritystason NAS jää 1–2 GB/s:iin.
Tämä on pakollinen isoille laskentatehtäville, kuten genomiikkaan, ilmastomallinnukseen tai petatavujen ML-putkille. Tallennus on usein se, mikä erottaa tunnit päivistä. Google haastaa nyt raskaimmatkin työt, ei vain peruspilveä.
Mitä tämä tarkoittaa sun arkkitehtuurille?
Nämä eivät ole pieniä päivityksiä. Ne muuttavat Googlen pilven pohjaa:
ML-tiimeille: Koulutusaika lyhenee, mallien hinta putoaa – etenkin isoilla malleilla.
SaaS- ja hosting-palveluille: Inferenssin katteet paranevat. AI-ominaisuudet kannattavat paremmin.
Hybrid- ja multi-cloudille: Verkko maksaa vähemmän ja viiveet pienenevät. Edellisvuoden rajatavoitteet onnistuvat nyt.
Datajuokseille: Tallennus ei rajoita. Suunnittele laskennan ja verkon ympärille.
Todellinen oppi
Next '26 oli täynnä AI-juttuja, koska ne myyvät lippuja. Mutta analysoi speksit: ne muuttavat kustannuksia ja suorituskykyä.
Jos harkitset Google Cloudia, unohda demot. Kysy tiimiltäsi TPU-saatavuudesta, Virgo-verkosta sun tapaukselle ja Managed Lustren kaistasta sun putkille. Parhaat päätökset syntyvät luvuista, ei slideista.
Pilvimaailma erikoistuu yhä enemmän. Google lyö vetoa, että menestyvät ne, jotka kaivautuvat siruihin, verkkoon ja teholukuihin. Tee sinäkin niin, jos rakennat jotain vakavaa.