Google Cloud Next '26: Mi vár rád az AI-lufi után az infrastruktúrádban?
Google Cloud Next '26: Miért fontos ez neked az infrastruktúrád szempontjából, AI-hype nélkül
Évente tavasszal a Google Cloud Next viszi a prímet a tech konferenciák között. Keynote-ok, új termékek, rengeteg AI-demo – de ha infrastruktúrával foglalkozol, felejtsd a csillogást. A lényeg a hálózati részletekben, benchmarkokban és техspescben rejlik. Ezek határozzák meg a következő két év költségeit és teljesítményét.
A las vegasi eseményen több mint 32 ezer ember gyűlt össze, 260 újdonságot mutattak be. Mi kiszűrtük a felesleget, és kiemeljük, ami igazán számít a stratégiádnak.
A chip-dolog: Két típus, két feladat
A Google nyolcadik generációs TPU-i jól mutatják, merre tart a cloud. Két külön chipet fejlesztettek ki: egyik a tréningre, másik az inference-re.
TPU 8t a nagy modellek tanítására való. Egy superpod 9600 chipet pakol 2 petabájt memóriával, 121 exaflops teljesítménnyel – ez háromszor jobb, mint az előző. A kulcs: közel lineáris skálázás akár 1 millió TPU-ig több adatközpontban. Ha ML-projekteket futtatsz, ez rövidíti a határidőidet.
TPU 8i az inference-re és valós idejű kiszolgálásra fókuszál. 384 MB SRAM (háromszor több, mint régen), 288 GB HBM, plusz egy új engine, ami ötször gyorsabb kommunikációt hoz. A lényeges adat: 80%-kal jobb teljesítmény dolláronként. Hosting cégeknek és SaaS-oknak ez egyenesen javítja a margót AI-funciókon.
Emellett korai hozzáférést ígértek NVIDIA Vera Rubin NVL72-alapú instanciákhoz (A5X platform), akár 80 ezer GPU-val egy adatközpontban. NVIDIA-pártiaknak ez árban és sűrűségben versenyképes.
Hálózat: A rejtett szűk keresztmetszet
Erős hardver nélkülözhetetlen, de ha a hálózat nem bírja, hiába. A leggyorsabb TPU is csak drága dekoráció lassú linkkel.
Új Virgo fabric architecture oldja meg ezt. Négyzeres sávszélesség, 134 ezer TPU egy adatközpontban. A trükk: "collapsed fabric", ami megszünteti a skálázási veszteséget. Így lineáris növekedés hatalmas clusterekben.
Hybrid vagy multi-cloud esetén a Cloud Interconnect frissítés a nyerő: 400 Gbps kapcsolat, akár 3.2 Tbps logikailag. On-prem és cloud között, vagy cloudok közt ez csökkenti a késleltetést és GB-költséget. Nagyvállalatoknak, akik adat residency-re figyelnek vagy fokozatos migrációt terveznek, ez teszi jövedelmezővé a setupot.
Tároló: Olyan számok, amiket kétszer el kell olvasni
A Managed Lustre most 10 TB/s throughput-ot hoz. Gondold át: ez tízezer gigabájt másodpercenként.
Összehasonlítva: tipikus enterprise NAS 1-2 GB/s körül topol. Ez kell tudományos számításokhoz, genomika elemzésekhez, klímaszimulációkhoz vagy petabájtos ML-pipeline-okhoz.
Nem luxus: adatigényes munkáknál (pénzügyi modellek, gyógyszerkutatás, big data transzformációk) a storage gyakran dönti el, órák vagy napok alatt készül el. A Google itt jelez: a legkeményebb jobokért mennek, nem csak átlagos cloudra.
Mit jelent ez a saját architektúrádnak?
Nem kis lépések, hanem alapvető változások a Google Cloud képességeiben:
- ML-csapatoknak: Gyorsabb tréning, olcsóbb modellek – főleg nagy experimenteknél.
- SaaS és hosting szolgáltatóknak: Jobb margó inference-nél, ha AI-t építesz be.
- Hybrid/multi-cloud üzemeltetőknek: Olcsóbb hálózat, kisebb latency – tavaly kockázatos setupok most okésak.
- Adatintenzív feladatoknál: Storage nem akadály, fókusz a compute-ra és hálózatra.
A lényeg röviden
A Next '26 tele volt AI-hírekkel, mert az hozza a tömeget. De a fontosak azok, amik a költségstruktúrát és teljesítmény-plafont mozgatják.
Ha Google Cloudot nézel projektnek, hagyd a videókat, merülj a specifikációkba. Kérdezz rá TPU-elérhetőségre, Virgo-ra a te esetedre, Lustre throughput-ra a pipeline-odhoz. Jó döntések adatból születnek, nem slide-okból.
A cloud világ szakosodik, nem egysíkűsödik. A Google arra játszik, hogy a hardver-, hálózat- és throughput-mániások nyernek. Ha komolyat építesz, te is így gondold.