Za hypem AI: Co Google Cloud Next '26 skutečně znamená pro vaši infrastrukturu
Za AI humbukem: Co Google Cloud Next '26 opravdu mění na vaší infrastruktuře
Každý jaro Google Cloud Next zaplní sálu keynotey, novinkami a AI show, které by stačily na celou továrnu. Ale pro inženýry a šéfy infrastruktury platí jednoduchá pravda: opravdový poklad se skrývá v technických detailech, síťové architektuře a benchmarkách výkonu. Tyhle věci ovlivní vaše náklady na cloud a rychlost aplikací na příští dva roky.
Minulý duben přitáhla konference v Las Vegas přes 32 tisíc lidí a představila 260 novinek. Prošli jsme to a vybrali, co skutečně posouvá vaši strategii.
Čipy: Trénink proti inference
Google s osmou generací TPU ukázal, kam cloud směřuje – postavil dva odlišné čipy pro dva odlišné úkoly.
TPU 8t je stroj na trénink modelů v obřím měřítku. Představte si superpod s 9 600 čipy a 2 petabajty sdílené vysokorychlostní paměti. Dodává 121 exaflopů – třikrát víc než předtím. Klíč je lineární škálovatelnost: spojíte až milion TPU přes datacentra a trénink se zkrátí úměrně. Pro velké ML projekty to znamená nový časový plán.
TPU 8i se zaměřuje na inference a okamžité nasazení. Má 384 MB SRAM na čipu (třikrát víc než dřív), 288 GB HBM a nový engine pro kolektivní operace, který zkracuje latenci až pětkrát. Důležité číslo: 80 % lepší výkon za dolar oproti minulé generaci. Hostingoví provozovatelé nebo SaaS s AI funkcemi tak zlepší marže na inference.
Navíc brzy přijde A5X platforma s NVIDIA Vera Rubin NVL72 – až 80 000 GPU v jednom datacentru. Pro fanoušky NVIDIA to znamená lepší ceny a hustotu v Google Cloud.
Síťová vrstva: Neviditelný zabiják výkonu
Mocný hardware bez sítě je k ničemu. Nejrychlejší TPU selže, když data neletí stejně rychle.
Google představil Virgo, novou fabricu pro datacentra. Nabízí čtyřnásobnou šířku pásma a zvládne 134 000 TPU v jednom centru. Změna spočívá v "collapsed fabric", která odstraňuje "daň za škálování" – ztráty efektivity při růstu klastrů. Výsledek: téměř lineární škálování v obřím měřítku.
Pro hybridní nebo multi-cloud setupy jsou klíčové vylepšení Cloud Interconnect. Teď 400 Gbps na spojení, škálovatelné na 3,2 Tbps. Přenosy mezi on-prem a Google Cloud (nebo mezi cloudy) klesnou v latenci i ceně za GB. Pro firmy s datovými restrikcemi nebo migracemi to otevírá nové možnosti.
Úložiště: Čísla, která stojí za přečtení dvakrát
Managed Lustre teď zvládá 10 TB/s throughputu. To je úroveň pro vědecké výpočty, genomiku, klimatické modely nebo ML pipeline s petabajty dat.
Běžné enterprise NAS končí u 1-2 GB/s. Tady je úložiště často limit – rozhoduje, jestli úloha skončí za hodiny nebo dny. Google tak útočí na nejtěžší compute joby, ne jen běžné appky.
Dopad na vaši architekturu
Tohle nejsou malé upgrady. Jsou to posuny v základu Google Cloud:
ML týmy: Trénink se zrychlí, náklady na model klesnou – ideální pro experimenty s velkými modely.
SaaS a hosting: Lepší marže na inference pro AI v platformách.
Hybrid/multi-cloud: Nižší síťové náklady a latence – dřív nereálné architektury teď fungují.
Data-intenzivní workloady: Úložiště není brzda. Designujte podle compute a sítě.
Závěr bez balastu
Google Cloud Next 2026 plnilo AI novinky, protože to táhne lidi. Ale stojí za to jen ty, co mění náklady a strop výkonu.
Při výběru Google Cloud přeskočte videa a jděte do specifikací. Zeptejte se account teamu na TPU dostupnost, Virgo pro váš případ a Lustre throughput pro data. Nejlepší rozhodnutí vycházejí z dat, ne slideů.
Cloud se specializuje víc než kdy dřív. Google staví na týmech, co sledují hardware, sítě a throughput. Pokud stavíte něco vážného, udělejte to stejně.