Výrobca počas svojej konferencie o technológiách GPU oznámila najvýkonnejší čip na svete pre výpočty súvisiace s umelou inteligenciou.

Je to nástupca čipu H100 AI a ponúka obrovské zlepšenie výkonu a efektivity. Nový GPU B200 je schopný dosiahnuť 20 petaflopov FP4 vďaka 208 miliardám tranzistorov vo vnútri čipu. Okrem toho má GB200 30-násobný výkon oproti H100 v záťažiach LLM inferencie a zároveň 25-násobne znižuje spotrebu energie. V benchmarku GPT-3 LLM je GB200 tiež sedemkrát rýchlejší ako H100. Napríklad na trénovanie modelu s 1,8 bilióna parametrov by bolo potrebných 8000 grafických procesorov Hopper a približne 15 MW.

V porovnaní s tým súbor 2000 grafických procesorov Blackwell to zvládne len za 4 MW. Na ďalšie zvýšenie efektivity firma navrhla nový sieťový prepínací čip s 50 miliardami tranzistorov, ktorý dokáže obslúžiť 576 GPU a umožňuje im vzájomne komunikovať s obojsmernou šírkou pásma 1,8 TB/s. Týmto spôsobom NVIDIA vyriešila problém s komunikáciou, keďže predtým by systém, ktorý kombinuje 16 GPU, strávil 60% času komunikáciou a 40% času výpočtom. Výrobca tvrdí, že ponúka spoločnostiam kompletné riešenie.

Napríklad model GB200 NVL72 umožňuje umiestniť 36 CPU a 72 GPU do jedného stojana chladeného kvapalinou. Na druhej strane DGX Superpod pre DGX GB200 spája osem týchto systémov do jedného, čo predstavuje 288 CPU a 576 GPU s 240 TB pamäte. Firmy ako Oracle, Amazon, Google a Microsoft sa už podelili o plány integrovať NVL72 pre svoje cloudové služby. Architektúra GPU použitá pre grafický procesor Blackwell B200 bude pravdepodobne základom pripravovaného radu RTX 5000.

Zdroj