Tijdens de GPU Technology Conference heeft Nvidia naast verscheidene softwaretools ook Quantum-2 onthuld, een end-to-end netwerkproduct voor supercomputers. Omdat dit soort klanten een enorme hoeveelheid bandbreedte nodig hebben heeft Nvidia alles uit de kast getrokken.
Het is volgens Nvidia het eerste netwerkplatform dat zowel doorvoersnelheid van een supercomputer als de toegankelijkheid van een cloudserver biedt. Voorheen moest je voor een krachtige servercluster kiezen uit één van beide. Als Nvidia zijn in-house Selene-supercomputer op basis van de DGX-pods zou hebben voorzien van Quantum-2, dan zou de bandbreedte 224.000 GB/s zijn, of grofweg anderhalf keer het wereldwijde internetverkeer dat elk moment verwerkt wordt.
Het Quantum-2-platform maakt gebruik van NDR InfiniBand met een doorvoersnelheid van 400 Gbit/s per netwerkkaart. Aan de basis ligt de chip in de netwerkswitch. Hij wordt op TSMC's 7nm-node geproduceerd en heeft maar liefst 57 miljard transistoren. Hij is volgens Nvidia net zo groot als de op hetzelfde procedé gebakken A100-gpu, die 54 miljard transistors heeft. Hij wordt nu gesampled. De switch heeft 64 poorten die 400 Gbit/s aan kunnen, of 128 stuks die 200 Gbit/s doen.
Een Quantum-2-systeem kan in totaal tot 2048 aansluitingen met elkaar verbinden, ten opzichte van 800 voor Quantum-1. Hij heeft dus meer dan vijf keer de capaciteit, en de doorvoersnelheid is tot drie keer zo hoog. Net als Nvidia's dpu-producten heeft hij on-die AI-acceleratoren, en voor Quantum-2 zijn het er 32 keer zoveel.
Verder is de CX-7-netwerkkaart nieuw in het systeem. Hij heeft een twee keer zo hoge doorvoersnelheid als zijn voorganger die volgens de chipontwerper tot nu toe de snelste was, de CX-6. Hij heeft 8 miljard transistors en wordt ook gebakken op TSMC's N7-node, de eerste chips worden in januari gesampled. Hij kan snelheden van maximaal 400 Gbit/s aan. Dat is een verbetering van vier keer wat de netwerkmogelijkheden betreft, en gpu's met elkaar verbinden kan met een twee keer zo hoge doorvoersnelheid.
Een ingebouwd systeem voor het beheren van dataverkeer zorgt ervoor dat er geen flessenhalseffecten ontstaan. Een timingsysteem kan gedistribueerde applicaties met een nauwkeurigheid van 1 nanoseconde verwerken. De nieuwe BlueField DOCA 1.2-software zorgt voor nieuwe beveiligingsmogelijkheden. Verschillende firewalldiensten zijn inzetbaar op Nvidia's BlueField-acceleratoren, zoals die van Checkpoint, F5, Fortinet, Juniper en VMWare.
Bron: Nvidia