Intel: Ponte Vecchio-GPU voor datacentra is sneller dan Nvidia's A100

Intel heeft vandaag zijn Architecture Day van dit jaar gehouden. Onderdeel van het nieuws is dat we meer details hebben ontvangen over Ponte Vecchio, Intels high-end gpu voor datacentra. Zo weten we nu dat hij een stuk krachtiger zal zijn dan de Nvidia A100.

Zoals we al weten bestaat Ponte Vecchio uit meer dan 100 miljard transistors verspreid over 47 chiplets. Het totale oppervlakte is een enorme 640 vierkante millimeter. Elke compute tile heeft acht Xe-compute units en wordt op TSMC's N5-node geproduceerd. Om hoeveel compute tiles en om hoeveel cores het nou precies gaat is niet duidelijk, maar hij moet een fp32-rekenkracht van 45 teraflops bieden. Dat is meer dan wat Nvidia's A100 biedt (maximaal 19,5 tflops). Het mag benadrukt worden dat Intels variant inmiddels een stuk moderner is en minder gespecialiseerde cores lijkt te hebben.

Intels Raja Koduri benadrukt dat bandbreedte steeds belangrijker wordt. Daarom is hij voorzien van pcie 5.0 en hbm2e. Laatstgenoemde heeft een geheugenbandbreedte van 5 terabit per seconde, en de pcie 5.0-connectiviteit biedt tot 2 Tbit/s. Alle chiplets zitten op een hieronder geplaatste base tile, die op Intels 7nm-node (voorheen was dit 10nm Enhanced SuperFin) is gebaseerd. In 2019 werd bekend dat Intel patent had aangevraagd op een techniek om chiplets met elkaar te verbinden aan de hand van een interconnect-chip. Dit lijkt voor Ponte Vecchio te zijn gebruikt.

Verder heeft de package een embedded switch, waarmee de gpu zich kan verbinden met maximaal acht andere chips. Deze chip wordt gemaakt op TSMC's N7-node. Elke Ponte Vecchio-module met oam-formfactor past in een subsysteem met maximaal vier van deze modules, die bijvoorbeeld in zijn geheel in een 1U-servermodule met twee cpu's past. Het project zit nog in de ontwikkelfase, er zijn dus nog uitsluitend engineering samples.

Bronnen: Intel, (YouTube)

« Vorig bericht Volgend bericht »
0