Intel geeft presentatie over AI en HPC-hardware op SC23, geeft ook inzage in aankomende producten

Intel heeft een presentatie gegeven bij de High Performance Computing conferentie SC23 in Denver, waar het zijn plannen deelde binnen het Data Center, AI, en HPC segment. Het bedrijf wil in alle lagen tussen de hardware en gebruikers actief zijn door infrastructuur, software, en applicaties aan te bieden en ondersteunen.

Het eerste wat Intel aanstipt is zijn portfolio van AI en HPC infrastructuur die zowel eenvoudig als schaalbare oplossingen moeten bieden. Van een enkel onderdeel als een cpu tot een volledige Data Center server cluster. Als voorbeeld geeft Intel de Dawn supercomputer, die recent aangekondigd is. Dit is op dit moment de snelste supercomputer in het VK en kon binnen een half jaar van conceptfase naar werkend gaan, met slechts 4 weken installatietijd. Ook wordt de SuperMUC-NG supercomputer in Duitsland genoemd, deze supercomputer is bijna net zo snel als de Dawn supercomputer, maar is al in een tweede fase van uitrol. Beide systemen maken gebruik van OneAPI wat het draaien van verschillende software producten eenvoudiger moet maken. Deze systemen zijn echter nog relatief klein vergeleken met Aurora, een van de grootste supercomputers op dit moment. Dit geeft een illustratie van de schaalbaarheid van deze systemen, aangezien deze supercomputer wel 60.000 gpu's bevat en meer dan 10.000 nodes.

De Aurora supercomputer moet dan ook een large language model (LLM) met maar liefst 1 biljoen parameters mogelijk maken. Wat volgens Intel betekent dat dit systeem 1,45 keer sterker is per videokaart dan de A100 van Nvidia volgens Argonne National Laboratory, waar de Aurora supercomputer staat. Dit soort kracht kan bijvoorbeeld ingezet worden voor onderzoek naar medicijnen, waar aan de hand van AI en simulaties de beste samenstellingen van moleculen gevonden kan worden voor het gegeven probleem. Dit soort medicijnsimulaties zouden redelijk lineair moeten schalen volgens Intel en hebben dus veel baat bij massieve supercomputers. Ook bij 'High-Energy Particle Physics'-onderzoek moet de Aurora supercomputer voordelen bieden tegenover de concurrentie en moet de schaalbaarheid voordelen bieden. In een Fortran en OpenMP workload voor moleculair onderzoek zou een enkele Intel gpu meer dan twee keer zoveel performance leveren als een A100. Het zou echter zelfs op de Aurora supercomputer nog 3 jaar kosten om een muizenbrein te simuleren, wat nog flink wat stappen verwijderd is van een menselijk brein.

Intel's GPU Max serie is nu ook beschikbaar in zowel de Intel Developer Cloud, als in verschillende OEM-systemen. De losse gpu's zouden beschikbaar moeten zijn via HP, Lenovo, Dell, en Supermicro. De Intel GPU Max 1550 moet gemiddeld 1,36x sneller zijn dan een Nvidia H100 PCIe-kaart. Intel zou veel prestatieverbeteringen hebben verkregen door driver- en software-optimalisaties in de afgelopen maanden. Voor specifieke AI workloads zou de Intel Gaudi 2-architectuur de strijd aan moeten kunnen gaan met Nvidia's H100. Deze AI-accelerator bevat 96GB HBM2E geheugen en 24 RoCE poorten van 100 Gbps, wat de schaalbaarheid ten goede moet komen. De accelerator moet nog wel het onderspit delven vergeleken met de H100 en GH200 van Nvidia, maar moet dat qua prijs meer dan goed maken. Ook zijn er verbeteringen doorgevoerd sinds begin dit jaar, waardoor de prestaties in GPT-3 training met maar liefst 103% verbeterd is.

Intel kondigt echter ook al de Gaudi 3 AI accelerator aan die in 2024 op de markt moet verschijnen. Niet alleen moet deze nieuwe generatie op 5nm gebakken worden in plaats van 7nm, ook zou hij vier keer hogere prestaties moeten leveren in BF16 en anderhalf keer meer HBM kunnen bevatten. De netwerksnelheden zouden ook verdubbeld zijn. In de toekomst wil Intel de HPC gefocuste GPU Max serie en de Gaudi AI-accelerators samenvoegen in een nieuwe lijn gpu's die de codenaam Falcon Shores draagt. Vanaf 2025 moeten er producten van deze nieuwe serie uitkomen. Deze Falcon Shores kaarten zouden zich grotendeels moeten gedragen als gpu's maar zouden ook van de op AI gerichte Habana architectuur moeten incorporeren. Deze gpu's zullen ook weer met een modulaire 'tiles'-architectuur worden geleverd en gebruik moeten maken van HBM3. Ook aan de software kant moet er het een en ander worden samengevoegd. Intel maakt al gebruik van OneAPI voor haar gpu's, maar de Gaudi-kaarten gebruiken op dit moment een softwarepakket genaamd SynapseAI. Deze zullen met Falcon Shores ook samengevoegd worden. 

Op het gebied van Xeon Processors komt de nieuwe vijfde generatie op 14 december op de markt. Deze maken gebruik van hetzelfde platform als de vierde generatie maar moeten simpelweg betere prestaties en efficiëntie bieden. Deze 'Emerald Rapids' komen zowel in een gewone als CPU Max versies, die hogere bandbreedte moeten bieden voor het geheugen door gebruik te maken van HBM2e. Deze generatie zou 1,4 keer beter moeten zijn met AI spraak herkenning, ook 1,4 keer beter in HPC LAMMPS-Copper en FFMPEG transcoderen moet 1,2 keer sneller kunnen gebeuren. De Xeon processoren die verder in de toekomst het licht moeten zien zouden op het Intel 3-procedé geproduceerd worden. Deze zouden gebruik maken van P-cores en moeten meer kernen en een tot wel 2,8 keer hogere geheugenbandbreedte mogelijk maken. Ook moeten deze betere AI-acceleratie bieden, in AI-workloads moeten de prestaties tot wel 3 maal hoger worden. 


Bron: Intel

« Vorig bericht Volgend bericht »
0