Na een eindeloze periode van uitstellen en onofficiële informatie over Ice Lake-SP heeft Intel eindelijk de derde generatie Xeon Scalable-processors onthuld. Zoals verwacht heeft het topmodel 40 cores, wat flink minder is dan de 64 stuks van AMD's gloednieuwe Epyc Milan-generatie. Toch zet Intel ze voor bepaalde workloads tegenover deze nieuwe Milan-cpu's.
Ze zijn gemaakt op Intels 10nm+-node, niet op 10nm SuperFin (10nm++). Daar was het verbeterde productieproces te laat voor gereed. In ieder geval moet de Ice Lake-architectuur voor een ipc-verbetering van (vermoedelijk maximaal) 20% bieden ten opzichte van Cascade Lake-SP (Skylake-architectuur). Gemiddeld genomen moeten ze 46% beter presteren, in AI-inferentieworkloads moet de Xeon Platinum 8380 74% beter presteren dan de Platinum 8280.
Ondanks dat het reguliere topmodel lagere kloksnelheden heeft (3,4 GHz single-core, 3,0 GHz all-core) dan de nieuwe Epyc-chips zegt Intel in sommige workloads met de Xeon Platinum 8380's betere ruwe prestaties te kunnen bieden dan de nieuwe Epyc 7763-topmodellen. In bepaalde webserver-workloads liggen de prestaties een factor twee tot drie hoger, hoewel het uiteraard zal gaan om de meest positieve situaties ten gunste van Intel. In AI-inferentie ligt de bovengrens zelfs op zo'n 12 tot 25 keer sneller. Daarvoor maakt het gebruik van deep learning boost en andere software-optimalisaties. In 20 verschillende AI-workloads moet het Xeon-topmodel 50% sneller zijn dan de Epyc 7763, en een Ice Lake-SP-server moet ook 30% sneller zijn dan een vergelijkbare server met Nvidia's A100-gpu's.
Intel zegt ook een groot voordeel te hebben met avx-512, dat AMD momenteel nog niet ondersteunt. Zoals vorige zomer al bleek heeft Intel de kloksnelheden gebalanceerd in avx-512-workloads, zodat de instructiefamilie geen extreme toename in stroomverbruik of afname in kloksnelheden veroorzaakt. Niet iedere avx-512-instructie is namelijk even intensief, de chipmaker heeft dat opgelost door verschillende intensiteitsniveaus toe te kennen.
Verder gebruikt Ice Lake-SP een nieuw socket genaamd LGA 4189, met 542 extra contactpunten. Deze zijn gebruikt om de geheugencontroller te vergroten van 6 naar 8 kanalen en om 64 pcie 4.0-lanes te ondersteunen, in plaats van 48 pcie 3.0-lanes. Een server met twee socket en 32 dimm-sloten moet je kunnen voorzien van 6 TB aan werkgeheugen. Daardoor moet de dram-latency afnemen bij dezelfde doorvoersnelheid. Nieuw is total memory encryption, wat een groot voordeel wat veiligheid betreft moet bieden tegen een prestatie-impact van 1 tot 2%.
Ook is opvallend dat de prijsverschillen tussen AMD en Intel afgenomen is. Zo kost Intels nieuwe topmodel, dat in sommige gevallen sneller moet zijn dan AMD's gloednieuwe tegenhanger, zo'n 8100 USD. AMD's topmodel moet zo'n 7.890 dollar kosten. Welke chip de voorkeur heeft zal dus voor een belangrijk deel afhangen van de workload.
Bron: Intel