AMD heeft vandaag tijdens zijn Next Horizon event meer informatie bekendgemaakt over zijn toekomstige, middels 7nm-transistors geproduceerde CPU's en GPU's. Tijdens de presentatie richtte AMD zich primair op zijn Epyc en Radeon Instinct producten voor datacenters, maar de nieuwe technologieën zullen op termijn ook voor consumentenproducten gebruikt worden. AMD's eerste 7nm product, de Radeon Instinct MI60 kaart gebaseerd op een 7nm versie van de Vega GPU, moet voor het eind van het jaar beschikbaar komen.
7nm productieproces: 50% zuiniger of >25% sneller
AMD werkt voor het nieuwe 7nm productieprocedé samen met de Taiwanese chipfabrikant TSMC. Volgens AMD's CTO Mark Papermaster biedt het nieuwe procedé, in vergelijking met de bestaande 14nm-chips, de mogelijkheid om chips de helft kleiner en daarnaast de helft zuiniger of meer dan 25% sneller te maken. Volgens Papermaster is het TSMC 7nm procedé qua transistorafmetingen vergelijkbaar met Intels nieuwe 10nm procedé, maar biedt het 7nm procedé meer prestaties-per-watt dan Intels 10nm. Tel daarbij op dat AMD vastbesloten is om eerder dan Intel chips op basis van het nieuwe procedé in volume te gaan leveren. Niet voor niets gaf Papermaster tijdens de presentatie trots aan dat AMD voor het eerst qua productieprocedé voor loopt op zijn grote concurrent, waar men traditioneel juist altijd één of twee generaties achter liep. Het 7nm procedé gaat zoals geschreven gebruikt worden voor zowel CPU's als GPU's.
Vega 7nm: Radeon Instinct MI60
David Wang, het nieuwe hoofd van AMD's GPU-tak, toonde tijdens het evenement de Radeon Instinct MI60, het eerste product ter wereld gebaseerd op een 7nm GPU. De MI60 maakt gebruik van een nieuwe, op 7nm gebakken Vega-chip. De nieuwe chip bevat 13,2 miljard transistors, een fractie meer dan de 14nm Vega 10 GPU, maar is met 331 mm² een stuk kleiner dan de Vega 10 chip die 486 mm² meet. De nieuwe GPU bevat net als Vega 10 in totaal 64 compute units, wat resulteert in totaal 4096 GPU-cores. Ondanks het identieke aantal cores, belooft AMD als gevolg van het nieuwe productieprocedé meer dan 25% betere prestaties met identiek stroomverbruik. Met een identiek prestatieniveau zou de nieuwe chip 50% zuiniger moeten zijn.
David Wang met de nieuwe Radeon Instinct MI60
Nieuw is dat de nieuwe GPU en daarmee de Radeon Instinct MI60 als eerste videokaart ter wereld ondersteuning biedt voor PCI-Express 4.0. Terloops gaf Wang aan dat de toekomstige generatie AMD Epyc datacenter CPU's ook PCIe 4.0 zullen ondersteunen.
Op de Radeon Instinct MI60 kaart wordt de nieuwe 7nm GPU gecombineerd met een viertal HBM 2.0 geheugenchips, wat resulteert in 32 GB geheugen met een ongekende bandbreedte van 1 TB/s, ruim dubbel zoveel als de RX Vega 64. Volgens AMD is de Radeon Instinct de snelste op PCI-Express gebaseerde GPU voor 64-bit double precision workloads: men belooft tot 7,4 FP64 (double-precision) TFlops en 14,7 FP32 (single-precision) TFlops. Dat is overigens steeds 19,5% meer dan de waardes voor de bestaande op 14nm Vega gebaseerde Radeon Instinct MI25 kaart. Vanwege het identieke aantal cores zal deze toename naar verwachting puur komen door een hogere klokfrequentie.
Zen 2: voor 7nm CPU's tot 64 cores!
AMD's CTO Mark Papermaster gaf tijdens het event meer informatie over de Zen 2 cores, die de basis zullen vormen voor de tweede generatie AMD Epyc (codenaam Rome) alsook de eerstvolgende generatie AMD Ryzen-processors.
Betere IPC, hardware-patches tegen Spectre
Zen 2 is volgens Papermaster veel meer dan een voor 7nm geoptimaliseerde versie van de bestaande Zen-core. Volgens AMD's CTO zijn de cores op veel vlakken geoptimaliseerd, waardoor de IPC (het gemiddelde aantal instructies dat de CPU per klokslag kan uitvoeren) opnieuw significant is toegenomen, al wilde hij daarbij nog geen hard percentage noemen. Recente geruchten noemden een gemiddelde IPC-verbetering van 13%. Belangrijkste pijlers voor de verbeterde prestaties zijn onder meer een verbeterde branch predictor, een verbeterde data pre-fetcher (die data die een CPU-core binnenkort nodig heeft vooraf al in het cachegeheugen laadt) en een grotere cache voor micro-ops, de interne instructies waarmee de chip werkt.
Zeker voor HPC (High Performance Computing) toepassingen in data centers is het grootste nieuws dat AMD bij Zen 2 de floating point units heeft geüpgraded van 128-bit naar 256-bit. Ook de load en store units voor de floating point rekeneenheden, verantwoordelijk door het ophalen en wegschrijven van data van en naar geheugen, zijn geüpgraded om met blokken van 256 bits te werken. Al met al zou Zen 2 bij specifieke 256-bit floating point workloads een twee maal hogere verwerkingssnelheid moeten bieden dan de bestaande Zen-cores.
Een ander vlak waar AMD naar eigen zeggen flinke verbeteringen heeft doorgevoerd is beveiliging. Zo zijn de Zen 2-cores hardwarematig beveiligd tegen de Spectre aanvallen. Voor Meltdown en Foreshadow was de AMD architectuur al niet kwetsbaar. Verder zijn de mogelijkheden om data in het geheugen gecodeerd op te slaan verder verbeterd, onder meer belangrijk voor gevirtualiseerde omgevingen.
Modulaire opbouw 2.0: CPU-cores los van I/O
Technisch is de belangrijkste vernieuwing echter de manier waarop AMD bij de Zen 2 generatie (server) processors met grote aantallen cores wil maken. Bij de huidige Epyc processors (en op de desktop bij de Threadripper CPU's) combineert men vier identieke chips in één processor die elk 8 cores, een dual-channel DDR4-geheugencontroller en 64 PCI-Express 3.0 lanes bieden.
Bij de Zen 2-generatie gaat men nog een stap verder qua modulaire opbouw: toekomstige Epyc chips maken gebruik van meerdere op 7nm geproduceerde zogenaamde CPU chiplets, die elk acht cores bevatten. Deze mini-chips bevatten verder geen extra functionaliteit, maar worden via een nieuwe versie van AMD's Infinity Fabric chip-naar-chip-communicatiebus verbonden met een speciale I/O-die, die bestaat uit een 8-channel DDR4-geheugencontroller en een controller voor een verder nog niet gedefinieerd aantal PCI-Express 4.0 lanes.
Op basis van het getoonde blokschema mogen we concluderen dat deze I/O-die een achttal Infinity Fabric verbindingen biedt. In tegenstelling tot de CPU-chiplets wordt de I/O-die overigens nog gewoon op 14nm geproduceerd, volgens AMD omdat de analoge schakelingen die onder meer nodig zijn in de geheugencontrollers veel minder goed schalen dan de pure digitale onderdelen binnen de CPU-cores.
Volgens Papermaster worden prototypes van Zen 2-processors op dit moment uitvoerig getest door AMD en zijn partners. De volgende generatie (Zen 3) ligt op schema en zou in 2020 op de markt moeten komen. Ook de generatie daarna, Zen 4, staat volgens Papermaster op de planning - het is daarmee voor het eerst dat AMD de vierde generatie Zen expliciet noemt, al lag het natuurlijk wel voor de hand dat die er zou komen.
Benchmarks van AMD Epyc "Rome" CPU's met 64 cores
De nieuwe Zen 2 cores zullen zoals geschreven de basis vormen voor de toekomstige generatie AMD Epyc server-processors met codenaam Rome. Tijdens het evenement maakte AMD's CEO Lisa Su al de eerste specificaties van de Rome-processors bekend. Het meest in het oog springend is dat de nieuwe Epyc chips tot 64 cores per processor krijgen, een verdubbeling ten opzichte van de bestaande Epyc CPU's. Dankzij SMT kan een enkele toekomstige Epyc processor 128 programmathreads verwerken.
Goed nieuws voor serverbouwers: de Rome processors maken gebruik van dezelfde SP3-processorvoet als de bestaande Epyc processors (codenaam Naples). AMD heeft ook direct beloofd dat de socket ook voor de generatie ná Rome, codenaam Milan, gebruikt zal worden.
AMD's CEO Lisa Su toont de AMD Epyc Rome processor.
Volgens Lisa Su bieden de Rome processors tot 2x hogere prestaties dan de bestaande Epyc chips. En dankzij de 256-bit floating point ondersteuning is de maximale verwerkingssnelheid bij dergelijke workloads zelfs 4x hoger dan bij bestaande Epyc CPU's. De Rome processors moeten in 2019 op de markt komen - een specifieker moment werd niet bekendgemaakt.
Aan het eind van de presentatie toonde AMD met een benchmark aan tot welke prestaties Rome in staat is. Men vergeleek een enkele Rome-processor met 64-cores met een dual socket (twee CPU's dus) Intel Xeon Platinum 8180 server, ofwel twee keer Intels snelste server-CPU. De enkele Rome processor voltooide een cRay rendering-benchmark sneller dan de twee Intel CPU's.
Epyc bij Amazon AWS
Een andere belangrijke aankondiging die AMD vandaag deed is dat men Amazon heeft toegevoegd aan zijn lijst klanten voor Epyc-processors voor cloud toepassingen. Gebruikers van Amazon Web Services kunnen per direct op Epyc gebaseerde virtuele servers gebruiken. De nieuwe voor compute geoptimaliseerde M5a en voor geheugenbandbreedte geoptimaliseerde R5a instances zijn 10% goedkoper dan gelijkaardige virtuele servers gebaseerd op Intel Xeon processors. Hiermee berekent Amazon de scherpe prijs van AMD's server-processors gedeeltelijk door aan zijn klanten.
Met de komst van Amazon maken vrijwel alle grote cloudproviders gebruik van AMD Epyc processors. Eerder kon AMD onder meer al Microsoft Azure, Baidu en Oracle Cloud aan zijn klantenbestand toevoegen.