AMD en Nvidia
Van AMD mogen we het eerste product met HBM dus al komende woensdag verwachten, in de vorm van de Fury X videokaart. Dat AMD als eerste met een HBM product op de markt komt is op zich niet vreemd aangezien AMD mede-ontwikkelaar is van de nieuwe standaard. Nvidia wil HBM gaan toepassen bij de Pascal generatie, de codenaam voor wat vermoedelijk de GeForce 1000 serie wordt. De eerste producten uit deze serie worden in 2016 verwacht. Vermoedelijk kiest men meteen voor HBM 2.0, waarover meer op de volgende pagina.
Het is inmiddels bekend dat AMD vier HBM-stacks naast de Fiji GPU wil plaatsen, waardoor de Fury X videokaart dus 4 GB geheugen krijgt. We schreven al dat de bandbreedte van één HBM stack op 500 MHz gelijk is aan 128 GB/s. Met vier stacks krijgt de Fury X dus een geheugenbandbreedte van 512 GB/s.
Ter vergelijking: de Radeon R9 390X werkt met een 512-bit GDDR5-geheugencontroller (die dus zestien 32-bit chips adresseert), draaiend op 1500 MHz. Omdat bij GDDR5 per klokslag vier keer data kan worden overgebracht, resulteert dat in een geheugenbandbreedte van 384 GB/s. De snelste Nvidia-kaarten, de GeForce GTX Titan X en GTX 980 Ti, werken met 384-bit geheugen op 1750 MHz. Dat is omgerekend 336 GB/s. In beide gevallen is HBM dus een flinke stap vooruit, maar nog zeker geen verdubbeling.
Hiermee zijn we echter nog niet aan het einde van dit verhaal gekomen. Juist omdat de HBM-stacks direct naast de GPU zitten en signalen niet door de PCB van de videokaart gerouteerd hoeven te worden, kan het stroomverbruik voor de signalering een stuk lager zijn. Sowieso zijn de HBM-chips zelf ook erg zuinig. Nvidia becijferde in een presentatie over HBM dat de totale geheugenaansturing bij GDDR5 zo’n 18-22 picojoule per bit kost en bij HBM zo’n 6 à 7 pJ/bit. Het stroomverbruik van het geheugen wordt dus met een factor drie verlaagd! En doordat het geheugen fysiek zo dicht in de buurt van de GPU zit, kunnen de latencies flink omlaag, wat ook voor een prestatiewinst zorgt. Dat GPU én geheugen min of meer de ruimte innemen die tot dusver voor de GPU alleen nodig was, biedt ten slotte ook perspectieven voor toekomstige laptops met krachtiger aparte videokaart.
Nvidia’s mockup van een toekomstige Pascal GPU, waarbij vier HBM-stacks zijn geplaatst direct naast de GPU.
HBM 2.0
Inmiddels heeft geheugenfabrikant Hynix al plannen voor de tweede generatie HBM-chips geopenbaard. Deze zou per geheugenlaag 8 gigabyte ofwel 1 GB moeten bevatten. Door vier of zelfs acht lagen te stapelen, moet een HBM 2.0-stack zodoende een capaciteit van 4GB of zelfs 8GB gaan bieden. Door daarnaast de snelheid te verhogen naar minimaal 2 Gbps per pin zou de totale bandbreedte van een HBM 2.0-stack moeten toenemen naar 256 GB/s.
Een toekomstige GPU met vier HBM 2.0-stacks rondom geplaatst zou dus in totaal 16 of 32 GB geheugen op een snelheid van ruim 1 TB/s moeten kunnen krijgen.