Noodzaak
De huidige geheugentechnologie die op high-end videokaarten wordt gebruikt, GDDR5, werd geïntroduceerd in 2008 bij de Radeon HD 4870. De afgelopen zeven jaar zijn de klokfrequenties van GDDR5 weliswaar stapsgewijs verhoogd naar 1750 MHz, maar in feite maken ook de nieuwste videokaarten nog altijd gebruik van een voor IT-begrippen inmiddels bejaarde geheugenstandaard. Een nieuwe ontwikkeling is dus zeer welkom. GPU’s worden steeds krachtiger en het aantal cores (shader units) in high-end GPU’s blijft maar toenemen. Al die cores moet voldoende snel van data worden voorzien om nuttig werk te kunnen verrichten. Daarvoor moet de geheugenbandbreedte bij voorkeur in een gelijk tempo meestijgen. Dat is echter niet zo eenvoudig.
Een eerste optie om de bandbreedte te verhogen is letterlijk de breedte van de geheugenbus vergroten. Hoe breder die bus (256-bit, 384-bit, 512-bit), hoe meer bits er parallel van en naar het geheugen kunnen worden geschreven. Aan de andere kant geldt: hoe breder de bus, hoe groter de GPU moet worden en hoe meer aansluitpunten die moet krijgen – en dat terwijl GPU’s al zo’n beetje de grootste chips ter wereld zijn. Hoewel zowel AMD als Nvidia diverse ontwerpen met 512-bit bussen hebben gehad (waaronder de huidige Radeon R9 290X en 390X), blijkt iedere keer weer dat deze zowel qua chipontwerp als qua routering van signalen op de PCB niet bepaald eenvoudig of goedkoop te produceren zijn. Een tweede optie is om de klokfrequentie te verhogen, maar buiten het feit dat met de GDDR5-technologie de limieten onderhand wel bereikt zijn, zorgt een verhoging van de klokfrequentie ook direct voor een flinke toename van het energieverbruik. Zelfs bij high-end videokaarten bestaan er op dat vlak beperkingen.
De bandbreedte, oftewel hoeveel gigabyte er per seconde getransporteerd kan worden, is echter niet de enige uitdaging. De latency – de tijdsduur tussen het opvragen van een stuk data uit het geheugen en het daadwerkelijk beschikbaar komen daarvan – is de laatste (tientallen) jaren veel minder verbeterd dan de bandbreedte, waardoor het steeds meer een bottleneck is. Bovendien vragen CPU’s en GPU’s ook om steeds meer geheugen, terwijl het door de uitdagingen met het uitdokteren van nieuwe chipproductieprocedés steeds lastiger wordt om de capaciteit per geheugenchip toe te laten nemen. Ten slotte wordt met name in de mobiele wereld natuurlijk iedere nieuwe technologie die stroom en ruimte kan besparen met open armen ontvangen.
HBM belooft al die uitdagingen aan te pakken. In vergelijking met bestaande geheugentechnologieën zoals DDR4 en GDDDR5 moet HBM naast meer bandbreedte ook een lagere latency, een lager stroomverbruik én meer capaciteit op een kleiner oppervlak bieden. Hoe dat mogelijk moet worden? Stapelen!