AMD Zen processors preview

Inhoudsopgave
  1. 1. Inleiding
  2. 2. Summit Ridge
  3. 3. IPC
  4. 4. Architectuur
  5. 5. Opbouw: CPU-Complex
  6. 6. SMT, instructies en cache
  7. 7. Chipsets
  8. 8. De horizon: Zen+ en 7nm
  9. 9. AMD vs. Intel
  10. 10. Conclusie

SMT, instructies en cache

Naast het verlaten van de Bulldozer-modules wordt er bij Zen Simultaneous Multithreading (SMT) geïntroduceerd, waarmee iedere core beschikt over twee threads. SMT is bedoeld om multithreading efficiënter te maken door zoveel mogelijk rekeneenheden binnen de processor bezig te houden, waar voornamelijk zeer CPU-intensieve applicaties zoals encoders van profiteren.

Inmiddels is er iets meer bekend over hoe AMD SMT goed wil laten werken. Zo is de branch predictor uitgebreid, die ervoor moet zorgen dat vertakkingen in de code goed voorspeld worden en dat er daarom meer instructies parallel uitgevoerd kunnen worden. Daarnaast krijgt Zen een micro-op cache, die ervoor moet zorgen dat de instructies die de processor uitvoert versneld worden wanneer de code veel identieke instructies bevat.

Een open vraag is hoe goed AMD’s implementatie van SMT zal zijn. Bij Intels toepassing van SMT, genaamd HyperThreading, duurde het bijvoorbeeld enige tijd voordat het in vrijwel geen programma of spel leidde tot slechtere prestaties. De mogelijkheid bestaat daarom dat AMD een soortgelijke ‘learning curve’ zal kennen, waarbij AMDs versie van SMT niet onmiddellijk even goed werkt als HyperThreading na vele jaren van optimalisatie. In ieder geval is het wel een stap in de juiste richting, vergeleken met de per core winst van Bulldozer.

Instructiesets

Ook qua processorinstructies is Zen goed up to date. Vanzelfsprekend worden alle SSE-instructiesets ondersteund. Daarnaast biedt hij AVX en AVX2, waarmee de processor overweg kan met 128-bit en 256-bit getallen. Ook Intels AES-instructies en de SHA1/SHA256 sets zijn geïmplementeerd, waarmee respectievelijk het versleutelen van data en het maken van hashes veel sneller gaat. Verder is de RDSEED instructie ook handig voor encryptie, de pseudo-random number generator die Intel introduceerde bij Ivy Bridge.

Cache

De cache van de processor is flink op de schop gegaan. Alle drie de levels van de cache zijn versneld ten opzichte van Bulldozer. De L1- en L2-caches zijn tot wel twee keer sneller, terwijl de totale bandbreedte van de L3-cache volgens AMD zelfs vijf keer hoger is.

De omvang van de caches is ook veranderd. Ten opzichte van zijn voorganger heeft Zen twee keer zoveel L3-cache, namelijk 16MB voor een 8-core model, vergeleken met 8MB voor Bulldozer. Opvallend genoeg is de hoeveelheid L2-cache wel gehalveerd: van 8MB naar 4MB. Bulldozer had 48 kB totale L1-cache, dat bestond uit 32 kB instructie-cache (eigenlijk 64 kB per module) en 16 kB data-cache. Bij Zen is dat 64 kB instructie-cache en 32 kB data cache per core, waarmee de instructie-cache twee keer zo groot is als wat Intel momenteel biedt.

Verder is de L1-cache nu van het write-back type, waardoor de data die hiernaar wordt geschreven niet meer automatisch ook naar de L2- en L3-cache geschreven hoeft te worden. Dit zou een positief effect moeten hebben op de snelheid en efficiëntie.       

Daarnaast zijn de pre-fetchers sterk verbeterd. Dit is het onderdeel dat voorspelt welke data op korte termijn nodig is voor het uitvoeren van instructies, en deze vervolgens alvast uit het relatief langzame DRAM ophaalt. Met betere pre-fetching zullen de CPU-cores minder lang zonder werk zitten terwijl ze wachten op data.

Advertentie
0