Intel Core i7 6950X Broadwell-E review: bloedsnel en peperduur

1 besproken product
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Broadwell-E: 14nm en maximaal 10 cores
  3. 3. Modellen: Core i7 6950X, 6900K, 6850K en 6800K
  4. 4. De diepte in: de Broadwell-E cores
  5. 5. Turbo Boost Max 3.0
  6. 6. Specificaties
  7. 7. Test
  8. 8. Benchmarks: Cinebench 10 (multi, 32-bit)
  9. 9. Benchmarks: Cinebench 15 (single/multi)
  10. 10. Benchmarks: AIDA64
  11. 11. Benchmarks: Adobe Photoshop CC 2015
  12. 12. Benchmarks: Adobe Premiere Pro CC 2015
  13. 13. Benchmarks: Handbrake (x264/x265)
  14. 14. Benchmarks: Microsoft Excel 2016
  15. 15. Benchmarks: Microsoft Word 2016
  16. 16. Benchmarks: Google Chrome - Mozilla Kraken
  17. 17. Benchmarks: 7Zip encoding
  18. 18. Benchmarks: WinRAR 5.20 encoding
  19. 19. Stroomverbruik: Cinebench 15 (Max)
  20. 20. Stroomverbruik: Idle
  21. 21. Benchmarks (GTX 960/980): F1 2015 (1920x1080 Medium/Ultra)
  22. 22. Benchmarks (GTX 960/980): GTA V (1920x1080 Medium/Ultra)
  23. 23. Benchmarks (GTX 960/980): Mad Max (1920x1080 Medium/Ultra)
  24. 24. Stroomverbruik (GTX 960): Cinebench 15 (Max)
  25. 25. Stroomverbruik (GTX 960): Idle
  26. 26. Overkloktest
  27. 27. Conclusie
  28. 1 besproken product

De diepte in: de Broadwell-E cores

Broadwell is zoals geschreven een tick en dus in de basis een bestaande architectuur uitgevoerd op een nieuw productieprocedé. Het maakt dat de architectuur van de cores is afgeleid van die van Haswell en slechts op kleine punten verschilt. De belangrijkste aanpassingen zetten we nog eens op een rij.

Voor bestaande code belooft Intel een gemiddelde IPC - instructions per clock - toename van zo'n vijf procent ten opzichte van de vorige generatie. Dat betekent dus dat bij een identiek aantal cores en een identieke klokfrequentie bestaande workloads gemiddeld zo'n 5% sneller verwerkt zullen worden. Wanneer software gebruikmaakt van nieuwe instructies, waarover verderop meer, kan de prestatiewinst veel groter zijn.

Onder meer op het vlak van floating point berekeningen zijn verdere optimalisaties doorgevoerd. Bij de Haswell generatie wist Intel de verwerktijd voor een FMA (Fused Multiply Add) instructie, ofwel een combinatie van vermenigvuldigen en optellen (A + B x C) terug te brengen van acht naar vijf klokslagen. Voor het doen van vermenigvuldigingsoperaties werd hetzelfde transistorpad gebruikt (maar dan zonder optelling), waardoor ook vermenigvuldig (MUL) instructies een latency van 5 kloks hadden. Die is bij Broadwell gereduceerd tot drie. De piek rekenkracht gemeten in FLOPS is identiek gebleven. Dankzij de AVX2 instructieset kan Broadwell net als Haswell 256-bit floating point getallen in één keer verwerken. Dankzij FMA, wat in feite twee floating point instructies in één is, en met twee AVX2-geschikte execution units per core, komen we zo op 2 x 2 x 256 = 1024 bits per keer, ofwel 16 double-precision (64-bit) floating-point operaties per klokslag.

De prestaties bij het deel algoritmes zijn ook verder toegenomen. De zogenaamde 1024 Radix Divider is bij double-precision instructies in latency verlaagd van 20 naar 14 klokslagen en voor andere getaltypes zijn er vergelijkbare afnames. Maar vooral het aantal klokslagen tussen twee opeenvolgende delingen is flink afgenomen.

 

De 5% wordt verder bewerkstelligd door verschillende andere zaken, zoals een grotere out-of-order scheduler (waardoor een groter aantal instructies in geoptimaliseerde volgorde kan worden uitgevoerd), betere voorspelling van geheugenadressen bij vertakkingen in software, een grote buffer voor het bijhouden van virtuele geheugenadressen en andere zaken.

In een eerdere test op basis van desktop Broadwell processors zagen we al dat de Broadwell architectuur in de Cinebench workload ten opzichte van Haswell een IPC-verbetering van zo'n 3,5% biedt. Bij een video-compressie workload was het verschil nog kleiner. Bij die test wisten we de 5% dus in ieder geval niet te behalen, hoewel die steekproef veel te klein is om een definitieve uitspraak over de IPC toename te doen. Bij onze test van de Broadwell serverprocessors zagen we gelijkaardige toenames. Hoe het ook zij; verwacht op dit vlak geen wonderen, zoals gebruikelijk bij een tick. Winst zit hem voornamelijk in extra cores, hogere klokfrequenties en meer overklokpotentieel.

Grotere prestatiewinsten zijn te behalen wanneer gebruikgemaakt wordt van nieuwe instructies in nieuw ontwikkelde en/of opnieuw gecompileerde software. Zo is Broadwell de eerste generatie waarbij TSX daadwerkelijk is ingeschakeld én zijn er nieuwe instructies voor security gerelateerde algoritmes. TSX ofwel Transactional Memory Extensions is echter een technologie die primair voor server workloads interessant is. In onze Broadwell-EP server review is dit uitgebreider beschreven. De versnelling voor encryptie-algoritmes zal ook primair bij servers voor winst zorgen, maar nu meer en meer communicatie over internet versleuteld is, kan het ook voor desktops effect hebben.

Een van de zaken die is verbeterd is dat Intel de verwerkingstijd van de zogenaamde PCLMULQDQ instructie, die onder andere gebruikt wordt in AES en CRC algoritmes, heeft teruggebracht van 7 naar 5 klokslagen. De multiplier throughput van deze instructie is verder verdubbeld. Het maakt dat AES encryptie zo'n 20% sneller kan worden uitgevoerd en CRC's zelfs bijna twee keer sneller worden uitgevoerd. Verder heeft Intel twee specifiek op security algoritmes gerichte nieuwe instructies geïntroduceerd, ADCX en ADOX. Wat deze precies doen valt buiten het bereik van dit artikel, maar deze instructies kunnen onder meer RSA encryptiealgoritmes flink versnellen, tot meer dan 50%.

Advertentie

1 besproken product

Vergelijk   Product Prijs
Intel Core i7 6950X Boxed

Intel Core i7 6950X Boxed

  • Socket 2011-3
  • 3.0 GHz
  • 10 cores
  • 140 W
Niet verkrijgbaar
0