[Pro] Intel Xeon E5 v4 Broadwell-EP review: Broadwell voor servers

1 besproken product
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Socket compatible, maar toch nieuw
  3. 3. Modellen
  4. 4. Broadwell core-verbeteringen
  5. 5. TSX: Nu écht beschikbaar
  6. 6. Security en virtualisatie
  7. 7. Power management
  8. 8. Testplatform
  9. 9. Benchmarks Windows Server: HPC (3D-rendering en Financial Analysis)
  10. 10. Benchmarks Windows Server: HPC (Fluid Dynamics, Mathematics en Cryptografie)
  11. 11. Benchmarks Windows Server: Geheugenbandbreedte
  12. 12. Benchmarks Windows Server: Stroomverbruik en performance-per-watt
  13. 13. Benchmarks CentOS: Percona TPC-C MySQL benchmark
  14. 14. Benchmarks Ubuntu Server: Phoronix (1)
  15. 15. Conclusie
  16. 1 besproken product

Broadwell core-verbeteringen

Broadwell is zoals geschreven een tick en dus in de basis een bestaande architectuur uitgevoerd op een nieuw productieprocedé. Het maakt dat de architectuur van de cores is afgeleid van die van Haswell en slechts op kleine punten verschilt. 

Voor bestaande code belooft Intel een gemiddelde IPC - instructions per clock - toename van zo'n vijf procent ten opzichte van de vorige generatie. Dat betekent dus dat bij een identiek aantal cores en een identieke klokfrequentie bestaande workloads gemiddeld zo'n 5% sneller verwerkt zullen worden. Wanneer software gebruik maakt van nieuwe instructies, waarover verderop meer, kan de prestatiewinst veel groter zijn.

 

Onder meer op het vlak van floating point berekeningen zijn verdere optimalisaties doorgevoerd. Bij de Haswell generatie wist Intel de verwerktijd voor een FMA (Fused Multiply Add) instructie, ofwel een combinatie van vermenigvuldigen en optellen (A + B x C) terug te brengen van acht naar vijf klokslagen. Voor het doen van vermenigvuldigingsoperaties werd hetzelfde transistorpad gebruikt (maar dan zonder optelling), waardoor ook vermenigvuldig (MUL) instructies een latency van 5 kloks hadden. Die is bij Broadwell gereduceerd tot drie. De piek rekenkracht gemeten in FLOPS is identiek gebleven. Dankzij de AVX2 instructieset kan Broadwell net als Haswell 256-bit floating point getallen in één keer verwerken. Dankzij FMA, wat in feite twee floating point instructies in één is, en met twee AVX2-geschikte execution units per core, komen we zo 2 x 2 x 256 = 1024 bits per keer, ofwel 16 double-precision (64-bit) floating-point operaties per klokslag. 

De prestaties bij het deel algoritmes zijn ook verder toegenomen. De zogenaamde 1024 Radix Divider is bij double-precision instructies in latency verlaagd van 20 naar 14 klokslagen en voor andere getaltypes zijn er vergelijkbare afnames. Maar vooral het aantal klokslagen tussen twee opeenvolgende delingen is flink afgenomen.

De 5% wordt verder bewerkstelligd door verschillende andere zaken, zoals een grotere out-of-order scheduler (waardoor een groter aantal instructies in geoptimaliseerde volgorde kan worden uitgevoerd), betere voorspelling van geheugenadressen bij vertakkingen in software, een grote buffer voor het bijhouden van virtuele geheugenadressen en andere zaken. 

In een eerdere test op basis van desktop Broadwell processors zagen we al dat de Broadwell architectuur in de Cinebench workload ten opzichte van Haswell een IPC-verbetering van zo'n 3,5% biedt. Bij een video-compressie workload was het verschil nog kleiner. Bij die test wisten we de 5% dus in ieder geval niet te behalen, hoewel die steekproef veel te klein is om een definitieve uitspraak over de IPC toename te doen. Hoe het ook zij; verwacht op dit vlak geen wonderen, zoals gebruikelijk bij een tick.

Grotere prestatiewinsten zijn te behalen wanneer gebruik gemaakt wordt van nieuwe instructies in nieuw ontwikkelde en/of gehercompileerde software. Zo is Broadwell de eerste generatie Xeon E5 CPU's waarbij TSX daadwerkelijk is ingeschakeld én zijn er nieuwe instructies voor security gerelateerde algoritmes.

Advertentie

1 besproken product

Vergelijk   Product Prijs
Intel Xeon E5-2699 v4 Tray

Intel Xeon E5-2699 v4 Tray

  • Socket 2011-3
  • 2.2 GHz
  • 22 cores
  • 145 W
Niet verkrijgbaar
0