AMD Radeon HD 7970 review

1 besproken product
Inhoudsopgave
  1. 1. Inleiding
  2. 2. Radeon HD 7970 kaart
  3. 3. Fotoserie
  4. 4. Tahiti-chip: 28 nm transistors
  5. 5. Graphics Core Next
  6. 6. Graphics Core Next (2)
  7. 7. PCI-Express 3.0 en DirectX 11.1
  8. 8. 3D-schermen
  9. 9. EyeFinity 2.0
  10. 10. Video-encoder en GPGPU
  11. 11. Stroombesparing
  12. 12. Benchmarks
  13. 13. 3DMark Vantage (i7 965)
  14. 14. 3DMark 11 (i7 965)
  15. 15. Aliens vs. Predator (i7 965)
  16. 16. Crysis 2 (i7 965)
  17. 17. Dirt 3 (i7 965)
  18. 18. F1 2011 (i7 965)
  19. 19. Far Cry 2 (i7 965)
  20. 20. Hard Reset (i7 965)
  21. 21. Heaven 2.0 (i7 965)
  22. 22. Lost Planet 2 (i7 965)
  23. 23. Metro 2033 (i7 965)
  24. 24. S.T.A.L.K.E.R. Call of Pripyat (i7 965)
  25. 25. Stroomverbruik (i7 965)
  26. 26. 3DMark Vantage (i7 3960X)
  27. 27. 3DMark11 (i7 3960X)
  28. 28. Aliens versus Predator (i7 3960X)
  29. 29. Batman: Arkham City (i7 3960X)
  30. 30. Battlefield 3 (i7 3960X)
  31. 31. Crysis 2 (i7 3960X)
  32. 32. Dirt 3 (i7 3960X)
  33. 33. Hard Reset (i7 3960X)
  34. 34. Heaven 2.5 (i7 3960X)
  35. 35. Metro 2033 (i7 3960X)
  36. 36. The Elder Scrolls V Skyrim (i7 3960X)
  37. 37. Total War Shogun 2 (i7 3960X)
  38. 38. Geluidsproductie
  39. 39. Conclusie
  40. 1 besproken product

Graphics Core Next (2)

Wat is nu het grote verschil met AMD's vorige architectuur (VLIW) en Graphics Core Next?

De Cayman chip van de Radeon HD 6970 bestond uit 24 SIMD engines, die elk bestonden uit 16 groepjes van vier rekeneenheden. Op die manier zaten er 16 x 4 = 64 rekeneenheden in een enkele SIMD-engine. Op ieder moment in tijd moesten alle groepjes van vier rekeneenheden dezelfde instructie uitvoeren op andere data. Ofwel: een complexe combinatie van vier instructies - vandaar Very Long Instruction Word - gelijktijdig op zestien stukken data.

In de praktijk bleek het erg lastig om alle rekeneenheden de hele tijd bezig te houden. Zeker wanneer er veel interne afhankelijkheden in code zitten, bleek het in veel gevallen ondoenlijk om instructies te vinden die veilig gecombineerd konden worden en gelijktijdig op veel verschillende data uitgevoerd kunnen worden. Het verdelen en klaarzetten van instructies was zodoende een zeer complexe aangelegenheid binnen AMD's vorige architectuur. Daarbij kwam nog: VLIW4 mag voor typische 3D-berekeningen prima geschikt zijn, voor veel GPGPU-berekeningen was de opzet niet optimaal.

Graphics Core Next werkt anders. In iedere compute unit zitten zoals beschreven 64 rekeneenheden. Deze zijn verdeeld in vier SIMD-units. Ofwel: op ieder moment in tijd kunnen binnen een compute unit maximaal vier verschillende instructies uitgevoerd worden, die elk plaatsvinden op zestien verschillende stukken data. Verschillende instructies hoeven echter niet meer gecombineerd te worden om groepjes van vier telkens op een eenduidige manier bezig te houden. Ieder SIMD-blok van 16 rekeneenheden kan binnen GCN geheel onafhankelijk werken. Het doorvoeren en klaarzetten van instructies is op die manier een stuk eenvoudiger.

De theoretische maximale prestaties van een voormalige VLIW4 SIMD-engine en een nieuwe GCN compute engine zijn identiek: beide bevatten 64 rekeneenheden en kunnen zodoende 64 single precision floating point berekeningen per klokslag afleveren. Dat maakt dat de Tahiti chip met in totaal 2048 rekeneenheden in theorie 33,3% sneller kan zijn dan de Cayman chip met in totaal 1536 rekeneenheden. Maar juist omdat het aansturen van de rekeneenheden en het verdelen van instructies van GCN veel flexibeler is, is de kans veel groter, dat alle rekeneenheden op een bepaald moment in tijd daadwerkelijk gebruikt kunnen worden. In de praktijk zou het prestatieverschil dus veel meer dan die 33,3% kunnen zijn.

Met één ding moeten we wel rekening houden: een nieuwe architectuur vergt veel optimalisaties op driver-niveau. Het is al de normaalste zaak van de wereld, maar zeker bij de Radeon HD 7970 mogen we in de maanden na de lancering nog de nodige prestatiewinst dankzij driveroptimalisaties verwachten.

Advertentie

1 besproken product

Vergelijk   Product Prijs
AMD Radeon HD 7970

AMD Radeon HD 7970

  • Tahiti
  • 2048 cores
  • 925 MHz
  • 3072 MB
  • 384 bit
  • DirectX 12 fl 11_1
  • PCI-Express 3.0 x16
Niet verkrijgbaar
0