VLIW5 en VLIW4
Eerst een blik op de bestaande situatie. De rekeneenheden binnen Barts zijn eigenlijk identiek aan die van de hele Radeon HD 5000 en zien er ingezoomed zo uit:
Cores van de Radeon HD 5xxx, 6850 en 6870 kaarten (VLIW5)
De shader units van Barts zaken telkens met z'n vijven gegroepeerd, waarbij er telkens vier identieke relatief simpele rekeneenheden zijn en één speciale. Die vier kunnen iedere klokslag elk een 32-bit floating point bewerking uitvoeren. Afhankelijk van het type instructie kunnen de vier units iedere klokslag gezamenlijk twee of één 64-bit (double precision in jargon) bewerking doen. De vijfde shader unit is de enige die een aantal speciale functies (trancendentals) kan uitvoeren, maar kan daarnaast ook nog ingezet worden voor 32-bit berekeningen.
De keuze voor deze architectuur was destijds valide. Het gros van de shader berekeningen binnen 3D-games was (en is) immers gebaseerd op 32-bit getallen en daarvan konden er per blok keurig vijf per klokslag uitgevoerd worden. De "speciale functies" werden zo weinig toegepast dat het in de praktijk geen probleem bleek dat slechts éénvijfde van de cores die kon uitvoeren.
Maar tijden veranderen... Nieuwe shader effecten vereisen steeds vaker 64-bit instructies.En zeker ook bij GPGPU-applicaties worden deze double precision berekeningen veelvuldig toegepast. Bij de Barts chip en de chips van alle Radeon HD 5000 kaarten is de vijfde shader unit in dergelijke gevallen telkens niets aan het doen en kan de chip feitelijk dus slechts viervijfde van z'n totale rekenkracht benutten. Zonde van de kostbare transistors!
Voor Cayman is AMD overgestapt op de volgene architectuur, aangeduid als VLIW4:
Cores van de Radeon HD 6900 (VLIW4)
De vijfde speciale shader unit is feitelijk opgeofferd en de vier overgebleven shader units zijn opgewaardeerd zodat ze gezamenlijk ook de uitzonderlijk voorkomende speciale functies van hun voormalig vijfde soortgenoot kunnen opvangen. De vier overgebleven shader units kunnen nog steeds vier 32-bit berekeningen per klokslag uitvoeren en afhankelijk van het type twee of één 64-bit berekening. Hoewel er voor de speciale functies nog moet worden teruggegrepen op de normale vier shader units, is het grote voordeel dat de nieuwe blokken van vier shader units fysiek een stuk kleiner zijn dan de voormalige blokken van vijf. Verder zal het in de praktijk nu veel vaker voorkomen dat alle shader units aan het werk gehouden kunnen worden, om piekprestaties te behalen. Daarnaast is het aansturen van de shader units nu een stuk simpeler, omdat ze allemaal gelijkwaardig zijn. Het verdelen van taken over de shader units binnen de chip kan zo een stuk efficiënter plaatsvinden.
AMD zelf geeft aan dat de overstap van VLIW5 naar VLIW4 omgerekend in de praktijk zo'n 10% betere prestaties per vierkante millimetere chipoppervlak opleveren. Je mag dus in feite zeggen dat je met deze architectuur 10% betere prestaties voor hetzelfde geld krijgt.
6 besproken producten
Vergelijk | Product | Prijs | |
---|---|---|---|
![]() |
AMD Radeon HD 6950 2GB
|
Niet verkrijgbaar | |
![]() |
AMD Radeon HD 6970
|
Niet verkrijgbaar | |
![]() |
Sapphire Radeon HD 6950 2GB
|
Niet verkrijgbaar | |
![]() |
Sapphire Radeon HD 6970 BFBC2 Vietnam Edition 2GB
|
Niet verkrijgbaar | |
![]() |
XFX Radeon HD 6950 2GB
|
Niet verkrijgbaar | |
![]() |
XFX Radeon HD 6970 2GB
|
Niet verkrijgbaar |