RV770 ontleed
De architectuur van de RV770 is voor grote gedeeltes gebaseerd op de architectuur van de RV670, maar op veel plekken flink verbeterd. De basis wordt gevormd door niet minder dan 800 unified shaders, door ATI omgedoopt tot stream processing units. Ter vergelijking: de RV670 moest het doen met 320 rekeneenheden. Net als bij de RV670 zijn de shader opgedeeld in groepjes van 5, waarvan er telkens één van de vijf geschikt is voor double precision berekeningen. In feite verschillen deze shader blokken niet van de vorige generatie GPU, behalve dat ATI ze fysiek een stuk kleiner en dus zuiniger heeft gemaakt.
Het blokdiagram van de RV770 chip
De 800 shaders zijn verder opgedeeld in 10 SIMD cores, die elk dus bestaan uit 16 blokken met 5 shaders. Nieuw is de komst van 16 kB lokaal geheugen per core; hierdoor kunnen shader units zeer snel data met elkaar uitwisselen, zonder dat daarvoor gebruik gemaakt hoeft te worden van achterliggende caches of, erger nog, het RAM-geheugen van de GPU. Dit is vooral ook belangrijk voor wanneer de GPU wordt ingezet voor andere zaken dan 3D, waarover verderop meer.
De RV770 heeft in totaal een 40-tal texture units. Achter iedere SIMD-core van 80 shaders, zit een blok met daar in 4 van deze texture units. Om de prestaties verder te verbeteren heeft ATI ieder blok van texture units verbonden met een eigen stuk L1 texture cache. Hieruit kan met een gigantische snelheid van 480 GByte/s texture data uit gevist worden om verwerkt te worden. Hierdoor is de RV770 op dit vlak zo'n 2,5x sneller dan zijn voorloper. Deze 10 afzonderlijk stukken L1 texture cache zijn via een Crossbar-switch verbodnden met vier grotere blokken L2 cache. Deze vier blokken zijn juist weer verbonden met de vier gedeeltes van de geheugencontroller. Tussen de L1 en L2 cache bestaat een bandbreedte van zo'n 384 GByte/s.
De render backends, onderin het blokschema bovenaan deze pagina, zijn ook verder geoptimaliseerd. ATI heeft er alles aan gedaan om het prestatieverlies bij full scene anti-aliasing zo ver mogelijk terug te dringen en dat lijkt aardig gelukt. De vier render backends van de RV770 kunnen net als die van de RV670 16 pixels per klokslag verwerken wanneer er geen AA wordt toegepast. Bij 2x of 4x FSAA valt de RV670 terug naar 8 pixels per klokslag, terwijl de RV770 er 16 blijft doen. Ofwel: de belofte is dus dat je 4x FSAA kunt toepassen zonder noemenswaardig prestatieverlies! Bij 8x FSAA viel de RV670 terug naar vier pixels per klokslag en doet de RV770 er acht.
4x FSAA kan bij de RV770 zonder noemenswaardig performanceverlies toegepast worden.
3 besproken producten
Vergelijk | Product | Prijs | |
---|---|---|---|
![]() |
Asus EAH4850/HTDI/512M
|
Niet verkrijgbaar | |
![]() |
ATI Radeon HD 4850
|
Niet verkrijgbaar | |
![]() |
Sapphire Radeon HD 4850 512MB GDDR3
|
Niet verkrijgbaar |