Origineel bericht 21-09-2022, 14:41 –
Met de onthulling van Nvidia’s RTX 4000-serie komen de eerste custom videokaarten van de add-in-boardpartners naar buiten. Galax heeft niet alleen enkele opvallende ontwerpen getoond, de fabrikant heeft ook meer specificaties over de Lovelace-gpu’s zelf bekendgemaakt.
Galax heeft de eerste RTX 4000-kaarten met een anime-thema onthuld, die enkel op de Chinese markt lijken gericht te zijn.
Het is niet bepaald een verrassing dat de RTX 4090 gebruikmaakt van de AD102-300-gpu, de gpu-keuze voor de RTX 4080-kaarten is dan wel weer opmerkelijk: de 16GB-uitvoering heeft de AD103-300-chip met 9.728 cuda-cores aan boord, terwijl de 12GB-variant het moet doen met de AD104-400 met 7.680 rekenkernen.
De RTX 4080 16 GB krijgt daadwerkelijk sneller geheugen (23 Gbps) dan de RTX 4090.
Op basis van eerdere geruchten ziet het ernaar uit dat Nvidia de onaangekondigde 4070 heeft gerebrand naar de 12GB-editie van de RTX 4080. De krachtigste RTX 4080 heeft namelijk een kwart meer cuda-cores dan zijn kleinere broer, ook de geheugenbus is een derde breder. Terwijl beide de naam RTX 4080 dragen, blijkt er dus een stevig verschil te zijn op basis van de specificaties.
Update 23-09-2022, 13:34 –
Ryan Smith van AnandTech heeft meer informatie te pakken gekregen over de Lovelace-gpu’s. Zo komen de precieze oppervlaktes van de drie onthulde videochips aan bod, alsook het aantal transistoren. De tot dusver laagst gesegmenteerde AD104 van de RTX 4080 12 GB heeft niet minder dan 35,8 miljard transistors aan boord, ofwel 26,5% meer dan de volledig ingeschakelde GA102 van de RTX 3090 Ti.
Videokaart | RTX 3090 Ti | RTX 4080 12 GB | RTX 4080 16 GB | RTX 4090 |
---|---|---|---|---|
GPU | GA102 | AD104 | AD103 | AD102 |
Die size | 628 mm² | 294,5 mm² | 378,6 mm² | 608 mm² |
Transistors | 28,3 miljard | 35,8 miljard | 45,9 miljard | 76,3 miljard |
Streaming Multiprocessors | 84 | 60 | 80 | 144 |
Render Output Units | 112 | 80 | 112 | 192 |
Cuda-cores | 10.752 | 7.680 | 10.240 | 18.432 |
Tensor-cores | 336 | 240 | 320 | 579 |
Raytracing-cores | 84 | 60 | 80 | 144 |
L2-cache | 6 MB | 48 MB | 64 MB | 96 MB |
Geheugen | 24 GB GDDR6X | 12 GB GDDR6X | 16 GB GDDR6X | 24 GB GDDR6X |
Geheugenbus | 384-bit | 192-bit | 256-bit | 384-bit |
Dankzij het gebruik van TSMC’s 4N-procedé kan Nvidia deze rekenkracht in een relatief kleine vormfactor proppen: AD102 is 20 mm² kleiner dan GA102 (-3,2%) en beschikt over maar liefst 2,7 keer meer transistors dan het Ampere-vlaggenschip. Een kanttekening: volgens HKEPC is 4N geen 4nm-proces, maar een geoptimaliseerde variant van 5nm met een hogere dichtheid. Opmerkelijk, aangezien de fabrikant zelf de term 4nm gebruikt in bepaalde marketingmaterialen.
Verder wordt bevestigd dat de RTX 40-serie aanzienlijk meer L2-cache biedt. Waar AD104 met 48 MB acht keer meer L2 heeft dan de GA102-chip, heeft het Lovelace-topmodel maar liefst 16 keer meer cache dan zijn voorganger (96 MB).
Bronnen: Galax, Wccftech, Ryan Smith (Twitter), HKEPC (Twitter), Videocardz