GM204 GPU: 28nm, maar toch vernieuwend
De basis voor de GeForce GTX 980 en 970 is de GM204 GPU, de opvolger van de GK104 die we kennen van onder meer de GeForce GTX 680 en de GTX 770. De nieuwe GPU wordt geproduceerd middels hetzelfde 28nm procedé als diens voorloper, waardoor Nvidia geen mogelijkheid had om enorm veel meer transistors te implementeren. Door slimme trucs en een beter ontwerp zijn de prestaties desalniettemin aanzienlijk verbeterd.
Dat gezegd hebbende, is de GM204 is wel degelijk groter dan de voorloper. De GK104 meet 294 mm² en huisvest 3540 miljoen transistors. De GM204 meet 398 mm² en heeft 5200 miljoen transistors. Wie snel rekent, ziet dat het chipoppervlak 35% is toegenomen en het aantal transistors 47%. Ondanks hetzelfde procedé is het Nvidia met een slimmer ontwerp dus toch gelukt om meer transistors per vierkante millimeter te plaatsen.
Net als bij de GM107 is de GM204 opgetrokken uit zogenaamde Stream Multiprocessors, die elk bestaan uit 128 shader units. De GM204 heeft 16 van deze SM's, wat neerkomt op 2048 cores in totaal. Dat is 33% meer dan bij de GK104 en aangezien de cores bij de nieuwe chip in zestien groepjes zijn opgedeeld, in plaats van 8 groepjes zoals bij de voorloper, is het makkelijker om zoveel mogelijk cores tegelijkertijd aan het werk te houden. Vergeet niet: alle units binnen een SM's moeten op ieder moment in tijd bezig zijn met dezelfde bewerking, zij het op andere data.
Zoals we ook al schreven in onze GTX 750 review is de verhouding van texture units ten opzichte van shader units verlaagd van 1:12 naar 1:16. De reden hiervoor is dat Nvidia ziet dat met moderne games en hoge resoluties de prestatie-bottleneck op andere plekken in de chip zit. De belangrijkste bottleneck die is aangepakt, is het aantal rendering outputs (ROP's), ofwel het chiponderdeel waar uiteindelijk alle pixeldata wordt verzameld en verwerkt. Dat waren er 32 bij de GK104 en dat aantal is bij de GM204 verdubbeld naar 64, wat overigens ook meer is dan bij de GK110. Dit is misschien wel dé reden waarom de GTX 980 en GTX 970 in hoge resoluties duidelijk beter presteren dan hun voorlopers.
De GM204 heeft net als de directe voorloper een 256-bit geheugenbus. Toch presteren de nieuwe kaarten juist in situaties waar de geheugentoegang voor de GPU de bottleneck is veel beter. Dat heeft twee belangrijke redenen: allereerst is de centrale L2-cache van de GPU - in feite de belangrijkste buffer voor het geheugen - vergroot van 512 kB naar 2 MB. Ook hier geldt: dat is zelfs meer dan bij de GK110. Daarnaast gebruikt Nvidia een nieuwe generatie algoritme voor lossless kleurcompressie, dat er voor zorgt dat de data die daadwerkelijk tussen geheugen en GPU getransporteerd moet worden een stuk kleiner is.
In een grafiek in haar officiële presentatie laat Nvidia zien dat bij een aantal populaire games de kleurcompressie het geheugengebruik met zo'n 25% kan reduceren. Nvidia's marketeers vertalen dat naar "een 33% hogere geheugenbandbreedte in de prakijk". Het verschil met de 384-bit bus van de GK110 zou daarmee al grotendeels geslecht zijn.
De compressietechnologie, maar vooral de vele optimalisaties binnen de cores zorgen ervoor dat de GM204 in de praktijk energie-efficiënter werkt dan de chips uit de vorige generatie, wat we overigens bij de Maxwell-chip van de GTX 750 ook al zagen. Onze stroomverbruiktests verderop in dit artikel zijn wat dat betreft het interessantst, maar ook een vergelijking van de specificaties van de snelste kaarten op basis van de verschillende chips spreekt al boekdelen: de snelste GK104 kaart (GTX 770) heeft een TDP van 230 watt. De snelste GM204 kaart (GTX 980) heeft een TDP van slechts 165 watt. Desondanks is die laatste, zoals we verderop zullen zien, een stuk sneller.
In de onderstaande tabel zijn de eigenschappen van de GK104, GK110 en GM204 nog eens overzichtelijk naast elkaar gezet.
GPU | GK104 | GK110 | GM204 |
---|---|---|---|
Cuda cores | 1536 | 2880 | 2048 |
SM's | 8 | 15 | 16 |
Geheugenbus | 256-bit | 384-bit | 256-bit |
Texture units | 128 | 240 | 128 |
ROP's | 32 | 48 | 64 |
L2-cache | 0,5 MB | 1,5 MB | 2 MB |
Chip grootte | 294 mm² | 561 mm² | 398 mm² |
Transistors | 3540 mln | 7080 mln | 5200 mln |
Productieprocedé | 28 nm | 28 nm | 28 nm |
Snelste kaart | GTX 770 | GTX 780 Ti | GTX 980 |
Klokfrequentie | 1046 MHz | 876 MHz | 1126 MHz |
Boost | 1085 MHz | 928 MHz | 1216 MHz |
Geheugen | 1753 MHz | 1750 MHz | 1750 MHz |
TDP | 230W | 250W | 165W |
TFlops (Boost clock) | 3,4 TFlops | 5,3 TFlops | 5 TFlops |
2 besproken producten
Vergelijk | Product | Prijs | |
---|---|---|---|
![]() |
Nvidia GeForce GTX 970
|
Niet verkrijgbaar | |
![]() |
Nvidia GeForce GTX 980
|
Niet verkrijgbaar |