Benchmarks: Creator mode versus Game mode, DDR4-2667 versus DDR4-3200
Op pagina vier van dit artikel deden we al uitgebreid uit de doeken dat Threadripper bestaat uit twee chips met elk 8 cores en twee geheugenkanalen en die die twee chips communiceren via Infinity Fabric. De communicatie tussen beide chips zorgt hoe je het ook wendt of keert voor extra latency wanneer een core uit chip één data nodig heeft uit een L3-cache segment in chip 2 of een geheugenmodule verbonden aan chip 2.
Op pagina vijf beschreven we dat je via de Ryzen Master software de Threadripper CPU's kunt omzetten van Creator mode naar Game mode, waarbij het geheugen primair lokaal wordt aangesproken en de cores van één van beide chips worden uitgeschakeld. De Game Mode zorgt voor compatibiliteit bij applicaties die zich verslikken in grote aantallen virtuele cores en voor in potentie betere prestaties bij workloads die meer schakelen bij lage latencies voor het verkrijgen van data dan bij meer cores of hogere geheugen bandbreedte. Hét voorbeeld van dergelijke workloads is games, vandaar ook de naam Game Mode.
We weten dat de Infinity Fabric werkt op de geheugenklokfrequentie en dat het plaatsen van sneller geheugen dus als bijeffect heeft dat de verschillende processoronderdelen ook sneller met elkaar kunnen communiceren. Net als bij Ryzen is het plaatsen van sneller geheugen bij Threadripper op z'n minst op papier een methode om de prestaties te laten toenemen.
Om de proef op de som te nemen of de Game Mode voor games écht een effect bewerkstelligt, hebben we de game benchmarks nog eens gedraaid in Game Mode en daarnaast ook met een hogere snelheid geheugen (DDR4-3200) in zowel Creator als Game mode. Voordat we naar die resultaten gaan kijken, eerst een aantal andere tests, die inzichtelijk maken wat het effect is van de Game Mode en het snellere geheugen.
In onderstaande tabel zie je allereerst de Cinebench 15 score. Bij de Game Mode wordt de score bijna gehalveerd; nogal wiedes, de helft van de cores wordt uitgeschakeld. Echter; het feit dat de uiteindelijke score 55% in plaats van 50% van de standaard score is, bewijst dat de multi-core schaling over twee dies niet perfect is. Bij een workload als Cinebench hebben de verschillende threads geen data nodig van andere threads en werken ze puur in hun eigen geheugensegment en past de benodigde data (grotendeels) in een eigen L3-segment. Het maakt dat sneller geheugen en daarmee een snellere Infinity Fabric bus eigenlijk geen effect heeft op de score.
Met SiSoft Sandra hebben we de geheugenbandbreedte gemeten en je ziet dat die in Game Mode ook vrijwel door tweeën gaat, aangezien de data van programmathreads zo veel en goed mogelijk puur op de eigen die aangesloten geheugenmodules wordt geplaatst, waardoor je de facto dual-channel in plaats van quad-channel DDR4 geheugenprestaties hebt. De CPU-prestaties en de geheugenbandbreedte gaan dus ruwweg door twee, maar de wachttijd bij het opvragen van nieuwe data wordt duidelijk korter.
Sandra kan de latencies keurig meten over verschillende ranges van datagroottes, waardoor we de latency van de L1-cache, de L2-cache, de eigen L3-cache, de L3-cache in een andere CCX, de L3-cache in een andere die en het geheugen los van elkaar inzichtelijk kunnen maken.
De latency van het ophalen van data in de eigen L1 en L2 cache van core verandert uiteraard niet met de verschillende instellingen. Ook data ophalen in het gedeelte van de L3-cache van de CCX zou in theorie even snel moeten gaan, aangezien hier de nog relatief lange Infinity Fabric databus bij komt kijken, maar we meten bij de game mode een te verwaarlozen verschil. Het halen van data uit de L3-cache van de andere CCX uit dezelfde die (waarbij data dus over Infinity Fabric binnen dezelfde chip gaat), gaat in Game Mode iets sneller. De verklaring die wij ervoor hebben is dat je bij het opvragen van data uit L3 altijd moet opvragen of alle cores binnen het systeem niet toevallig een nieuwe versie van diezelfde data in hun lokale L1- of L2-cache hebben (zogenaamde snooping) en met de helft van de cores uitgeschakeld gaat dat wat sneller. Het snellere geheugen (DDR4-3200) zorgt voor een duidelijke prestatiewinst op deze L3 latency, van 20,9 ns naar 18,8 ns, simpelweg dus omdat de Infinity Fabric bus sneller werkt.
In de 16 tot 32 MB range wordt het interessant, daar wordt immers data opgehaald uit de L3-cache die in de tweede die is geplaatst. We zien dat in Creator Mode deze latency zo'n vier keer zo hoog is als de lokale L3-cache. Dat is een aanzienlijk verschil en bewijst dat in workloads waar de cores niet met hun eigen ding bezig zijn, maar onderling data moeten uitwisselen, Threadripper in potentie minder schaalt dan een CPU waar alle cores in één chip zitten (zoals de Intel Skylake-X CPU's). Bij de Game Mode wordt samen met de helft van de cores ook de helft van de L3-cache uitgeschakeld en is er dus geen "ver" L3-cache geheugen. De latency in het 16 tot 32 MB segment is hier dus de facto het eerste gedeelte van het geheugen.
De geheugen latency blijkt identiek aan de latency voor L3-segment in de andere die. Hieruit mogen we wel afleiden dat qua latency in beide gevallen de Infinity Fabric but tussen de chips de bottleneck is. Dat wordt nog extra duidelijk als we de resultaten met DDR4-3200 en dus een snellere Infinity Fabric bus ernaast leggen; zowel in Creator Mode als in Game Mode wordt de latency voor ver L3-cache en geheugen zo'n 12% lager. Hier zien we wel hét effect van de Game Mode: de geheugen latency gaat terug van zo'n 80 ns naar 60 ns, een kwart minder dus.
Modus / Geheugen | Creator 2666C14 |
Game 2666C14 |
Creator 3200C14 |
Game 3200C14 |
---|---|---|---|---|
Cinebench 15 score | 3020 | 1678 | 3016 | 1689 |
SiSoft Sandra - Memory Bandwidth | 54,5 GB/s | 31,6 GB/s | 62,8 GB/s | 36,8 GB/s |
SiSoft Sandra - Latency 0 - 32 kB (L1) | 1,0 ns | 1,0 ns | 1,0 ns | 1,0 ns |
SiSoft Sandra - Latency 32 - 512 kB (L2) | 3,0 ns | 3,1 ns | 3,1 ns | 3,1 ns |
SiSoft Sandra - Latency 512 kB - 8 MB (L3, eigen CCX) | 7,9 ns | 8,0 ns | 7,9 ns | 8,1 ns |
SiSoft Sandra - Latency 8 - 16 MB (L3, andere CCX zelfde die) | 20,9 ns | 19,5 ns | 18,8 ns | 18,1 ns |
SiSoft Sandra - Latency 16 - 32 MB (L3, andere die) | 81,3 ns | 58,8 ns | 71,5 ns | 52,2 ns |
SiSoft Sandra - Latency 32 MB - 1 GB (RAM geheugen) | 81,8 ns | 59,4 ns | 71,9 ns | 53,1 ns |
Wat betekent dit nu allemaal voor games? Onderstaande tabel toont de resultaten. Nu moet gezegd worden, dat onze selectie games primair moderne spellen zijn, terwijl de Game Modus juist bij oudere spellen problemen kan oplossen. Nieuwe spellen zijn simpelweg al geschikter voor processors met extreem veel cores als AMD Threadripper. Maar goed, spellen uit 2013 had je maar in 2013 moeten spelen, zullen we maar zeggen. ;)
In Prey zien we dat de Game mode een negatief effect heeft op de prestaties. Sneller geheugen zorgt voor meetbaar betere prestaties. In The Witcher 3 is Creator versus Game mode lood om oud ijzer en doet ook sneller geheugen niet veel. In GTA V is de Game Mode wél sneller, maar het verschil is zo klein dat het ons het opnieuw opstarten van je PC niet waard zou zijn. Sneller geheugen levert overigens meer prestatiewinst op dan de Game Mode. Bij Battlefield 1 zijn beide modi lood om oud ijzer, maar heeft sneller geheugen wel effect. Bij Doom scoort alles 199,9 fps; deze CPU is in alle standen snel genoeg voor deze game. In Rise of the Tomb Raider, ook een moderne DX12 game, zien we dat er opnieuw vrijwel geen verschil zit tussen de modi en zorgt sneller geheugen voor een duidelijk meetbare prestatiewinst. In Hitman presteert Game Mode zelfs slechter. Opnieuw zorgt sneller geheugen voor betere prestaties.
Modus / Geheugen | Creator 2666C14 |
Game 2666C14 |
Creator 3200C14 |
Game 3200C14 |
---|---|---|---|---|
Game benchmarks | ||||
Prey - 1920x1080 - Medium | 221,8 fps | 180,2 fps | 228,1 fps | 184,2 fps |
Prey - 1920x1080 - Ultra | 207,6 fps | 182,4 fps | 218,0 fps | 180,5 fps |
The Witcher 3 - 1920x1080 - Medium | 245,3 fps | 243,9 fps | 245,6 fps | 248,6 fps |
The Witcher 3 - 1920x1080 - Ultra | 135,8 fps | 133,7 fps | 135,1 fps | 135,1 fps |
GTA V - 1920x1080 - Medium | 113,6 fps | 118,6 fps | 120,0 fps | 122,7 fps |
GTA V - 1920x1080 - Ultra (2x MSAA, 0x Refl. MSAA) | 60,9 fps | 61,3 fps | 61,5 fps | 63,2 fps |
Battlefield 1 (DX12) - 1920x1080 - Medium | 129,2 fps | 130,9 fps | 133,5 fps | 148,4 fps |
Battlefield 1 (DX12) - 1920x1080 - Ultra | 108,8 fps | 108,7 fps | 115,9 fps | 120,6 fps |
Doom (Vulkan) - 1920x1080 - Medium | 199,9 fps | 199,9 fps | 199,9 fps | 200,0 fps |
Doom (Vulkan) - 1920x1080 - Ultra | 199,9 fps | 199,9 fps | 199,9 fps | 200,0 fps |
Rise of the Tombraider (DX12) - 1920x1080 - Medium | 161,2 fps | 163,6 fps | 172,2 fps | 178,5 fps |
Rise of the Tombraider (DX12) - 1920x1080 - Ultra | 144,2 fps | 141,0 fps | 152,3 fps | 150,4 fps |
Hitman (DX12) - 1920x1080 - Medium | 117,3 fps | 114,3 fps | 133,6 fps | 124,9 fps |
Hitman (DX12) - 1920x1080 - Ultra | 108,1 fps | 106,1 fps | 123,4 fps | 115,7 fps |
Game benchmarks (frame times) | ||||
Prey - 1920x1080 - Medium | 124,2 fps | 121,5 fps | 125,8 fps | 122,9 fps |
Prey - 1920x1080 - Ultra | 114,5 fps | 121,2 fps | 124,4 fps | 121,1 fps |
The Witcher 3 - 1920x1080 - Medium | 184,2 fps | 180,5 fps | 188,3 fps | 196,1 fps |
The Witcher 3 - 1920x1080 - Ultra | 107,5 fps | 105,4 fps | 107,1 fps | 105,9 fps |
GTA V - 1920x1080 - Medium | 83,3 fps | 83,3 fps | 90,9 fps | 90,9 fps |
GTA V - 1920x1080 - Ultra (2x MSAA, 0x Refl. MSAA) | 47,6 fps | 43,5 fps | 45,5 fps | 41,7 fps |
Battlefield 1 (DX12) - 1920x1080 - Medium | 78,7 fps | 81,3 fps | 82,6 fps | 94,3 fps |
Battlefield 1 (DX12) - 1920x1080 - Ultra | 71,4 fps | 69,0 fps | 75,2 fps | 78,7 fps |
Doom (Vulkan) - 1920x1080 - Medium | 172,4 fps | 172,4 fps | 172,4 fps | 175,4 fps |
Doom (Vulkan) - 1920x1080 - Ultra | 169,5 fps | 169,5 fps | 169,5 fps | 172,4 fps |
In onderstaande tabel zie je het gemiddelde effect wanneer we alle hierboven getoonde games/settings meenemen. We zien dat de Game Mode in onze test gemiddeld een prestatie-afname in plaats van -toename realiseert, van gemiddeld 3,1%. Bij oudere games zal het wellicht andersom zijn. Het advies van AMD zouden wij graag willen herhalen: laat je Threadripper systeem lekker in Creator Mode staan en gebruik die Game Mode alleen als je een oude game hebt die echt niet werkt.
Het effect van sneller geheugen is duidelijk meetbaar, gemiddeld 4,1%. Maar goed, ook dit is een theoretisch voordeel te noemen. Menig wetenschappelijk studie heeft aangetoond dat een prestatieverschil minimaal 10% moet zijn wil je het daadwerkelijk kunnen merken in plaats van meten. Als je dan ook nog bedenkt dat 64 GB (geen gekke hoeveelheid voor een high-end desktop systeem) DDR4-3200 al snel zo'n 100 à 150 euro duurder is (zie hier bijvoorbeeld het prijsverschil voor Corsair Vengeance LPX kits), dan mag je concluderen dat je het verschil tussen DDR4-2667 en DDR4-3200 vermoedelijk voornamelijk in je portemonnee merkt.
Pretatieverschil bij games | |
---|---|
Effect Game Mode | |
Game Mode (DDR4-2667) versus Creator Mode (DDR4-2667) | -3,2% |
Game Mode (DDR4-3200) versus Creator Mode (DDR4-3200) | -3,0% |
Gemiddeld | -3,1% |
Effect Sneller Geheugen | |
DDR4-3200 versus DDR4-2667 (Creator Mode) | 4,0% |
DDR4-3200 versus DDR4-2667 (Game Mode) | 4,2% |
Gemiddeld | 4,1% |
Effect combinatie | |
Game Mode (DDR4-3200) versus Creator Mode (DDR4-2667) | 0,9% |
2 besproken producten
Vergelijk | Product | Prijs | |
---|---|---|---|
![]() |
AMD Ryzen Threadripper 1920X Boxed
|
Niet verkrijgbaar | |
![]() |
AMD Ryzen Threadripper 1950X Boxed
|
Niet verkrijgbaar |