Afgelopen woensdag bleek dat AMD een ROCm-update heeft uitgebracht, waarin ondersteuning is toegevoegd voor verschillende RDNA-gpu's. Van onder andere de vermeende Big Navi-gpu's zagen we vermeldingen, en nu blijkt dat er nog veel meer informatie is opgedoken.
De nieuwe informatie is door dezelfde Redditor genaamd 'Stblr' ontdekt in een macOS 11-bèta. Hier blijkt ook Navi 31 in genoemd te worden, de eerste chip waarvan we weten dat hij vermoedelijk gebruik moet maken van de RDNA 3-architectuur. Hij is erg vergelijkbaar met Navi 21, de chip die we ook wel kennen als 'Big Navi'. Afgelopen woensdag bleek dat Navi 21 zou worden voorzien van 80 compute units in totaal. Als elke cu nog steeds 64 streaming processors heeft, dan zal Big Navi in totaal 5120 van deze cores hebben. Navi 31 zal dit aantal volgens AMD's data dus ook hebben, wat betekent dat de generatie ná RX 6000 vermoedelijk vooral verbeterde prestaties zal zien door de architectuur, en niet door een hoger aantal cores.
Het aantal cu's van Navi 22 is met 40 stuks exact de helft, wat betekent dat het aantal even groot zal zijn als dat van Navi 10 in de RX 5700-serie. Vergeleken met Nvidia's RTX 3000-kaarten is dat nog altijd een stuk minder; de RTX 3070 heeft 5888 cuda-cores en de RTX 3080 heeft er 8704. Belangrijk zal dus de kloksnelheid zijn.
Laat de kloksnelheden nou nét een aspect zijn dat in een tweede tabel te zien is. Er blijken twee varianten te zijn van Navi 21, vermoedelijk een reguliere versie en een flink overgeklokte variant die waarschijnlijk op de markt zal komen als een Limited Edition. De ene variant van Big Navi draait op een maximale boostklok van 2.050 MHz, de tweede chip gaat tot 2.200 MHz. Dat betekent dat ze in theorie 21 teraflops en 22,5 tflops moeten kunnen halen in single precision-taken. De RTX 3070 gaat in fp32 tot 20,3 tflops en de RTX 3080 tot 29,8 tflops.
Navi 22 klokt met een boost van maximaal 2.500 MHz een stuk hoger, en moet op die manier tot 11,5 tflops behalen. Opvallend is dat alle RDNA 2-chips een stuk hoger gaan dan de Navi-producten van de eerste generatie. Zowel Navi 1x (RDNA 1) als Navi 2x (RDNA 2) zijn gemaakt op grofweg hetzelfde productieproces, namelijk TSMC's 7nm-node.
AMD-GPU's: RDNA 1 versus RDNA 2 versus RDNA 3 | |||||||
---|---|---|---|---|---|---|---|
Property | Navi 10 | Navi 14 | Navi 12 | Navi 21 (Sienna Cichlid) | Navi 22 (Navy Flounder) | Navi 23 | Navi 31 |
num_se | 2 | 1 | 2 | 4 | 2 | 2 | 4 |
num_cu_per_sh | 10 | 12 | 10 | 10 | 10 | 8 | 10 |
num_sh_per_se | 2 | 2 | 2 | 2 | 2 | 2 | 2 |
num_rb_per_se | 8 | 8 | 8 | 4 | 4 | 4 | 4 |
num_tccs | 16 | 8 | 16 | 16 | 12 | 8 | 16 |
num_gprs | 1024 | 1024 | 1024 | 1024 | 1024 | 1024 | 1024 |
num_max_gs_thds | 32 | 32 | 32 | 32 | 32 | 32 | 32 |
gs_table_depth | 32 | 32 | 32 | 32 | 32 | 32 | 32 |
gsprim_buff_depth | 1792 | 1792 | 1792 | 1792 | 1792 | 1792 | 1792 |
parameter_cache_depth | 1024 | 1024 | 1024 | 1024 | 1024 | 1024 | 1024 |
double_offchip_lds_buffer | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
wave_size | 32 | 32 | 32 | 32 | 32 | 32 | 32 |
max_waves_per_simd | 20 | 20 | 20 | 16 | 16 | 16 | 16 |
max_scratch_slots_per_cu | 32 | 32 | 32 | 32 | 32 | 32 | 32 |
lds_size | 64 | 64 | 64 | 64 | 64 | 64 | 64 |
num_sc_per_sh | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
num_packer_per_sc | 2 | 2 | 2 | 4 | 4 | 4 | 4 |
num_gl2a | N/A | N/A | N/A | 4 | 2 | 2 | 4 |
unknown0 | N/A | N/A | N/A | 10 | 10 | 8 | 10 |
unknown1 | N/A | N/A | N/A | 16 | 12 | 8 | 16 |
unknown2 | N/A | N/A | N/A | 80 | 40 | 32 | 80 |
num_cus (computed) | 40 | 24 | 40 | 80 | 40 | 32 | 80 |
Frequenties AMD's discrete RDNA-GPU's | ||||||
---|---|---|---|---|---|---|
Property | Navi 10 a | Navi 10 b | Navi 14 | Navi 21 a | Navi 21 b | Navi 22 |
gfxclk (MHz) | 300 - 1000 | 300 - 1000 | 300 - 1900 | 500 - 2050 | 500 - 2050 | 500 - 2500 |
uclk (MHz) | 100 - 750 | 100 - 750 | 100 - 875 | 577 - 1089 | 577 - 1089 | 577 - 1089 |
socket_power_limit_ac[0] (W) | 180 | 180 | 110 | 200 | 238 | 170 |
freq_table_gfx[0] (MHz) | 300 | 300 | 300 | 500 | 500 | 500 |
freq_table_gfx[1] (MHz) | 1400 | 1400 | 1900 | 2050 | 2200 | 2500 |
freq_table_uclk[0] (MHz) | 124 | 100 | 100 | 100 | 100 | 97 |
freq_table_uclk[1] (MHz) | 500 | 500 | 500 | 500 | 500 | 457 |
freq_table_uclk[2] (MHz) | 625 | 625 | 625 | 625 | 625 | 674 |
freq_table_uclk[3] (MHz) | 875 | 750 | 875 | 1000 | 1000 | 1000 |
Bron: Reddit