Ook specificaties en kloksnelheden nieuwe AMD RDNA-GPU's te zien in macOS-bèta

Afgelopen woensdag bleek dat AMD een ROCm-update heeft uitgebracht, waarin ondersteuning is toegevoegd voor verschillende RDNA-gpu's. Van onder andere de vermeende Big Navi-gpu's zagen we vermeldingen, en nu blijkt dat er nog veel meer informatie is opgedoken.

De nieuwe informatie is door dezelfde Redditor genaamd 'Stblr' ontdekt in een macOS 11-bèta. Hier blijkt ook Navi 31 in genoemd te worden, de eerste chip waarvan we weten dat hij vermoedelijk gebruik moet maken van de RDNA 3-architectuur. Hij is erg vergelijkbaar met Navi 21, de chip die we ook wel kennen als 'Big Navi'. Afgelopen woensdag bleek dat Navi 21 zou worden voorzien van 80 compute units in totaal. Als elke cu nog steeds 64 streaming processors heeft, dan zal Big Navi in totaal 5120 van deze cores hebben. Navi 31 zal dit aantal volgens AMD's data dus ook hebben, wat betekent dat de generatie ná RX 6000 vermoedelijk vooral verbeterde prestaties zal zien door de architectuur, en niet door een hoger aantal cores.

Het aantal cu's van Navi 22 is met 40 stuks exact de helft, wat betekent dat het aantal even groot zal zijn als dat van Navi 10 in de RX 5700-serie. Vergeleken met Nvidia's RTX 3000-kaarten is dat nog altijd een stuk minder; de RTX 3070 heeft 5888 cuda-cores en de RTX 3080 heeft er 8704. Belangrijk zal dus de kloksnelheid zijn.

Laat de kloksnelheden nou nét een aspect zijn dat in een tweede tabel te zien is. Er blijken twee varianten te zijn van Navi 21, vermoedelijk een reguliere versie en een flink overgeklokte variant die waarschijnlijk op de markt zal komen als een Limited Edition. De ene variant van Big Navi draait op een maximale boostklok van 2.050 MHz, de tweede chip gaat tot 2.200 MHz. Dat betekent dat ze in theorie 21 teraflops en 22,5 tflops moeten kunnen halen in single precision-taken. De RTX 3070 gaat in fp32 tot 20,3 tflops en de RTX 3080 tot 29,8 tflops.

Navi 22 klokt met een boost van maximaal 2.500 MHz een stuk hoger, en moet op die manier tot 11,5 tflops behalen. Opvallend is dat alle RDNA 2-chips een stuk hoger gaan dan de Navi-producten van de eerste generatie. Zowel Navi 1x (RDNA 1) als Navi 2x (RDNA 2) zijn gemaakt op grofweg hetzelfde productieproces, namelijk TSMC's 7nm-node.

AMD-GPU's: RDNA 1 versus RDNA 2 versus RDNA 3
Property Navi 10 Navi 14 Navi 12 Navi 21 (Sienna Cichlid) Navi 22 (Navy Flounder) Navi 23 Navi 31
num_se 2 1 2 4 2 2 4
num_cu_per_sh 10 12 10 10 10 8 10
num_sh_per_se 2 2 2 2 2 2 2
num_rb_per_se 8 8 8 4 4 4 4
num_tccs 16 8 16 16 12 8 16
num_gprs 1024 1024 1024 1024 1024 1024 1024
num_max_gs_thds 32 32 32 32 32 32 32
gs_table_depth 32 32 32 32 32 32 32
gsprim_buff_depth 1792 1792 1792 1792 1792 1792 1792
parameter_cache_depth 1024 1024 1024 1024 1024 1024 1024
double_offchip_lds_buffer 1 1 1 1 1 1 1
wave_size 32 32 32 32 32 32 32
max_waves_per_simd 20 20 20 16 16 16 16
max_scratch_slots_per_cu 32 32 32 32 32 32 32
lds_size 64 64 64 64 64 64 64
num_sc_per_sh 1 1 1 1 1 1 1
num_packer_per_sc 2 2 2 4 4 4 4
num_gl2a N/A N/A N/A 4 2 2 4
unknown0 N/A N/A N/A 10 10 8 10
unknown1 N/A N/A N/A 16 12 8 16
unknown2 N/A N/A N/A 80 40 32 80
num_cus (computed) 40 24 40 80 40 32 80
 
Frequenties AMD's discrete RDNA-GPU's
Property Navi 10 a Navi 10 b Navi 14 Navi 21 a Navi 21 b Navi 22
gfxclk (MHz) 300 - 1000 300 - 1000 300 - 1900 500 - 2050 500 - 2050 500 - 2500
uclk (MHz) 100 - 750 100 - 750 100 - 875 577 - 1089 577 - 1089 577 - 1089
socket_power_limit_ac[0] (W) 180 180 110 200 238 170
freq_table_gfx[0] (MHz) 300 300 300 500 500 500
freq_table_gfx[1] (MHz) 1400 1400 1900 2050 2200 2500
freq_table_uclk[0] (MHz) 124 100 100 100 100 97
freq_table_uclk[1] (MHz) 500 500 500 500 500 457
freq_table_uclk[2] (MHz) 625 625 625 625 625 674
freq_table_uclk[3] (MHz) 875 750 875 1000 1000 1000

Bron: Reddit

« Vorig bericht Volgend bericht »
0