Execution Units
Elke execution unit heeft twee SIMD floating point rekeneenheden aan boord, die gelijktijdig per klokslag vier single-precision (32-bit) floating-point of integer berekeningen kunnen doen of 8 16-bit floating-point of integer berekeningen. Double-precision berekeningen (64-bit) kunnen de FPU’s er slechts één per klokslag van afleveren. Doordat de FPU’s zogenaamde MAD (multiply and add) instructies in één keer kunnen uitvoeren, is de maximale rekenkracht van een enkele EU 16 Flops per cycle (2 SIMD units x 4 single-precision berkeningen x 2 ivm MAD). Met 24 EU’s en een maximale klokfrequentie van 1150 MHz komen we zo op een totale theoretische maximum rekenkracht van 16 x 24 x 1150M = 441,6 Gigaflops. Om dat een beetje in perspectief te plaatsen; je zit dan halverwege het niveau van een Nvidia GeForce GTX 720 (306 Gigaflops) en GTX 730 (693 Gigaflops), dus in vergelijking met serieuze losse videokaarten is het nog altijd niks.
Als we er voor het gemak echter even van uit gaan dat de klokfrequentie identiek is, dan kan de GT3 variant een maximale theoretische rekenkracht van 883,2 Gigaflops hebben en de GT4 zelfs 1324,8 Gigaflops. Dat laatste is zelfs meer dan een GeForce GTX 750 Ti desktop videokaart en is dus voor een geïntegreerde GPU een ongekend prestatieniveau. Om nog even een vergelijking met AMD te maken: de geïntegreerde GPU in hun snelste desktop APU, de A10-7850K, heeft een theoretische maximum rekenkracht van 737 Gigaflops. Dat biedt perspectieven voor de snellere Gen. 9 GPU’s die we over een tijdje in specifieke mobiele Skylake chips mogen gaan verwachten.
Elke execution unit kan per klokslag acht 32-bit multiply-add berekeningen uitvoeren.