Deze week staat bij Nvidia in het teken van de Tesla M4 en Tesla M40, twee grafische kaarten die speciaal bedoeld zijn voor 'machine learning' in datacenters. Eerstgenoemde is gebaseerd op een GM206, terwijl de krachtigere M40 zijn basis in de GM200 vindt.
Ze zijn dus beide gebaseerd op Maxwell-chips, wat inherent betekent dat de prestaties in double precision (FP64) toepassingen aanzienlijk lager liggen dan we van de Tesla-familie gewend zijn (1/32 in plaats van 1/3 van FP32 bij Kepler). Dat zal voor de specifieke doelgroep echter geen probleem vormen; de efficiëntere werking van Maxwell is meer van belang.
In single precision (FP32) haalt de Tesla M40 een rekenkracht van 7 TFLOPS, met 3072 rekenkernen, klokfrequenties tot 1140 MHz, een 384-bit geheugenbus met 12 GB GDDR5 en een TDP van 250 watt. De low-profile Tesla M4 blijft beperkt tot 2,2 TFLOPS, met 1024 rekenkernen op snelheden tot 1075 MHz, 4 GB GDDR5-geheugen over een 128-bit bus en een TDP tussen de 50 en 75 watt.
Afbeeldingen afkomstig van Anandtech
Bron: Anandtech