Baidu, een grote Chinese fabrikant van onder andere ai-chips, heeft de Kunlun II onthuld. Dochterbedrijf Kunlun Chip heeft aangekondigd de massaproductie te zijn gestart, op een 7 nanometer-proces. De processor is gebaseerd op de tweede generatie van de XPU-microarchitectuur en moet twee tot drie maal de prestaties van zijn voorganger leveren. De eerste generatie wordt onder andere ingezet in Baidu's clouddatacentra en hun Apolong-platform voor zelfrijdende auto's.
Deze behaalde zo'n 256 tera-operations per seconde in INT8, 64 tops in INT/FP16 en 16 in INT/FP32, met een tdp van 150 watt. Hiervan uitgaande behaalt de nieuwe accelerator respectievelijk 512 à 768, 128 à 192 en 32 à 48 tops. Nvidia's A100 biedt 19.5 FP32 teraflops en 624 of 1248(met sparsity) INT8-tops. Deze cijfers lijken erop te wijzen dat Baidu's oplossing competitief kan zijn ten opzichte van Nvidia's accelerator, hoewel de piekprestaties geen perfecte weergave zijn van de werkelijke prestaties.
Bron: Tom's Hardware