IBM toont nieuwe versie analoge Hermes-AI-chip die GPU's kan gaan vervangen

IBM heeft een nieuwe analoogwerkende chip ontworpen als onderdeel zijn Hermes-project. De chip die ontworpen is om middels kunstmatige intelligentie voorspellingen te maken en conclusies te trekken uit nieuwe gegevens kan zich volgens het bedrijf meten met digitale tegenhangers zoals gpu’s, terwijl ze minder energie gebruiken.

Een vorige week verschenen paper in Nature Electronics (betaald) legt het onderzoeksproject uit. De chip maakt gebruik van een combinatie van phase-change-geheugen en digitale schakelingen om matrix-vector-vermenigvuldigingen uit te voeren op netwerkgewichten die op de chip zijn opgeslagen. Het is niet de eerste chip in het Hermes-project van IBM, maar dit exemplaar heeft 64 rekenkernen, in tegenstelling tot het op het ieee vlsi 2021-symposium getoonde 34-kern grote exemplaar. Verder heeft deze chip volgens IBM de eigenschappen in zich die nodig zijn om het daadwerkelijk in de praktijk als inferentie-accelerator in te zetten met een laag genoeg energiegebruik.


Een iets oudere Hermes-core. (Via: IEEE)

Huidige technieken gebruiken gescheiden geheugen- en verwerkingseenheden, wat volgens IBM inefficiënt is als de data vaak heen en weer moet gaan tussen de twee. Dit zorgt voor onnodig veel energiegebruik. Bij IBM’s chip is nu voor een aanpak gekozen waarbij phase-change-geheugencellen de gewichten opslaan als analoge waardes in een matrix van 256 bij 256 groot en er bovendien direct berekeningen op uit kan voeren middels pwm-pulsen. Input van buiten de cores kan direct verwerkt worden in de matrix-vectorvermenigvuldigingen. De paper in Nature gaat dieper in op hoe het dac-gedeelte is ingericht. Ook is er te lezen hoe IBM tot zijn claims komt van een efficiëntie tot bijna 93 procent op de cifar-10 set van data.

IBM claimt vijftien keer hogere matrix-vectorvermenigvuldigingsdoorvoer over de vorige multikernchips bij vergelijkbare energie-efficiëntie. Echte vergelijkingen qua energie-efficiëntie ten opzichte van gpu’s geeft IBM niet, maar het bedrijf stelt dat een enkele invoer naar ResNet-9 behandeld werd in 1,52 nanoseconde met een energieconsumptie van 1,51 microjoule. Verdere vorderingen in de gewichtsdichtheid moeten de chips uiteindelijk laten concurreren met digitale gpu’s. De chip is voorlopig gemaakt op een 14nm-procedé en loopt op een kloksnelheid van 1 GHz. Rekeninfrastructuur voor kunstmatige intelligentie die gebruikmaakt van gpu’s gebruikt aardig wat energie. Een enkel serverrek in deze functie kan zomaar 70 kilowatt gebruiken, in vergelijking met de 10 kilowatt per rek voor normaal gebruik.

Bronnen: The Register, IBM Research

« Vorig bericht Volgend bericht »
0