IBM heeft de Telum-processor onthuld, een chip voor AI-taken die bij uitstek geschikt is voor real-time artificial intelligence. Dankzij de uitermate lage latency kan hij bijvoorbeeld fraude detecteren, nog op het moment waarop het gepleegd wordt.
Dat maakt de chip ideaal voor bijvoorbeeld het controleren van transacties op witwassing, het verwerken van leningen, het clearing-proces in financiële markten en risico-analyses. Hij is snel genoeg om transacties te controleren vóórdat de transactie voltooid is. IBM citeert de Federal Trade Commission, die heeft verklaard dat consumenten meer dan 3,3 miljard dollar hebben verloren aan fraudeurs. Met Telum kan hier een stokje voor gestoken worden.
De chip heeft acht cores op 'meer dan 5 GHz' die geoptimaliseerd zijn voor heterogene workloads. Ze zitten op twee chiplets en elke core heeft 32 MB aan cache. Hiermee kan een virtuele L4-cache worden geconfigureerd van maximaal 2 GB met acht van deze processors. Elke rekenkern heeft de beschikking over twee threads. Verder heeft elke chip 22 miljard transistors op een flinke 17 lagen met een formaat van 530 vierkante millimeter. Er passen tot 32 van deze processors in een enkel systeem dankzij de schaalbare interconnect. Er wordt gebruikgemaakt van Samsungs 7nm-node met extreme ultraviolet.
In een blogpost schrijft IBM dat een systeem op basis van Telum goed is voor maximaal 200 tflops aan rekenkracht — dat is meer dan 6 tflops per chip. Telum moet de z15 vervangen, en daarmee de hoofdprocessor worden van de IBM Z- en LinuxOne-systemen. Ten opzichte van de z15 heeft hij anderhalf keer de hoeveelheid cache, dit vormt een belangrijke reden voor de groei van 40% in prestaties per socket. Ze zijn verder erg schaalbaar. Een enkele chip heeft een inferentie-prestatieniveau van 116.000 resultaten in 1,1 milliseconde, terwijl 32 van deze chips 3.600.000 resultaten kunnen verwerken in 1,2 milliseconde. De eerste mainframes met Telum worden in de eerste helft van volgend jaar verwacht.
Bronnen: IBM, (blogpost)