Erste Server-CPU nach 35 Jahren: Arm AGI CPU hat 136 Kerne, 8.800 MT/s, aber kein SME2
Arm hat gemeinsam mit Meta einen Prozessor entwickelt: die Arm AGI CPU. Diese ist für Hyperscaler prädestiniert, kann sie dafür vieles doch gut, aber eben nicht alles. So bietet der Prozessor viele kleine Arm-Kerne und ein breites Speicherinterface für eine hohe Bandbreite, gewisse Extras lässt die Lösung dann aber vermissen.
Ein eigener großer Prozessor von Arm, also nicht nur von Arm über Dritte lizenzierte Technologie, war seit Jahren ein Gerücht. Während zwar viele Hersteller Arm-Kerne verbauen oder zuletzt im Profi-Bereich eher nur noch auf die Befehlssatzarchitektur (ISA) von Arm umschwenken und komplett eigene Lösungen nutzen, sieht Arm noch immer einen Markt, der eine komplett eigene Lösung nutzen wird. Ganz allein traut man sich die Sache aber nicht zu, und holte sich deshalb gleich Meta mit ins Boot, die die Lösung mitentwickelten – so hat Arm dann auch direkt einen ersten Großkunden und verlässliche Zahlen in der Abnahme. Und warum Meta? Der Konzern ist der einzige Riese in dem Markt der Hyperscaler, der keine eigene CPU-Entwicklung umgesetzt hat, aber doch stets bei AMD, Nvidia und sogar Google Kapazitäten einkauft.
Die Architektur ist schon zwei Jahre alt
Arm und Meta nutzen die bereits vor zwei Jahren enthüllte Architektur Neoverse V3, die auf der älteren Armv9.2-ISA basiert. Moderne mobile Chips sind hier schon einen Schritt weiter, was deshalb auch direkt erklärt, warum der jetzt vorgestellte Serverchip Features wie SME2, also die neue Scalable Matrix Extension 2, schlichtweg missen lässt.
Viele der vor zwei Jahren schon bekannten Details sind deshalb auch noch heute exakt so umgesetzt. Doch statt seinerzeit „nur“ 64 Kerne pro Chip anzustreben und so als Dual-Chip-Design 128 Kerne zu bieten, wächst die Neuvorstellung als „Custom“-Lösung auf 136 Kerne an. Doch das ist nur das Flaggschiff, es gibt auch eine kostenoptimierte 128-Kern-Lösung sowie einen 64-Kerner – auch hier als 2-Die-Lösung umgesetzt. Diese bietet dementsprechend die höchste Speichermenge pro Kern.
Angepasst wurden bei der neuen Arm AGI CPU jedoch so einige Dinge. Statt des maximal möglichen 3 MByte L2-Cache pro Kern nutzt der Arm-Meta-Chip nun 2 MByte pro Kern, abgerundet wird jede Dual-Die-CPU aus TSMCs N3P-Fertigung von 128 MByte System Level Cache.
Das Speicherinterface mit zwölf Kanälen ist vom Referenzdesign her gesetzt, hier kann maximal DDR5-8800 als RDIMM angesprochen werden. Daraus entspringt dann eine Bandbreite von maximal über 800 GB/s und rechnerisch 6 GByte/s pro Kern – damit soll die Lösung punkten. Ein kurzer Vergleich: Nvidias neue Vera-CPU mit Custom-Arm-Architektur kommt auf 14 GByte/s pro Kern. Abgerundet wird das Komplettpaket von 96 PCIe-Lanes nach Standard PCIe Gen 6, auch CXL-3.0-Unterstützung ist dabei.
Um in einer 300-Watt- und luftgekühlten TDP-Umgebung zu bleiben, takten die Lösungen mit 3,2 GHz vergleichsweise gering. Immerhin gibt es einen Boost von 3,7 GHz – allerdings nicht bekannt bei wie viel Last auf wie vielen Kernen.
Bis zu 45.656 CPU-Kerne pro Rack
Wichtig beim Design war vor allem auch Meta, dass die Lösungen gut skalierbar sind. Zwei CPUs pro Blade und dann stapelbar in einem Rack, dazu das Ganze erweitert über multiple Racks – das alles ist auch mit der Arm AGI CPU möglich. Bei 30 Blades in einem Rack gibt es so schon 8.160 Kerne. In einem angepassten und wassergekühlten, mit 42 Einschüben nicht nur größeren, sondern auch doppelt so breiten Rack können sogar 336 CPUs verbaut werden. Die Anzahl der Kerne steigt dann auf über 45.000 an. Ab Ende des Jahres werden die ersten Chip in Racks erwartet.