Jensen Huang: Nvidia zieht Arm-CPU-Kerne „von der Stange“ vor
Der RTX Spark Superchip ist Nvidias Einstieg in den Windows-on-Arm-PC-Markt. Für die CPU setzt Nvidia auf Kerne direkt von Arm, während im Datacenter die Eigenentwicklung „Olympus“ zum Einsatz kommt. Im Gespräch mit ComputerBase erklärte Nvidia-CEO Jensen Huang, dass das Unternehmen aber Arm-Kerne „von der Stange“ vorziehe.
Für Vera Rubin ist Nvidia von der vorherigen Grace-CPU mit von Arm lizenzierten Neoverse-V2-Kernen zur neuen Vera-CPU mit eigens entwickelten Olympus-Kernen gewechselt. Das Unternehmen hat sich somit die Arbeit gemacht, selbst CPU-Kerne mit eigener Mikroarchitektur (aber weiterhin mit Arm-Befehlssatzarchitektur, Arm‑ISA) zu entwickeln, statt erneut CPU-Kerne von Arm wie etwa die aktuellen Neoverse V3 zu lizenzieren. Denn eigentlich zieht es das Unternehmen vor, Arm-CPU-Kerne „von der Stange“ einzusetzen, wie Nvidia-CEO Jensen Huang gegenüber ComputerBase im Rahmen der Computex 2026 erläuterte. Diese Entscheidung hat folgenden Hintergrund.
Das zeichnet Vera im Datacenter aus
Nvidia hat die Vera-CPU entwickelt, weil sich KI-Workloads durch sogenannte Agenten grundlegend verändern. Während klassische KI vor allem auf GPUs für das Berechnen von Modellen angewiesen war, verbringen moderne Agenten viel Zeit mit CPU-Aufgaben: Sie führen Code aus, nutzen externe Werkzeuge, verarbeiten Daten, orchestrieren Abläufe und bewerten Ergebnisse. Laut Nvidia wird dadurch die CPU wieder zum kritischen Engpass in KI-Rechenzentren. Vera soll diese „agentischen“ Arbeitslasten deutlich schneller und energieeffizienter abarbeiten und so mehr KI-Anfragen („Tokens“) pro Rechenzentrum ermöglichen. Deshalb der Schritt zur Eigenentwicklung.
Technisch setzt Vera dafür auf 88 CPU-Kerne mit „Olympus“-Architektur, die sich durch eine sehr hohe Single-Thread-Leistung, Spatial Multithreading und bis zu 1,2 TB/s Speicherbandbreite auszeichnen und darüber hinaus eine sehr schnelle NVLink-C2C-Anbindung an Nvidias GPUs bieten. Nvidias Ziel war es, CPU-Wartezeiten zu reduzieren und die GPUs kontinuierlich mit Arbeit zu versorgen. Nvidia spricht von bis zu 1,8-mal schnellerer Aufgabenerledigung gegenüber aktuellen x86-Serverprozessoren und positioniert Vera als zentrale CPU für die kommende Generation sogenannter KI-Fabriken, in denen Agenten nicht nur antworten, sondern selbstständig handeln.
Der Vera-Nachfolger Rosa steht bereits auf Nvidias öffentlicher Roadmap. Dass Nvidia dabei erneut auf eine Eigenentwicklung setzen wird, ist aber nicht gesagt. Gemessen an den Aussagen von Jensen Huang ist eher mit dem Gegenteil zu rechnen. Nvidia werde so viele Kerne „von der Stange“ wie nur möglich nutzen.
Our preference is to use off the shelf cores whenever we can because Arm also builds good cores. And so we'll use as much of the off the shelf as we can.
Jensen Huang, Nvidia CEO
Bei Vera und der agentischen Ausrichtung der Vera-Rubin-Plattform war dies aber offenbar nicht möglich. Dem Unternehmen war die Single-Thread-Leistung bei Arm potenziell nicht ausreichend, wie das Entwicklungsziel von Vera verdeutlicht.
Arm cores were designed for the many core world. We needed, in the case of Olympus, really really good single-threaded performance. We wanted to push single-threaded performance as far as we can push it.
Jensen Huang, Nvidia CEO
Das Verlangen nach sehr hoher Single-Core-Leistung erklärte Jensen Huang mit den eingangs erwähnten Anforderungen an aktuelle KI-Systeme für Rechenzentren.
The reason for that is all of the things we have been talking about: interactivity, the latency. The response time to an agent has to be as short as possible because the agent is carrying this thing behind it. The agent is carrying a GPU, and so when it's waiting for the CPU it's quite wasteful, it burns a lot of energy unnecessarily, wastes a lot of money, wastes a lot of time. So we have to get that as short as possible so we can reduce that by a factor of 1,8x. That's gigantic, utterly gigantic. So I think that that's the reason why we did it.
Jensen Huang, Nvidia CEO
Nvidia werde auf den „richtigen“ Kern setzen, wo immer es dem Unternehmen möglich sei, und die Präferenz liege bei Kernen „von der Stange“, demnach bei lizenzierten Kernen direkt von Arm.
We'll use the right core wherever we can and our preference is to use off the shelf.
Jensen Huang, Nvidia CEO
Grace für Consumer setzt auf Cortex
Interessant ist diese Aussage auch mit Blick auf die aktuellen und bevorstehenden Consumer-Lösungen von Nvidia. Mit dem RTX Spark Superchip hält Grace auch im Windows-PC-Segment Einzug. Doch hier täuscht die Bezeichnung: Grace für Consumer setzt nämlich auf Arm-Cortex-Kerne wie etwa in SoCs für Smartphones. Grace für das Datacenter setzt hingegen auf Neoverse-Kerne.
Vera und Rosa kommen für Spark
Bei Vera dürfte sich das mit den zwei unterschiedlichen Technologien, die jedoch unter einer Bezeichnung (Grace) versammelt werden, weiter fortsetzen, denn die Olympus-Kerne (und das Drumherum) sind für Consumer-Endgeräte „Overkill“. Vera Rubin Spark soll 2028 kommen, der übernächste Nachfolger Rosa Feynman Spark dann 2030.