Nvidia Rubin CPX: Kleinere Rubin-GPU mit GDDR7 für noch mehr Leistung/Rack
Nvidia enthüllt heute die neue AI-Lösung Rubin CPX, offiziell ein „processor purpose-built to accelerate long context processing“. Aber warum braucht es das? Nvidia erklärt, dass selbst Rubin in Extremszenarien nicht ausreiche, um Millionen-Token-Anfragen zu bearbeiten. Rubin CPX ergänzt Vera-Rubin-Systeme, bleibt also optional.
Rubin CPX = halber Rubin?
Rubin CPX ist auf brachiale Rohleistung für einen hohen Inferencing-Durchsatz ausgelegt, vor allem für den FP4-Bereich. Ein einzelner Chip bietet 30 PetaFLOPS FP4-Leistung und setzt wie Rubin eine Flüssigkeitskühlung voraus – die TDP dürfte entsprechend hoch ausfallen, eine Zahl nennt Nvidia heute noch nicht. Bisher sprach Nvidia den Rubin-GPUs 50 PF FP4-Inference-Leistung zu. Dabei bezieht sich Nvidia auf die 2-Retikel-GPU, ein „halber“ Chip würde letztlich also ungefähr 25 PF bieten. Rubin CPX dürfte also eine umfangreich optimierte und angepasste 1-Retikel-Lösung sein.
Im bekannten Oberon-Rack, das bei Blackwell (Ultra) und Rubin zum Einsatz kommt, bevor das Kyber-Rack ab Rubin Ultra übernimmt, soll Rubin CPX vor allem „million-token coding and generative video applications“ abwickeln, entsprechend verfügt Rubin CPX auch über jeweils vier Video-Encoder und -Decoder.
128 GB GDDR7 statt HBM4
Für das Einsatzgebiet von Rubin CPX braucht es keinen teuren Speicher und entsprechendes Interface im Chip, denn anstelle von HBM4, den Nvidia ab Rubin mit acht Stacks vorsieht, gibt es hier nur GDDR7 in einer Größe von 128 GB – die Menge und Bandbreite liegt entsprechend massiv unter dem klassischen Rubin-Chip (288 GB HBM3e).
Scale-Up: 8 ExaFLOPS NVFP4 pro Rack
Die von Nvidia bereits für Vera Rubin publizierten Zahlen werden mit Rubin CPX noch gewaltiger. Wird ein Rack alias Vera Rubin NVL144 derzeit mit 3,6 ExaFLOPS NVFP4-Leistung beworben, schafft ein Rack mit dem Upgrade zu Vera Rubin NVL144 CPX satte 8 EF NVFP4. Die Leistungsdichte im Rack und damit der Scale-Up steigt somit noch weiter. 18 Einschübe im Rack bieten nicht nur Platz für 36 Vera Rubin – je zwei CPUs und vier GPUs mit je zwei Dies –, sondern eben auch 144 CPX-Chips – acht pro Tray, jeweils vier in der Nähe der vier Netzwerkchips. Die Anbindung der CPX-Chips wollte Nvidia noch nicht genauer detaillieren, sie soll aber über PCI Express erfolgen.
CPX-Option ohne Rubin-GPU geplant
Auch eine Dual-Rack-Option wird Nvidia anbieten, die sich an Kunden eines klassischen Vera Rubin NVL144 ohne die CPX-Option richtet. Diese können ein Oberon-Rack mit NVL144 ab Ende 2026 um ein „Vera Rubin CPX Rack“ ergänzen, das dann nicht mehr die Rubin-GPUs bietet, sondern letztlich nur zusätzliche Vera-CPUs und die neuen CPX-Chips nachrüstet. Es ergänzt dann im Paket mit einem NVL144 die entsprechenden Fähigkeiten.
Der Start für Rubin CPX wird für Ende 2026 anvisiert. Entsprechend groß dürften CPX und das gesamte Thema Rubin zur GTC 2026 werden. Die Hauptmesse von Nvidia startet am 16. März 2026.
ComputerBase hat Informationen zu dieser Meldung von Nvidia unter NDA erhalten. Die einzige Vorgabe war der frühestmögliche Veröffentlichungszeitpunkt. Eine Verpflichtung zur Veröffentlichung bestand nicht.
- CB-Funk-Podcast #162: Jensen mag keinen „AI Slop“, FSR 4.1 und Death Stranding 2
- MB. Drive Assist Pro: Level 2++ im Mercedes mit Nvidias Drive AGX Orin ausprobiert
- Was macht DLSS 5?: Nvidias Antwort in einem Satz ist „die KI weiß, was sie tut“
- +20 weitere News