Bis zu 1.000 Watt Verbrauch: Dells Aussagen zu Nvidia B100/B200 und was dahinter steckt

Jan-Frederik Timm (+1)
52 Kommentare
Bis zu 1.000 Watt Verbrauch: Dells Aussagen zu Nvidia B100/B200 und was dahinter steckt
Bild: Nvidia

Am Freitag schnellte der Aktienkurs von Dell um über 30 Prozent in die Höhe, was nicht zuletzt auf den Ausblick auf Einnahmen mit lukrativen KI-Systemen zurückzuführen war. Die Tech-Enthusiasten-Welt in Aufruhr brachte hingegen Dells COO Jeff Clarke mit Aussagen zu Nvidia B100 und B200 und dessen Stromverbrauch.

Das hat Dells CEO Clarke gesagt

Auf Clarkes Aussagen aufmerksam gemacht hat das Finanzmagazin Barrons. Die besagten Äußerungen sind im Transcript aus dem Earnings Call zu Dells Quartalszahlen zu finden.

Jeff Clarke, der Chief Operating Officer des US-Systembauers Dell, äußerte sich auf Nachfrage eines Teilnehmers am Call wie folgt:

We're excited about what happens at the B100 and the B200, and we think that's where there's actually another opportunity to distinguish engineering confidence. Our characterization in the thermal side, you really don't need direct liquid cooling to get to the energy density of 1,000 watts per GPU. That happens next year with the B200.

Dell blickt demzufolge dem, was mit Nvidias B100 und B200 auf das Unternehmen zukommen werde, mit Begeisterung entgegen. CEO Clarke bezieht das nicht allein auf die Leistung, sondern sieht in der nächsten Generation eine zusätzliche Möglichkeit für Dell, sich mit dem Selbstvertrauen in die eigene Ingenieursleistung vom Wettbewerb abzugrenzen. Denn Dell werde auch für die Energiedichte einer 1.000-Watt-GPU nicht das eigene Kühlkonzept anpassen, sondern weiter auf eine direkte GPU-Wasserkühlung verzichten. Dass 1.000-Watt-GPUs zu kühlen sind, „werde nächstes Jahr mit B200 passieren“, schloss Clarke den Gedankengang.

B200 bei 1.000 Watt – eine Einordnung

Dass Nvidia in diesem Jahr mit der Blackwell-GPU „B100“ mit einem Nachfolger für die Hopper-GPU H100 plant, ist nicht zuletzt durch eine öffentliche Roadmap des Herstellers hinlänglich bekannt – die Ankündigung der GPU dürfte analog der Vorgehensweise bei Hopper im Jahr 2022 auf der Nvidia Hausmesse GTC 2024 in der kommenden Woche, der Marktstart später im Jahr erfolgen.

Roadmap aus Präsentation für Investoren
Roadmap aus Präsentation für Investoren (Bild: Nvidia)

Bis dato noch nicht selbst öffentlich genannt hatte Nvidia wiederum einen mutmaßlichen B100-Refresh namens B200, so wie es ihn Ende 2023 mit dem H200 gegeben hat. Die öffentliche Roadmap nannte bis dato lediglich eine GPU namens „X100“ für 2025.

Als Nvidia diese Roadmap im Oktober 2023 erstmals Investoren gezeigt hatte, war davon ausgegangen worden, dass der Konzern zwischen Blackwell und dem Nachfolger nur ein Jahr verstreichen lassen werde – was ambitioniert erschien.

Ob B200 jetzt „X100“ entspricht, weil „X100“ von Nvidia lediglich als Platzhalter auf die Roadmap gesetzt worden war, ist bis dato nicht bekannt. Aber scheinen die 1.000 Watt pro GPU überhaupt realistisch?

H100 auf SXM-Modul
H100 auf SXM-Modul (Bild: Nvidia)

Durchaus, denn der Stromverbrauch der Server-GPUs ist zuletzt deutlich gestiegen. Nvidias H100 im neuen SXM5-Modulformat darf beispielsweise bis zu 700 Watt aufnehmen, bei Ampere waren es noch 400 Watt. AMDs Instinct Mi300X ist sogar bis 750 Watt spezifiziert.

AMD-CEO Lisa Su mit MI300X
AMD-CEO Lisa Su mit MI300X (Bild: AMD)
AMD Instinct MI300 im Demo-Showcase
AMD Instinct MI300 im Demo-Showcase

Möglich macht das neben den neuen Formfaktoren auch der Fußabdruck der GPUs samt direkt daneben gesetztem HBM-Speicher, der die für den Wärmeübergang nutzbare Fläche gegenüber älteren Generationen deutlich erhöht hat.

Und solange die Leistung einer solchen Lösung pro Watt höher liegt als mit einer weniger leistungshungrigen Alternative mit demselben Platzbedarf, werden Serverbetreiber, die in der Regel auf die Effizienz, aber nicht den absoluten Verbrauch schauen, nicht davor zurück schrecken auch solche Produkte einzusetzen – solange Server-Hersteller wie Dell sie adäquat gekühlt bekommen.

Die neuen Beschleuniger basieren am Ende zudem oft auf dem OCP-Standard. Dieser sieht bereits seit dem letzten Jahr die Möglichkeit vor, bis auf 1.000 Watt gehen zu können (PDF-Dokument). Neuere Revisionen könnten diese Schraube noch höher drehen.

Fazit

Dass Nvidia im kommenden Jahr eine Server-GPU mit 1.000 Watt Leistungsaufnahme auf den Markt bringen wird, erscheint demnach nicht unrealistisch. Auch dass es sich dabei um einen B100-Refresh namens „B200“ handeln wird, liegt mit Blick auf H100 und H200 nahe. Ob „X100“ auf der erst vier Monate alten Roadmap hingegen schon immer für B200 stand, oder Nvidia wirklich schon 2025 einen Blackwell-Nachfolger lanciert, darüber lassen sich aus Clarkes Aussagen keine Schlüsse ziehen.

B200 kurz vor X100 oder gar parallel dazu zu veröffentlichen, mutet seltsam an, auf der anderen Seite durfte und musste schon immer daran gezweifelt werden, dass Nvidia in Zukunft wirklich mit einer halbierten Entwicklungszeit für eine vollständig neue GPU-Architektur plant.

Zur GTC 24 in der kommenden Woche könnte Nvidias CEO Jensen Huang nicht nur das Rätselraten um den B100 beenden, sondern dann auch den Nebel über dem Jahr 2025 etwas lichten.