Nvidias DGX-Chef: Die GPUs selbst sind nicht knapp, aber das Drumherum

Volker Rißka
21 Kommentare
Nvidias DGX-Chef: Die GPUs selbst sind nicht knapp, aber das Drumherum
Bild: Nvidia

Nvidias Profi-Beschleuniger erfreuen sich höchster Nachfrage, der Hersteller muss Flaschenhälse für eine bessere Verfügbarkeit auflösen. Die reinen GPUs sind dabei verfügbar, was fehlt, sind die darauf folgenden Schritte und Materialien, die die Chips vom Wafer bei TSMC zu einem vollwertig nutzbaren Produkt beim Kunden machen.

GPU shortage, also die Knappheit der Chips, wird in diesem Zusammenhang oftmals als übergreifender Begriff genutzt, der der reinen Definition eigentlich nicht gerecht wird. Im Endkundenmarkt sind mit diesem Begriff oft die kompletten Grafik- oder Beschleunigerkarten gemeint, die reine GPU ist dabei aber genau genommen nur das, was auf einem Wafer bei TSMC produziert und darauf folgend auf ein Package gesetzt wird. Und ab da fangen die Probleme der Verfügbarkeit laut Nvidia primär erst an.

So when people use the word GPU shortage, they’re really talking about a shortage of, or a backlog of, some component on the board, not the GPU itself. It’s just limited worldwide manufacturing of these things…but we forecast what people want and what the world can build.

Charlie Boyle, VP and GM of Nvidia's DGX Systems

Die Probleme hören nicht bei den fertiggestellten Karten auf, auch die weiteren Produkte sind mitunter knapp, um fertige Server mit vier oder acht Beschleunigern auch tatsächlich einsetzen zu können. Hier gibt es mitunter Probleme selbst in der Infrastruktur bei den Cloud-Providern, die so schnell gar nicht neue Rechenzentren mit den benötigten Vorgaben für diese Systeme aus dem Boden stampfen können. Der vielfach benannte bottleneck, also Flaschenhals, verschiebt sich dann mitunter also dort hin.

Alle wollen Nvidias Profi-Chips

Die Nachfrage nach Nvidia-Beschleunigers ist nicht nur groß, sie ist riesig. Ganze Seiten widmen sich dem Thema, doch schneller an die Karten kommen geneigte Kunden derzeit nicht. Zwar heißt es, dass der Listenpreis für eine H100 bei vermutlich rund 30.000 bis 32.000 US-Dollar liege, die im KI-Umfeld wichtigen Beschleuniger wurden aber bereits vor Monaten oft für über 40.000 US-Dollar gehandelt. Und auf dem Grau-/Schwarzmarkt in Richtung China gingen die Preise zuletzt wohl hinauf auf bis zu 70.000 US-Dollar pro Karte, in diesem Fall sogar für die abgespeckte Variante H800. Neidisch blickte deshalb kürzlich erneut Intels CEO Pat Gelsinger auf Nvidias Geschäft in dem Bereich und erklärte, dass sie einen echt guten Job gemacht haben und hier ganz klar führen.

Nvidia H100 NVL
Nvidia H100 NVL (Bild: Nvidia)

Chips vom Wafer sind nicht knapp, das Packaging ist es

Mit seinen Aussagen widerlegt Charlie Boyle von Nvidia indirekt auch die zuletzt in Medien aufgetauchten Gerüchte, Nvidia würde bei der Wafer-Produktion die Gaming-Lösungen zurückfahren, um im Gegenzug mehr Profi-Chips zu fertigen. Das Problem ist aber nicht bei den Wafern zu finden, deren 5-nm-Fertigung seit Jahren erprobt am Maximum auch mit den Schritten zu N4/4N läuft.

Wo es hakt, wurde in den letzten Wochen bereits gebetsmühlenartig wiederholt: das Packaging. Die Hopper-Beschleuniger, aber auch Vorgänger aus der Ampere-Generation für den Profi-Bereich, sind bekanntlich nicht nur reine GPUs, die von einem Wafer auf ein Package gesetzt werden, sie bekommen zuvor noch HBM zur Seite gestellt, wofür ein spezielles und aufwändiges Packaging-Verfahren nötig ist: CoWoS.

Wafer starts are not the bottleneck at TSMC. Mentioned earlier CoWoS (3D stacking) packaging is the gate at TSMC.

Dieser Prozess läuft auch bei TSMC, die vor zwei Wochen erklärten, hier erst in 1,5 Jahren Licht am Ende des Tunnels zu sehen, so hoch sei die Nachfrage, die aktuell nicht befriedigt werden könne. Fabriken werden derzeit aus- und umgerüstet, TSMC baut sogar neue Werke, doch kurzfristig hilft all das nur bedingt.

Deshalb bringt es Nvidia aktuell rein gar nichts, zusätzliche Wafer mit Profi-Chips belichten zu lassen, denn mehr CoWoS-Packaging-Kapazität steht damit nicht zur Verfügung. Dies muss zwangsweise Hand in Hand gehen. Insofern besteht kein Grund, wie in Medien suggeriert, Produktionskapazitäten von Gaming-Chips zu verlagern. Denn die Gaming-Chips benötigen diese zusätzlichen Schritte nicht, schließlich handelt es sich um klassische Packages ohne größeren Aufwand, die viele Firmen umsetzen können.

Unterm Strich sind die Gaming-Produkte ein ganz eigenes Portfolio mit eigenen Anforderungen und einem stetig angepassten wirtschaftlichen Ausblick, der nach wie vor der allgemeinen PC-Absatzschwäche geschuldet ist, zuletzt aber bereits wieder etwas anzog und den besten Umsatz in den letzten vier Quartalen markierte.

Quartalsbericht und Ausblick in Kürze

Mit Spannung werden Nvidias Quartalszahlen zum Ende dieses Monat erwartet. Prognostiziert wurde ein Umsatzanstieg von rund 50 Prozent, der die Aktie nach Bekanntgabe der letzten Zahlen auf Höhenflug schickte. Interessant zu sehen sein wird, wie es daraufhin weitergehen soll. Der weitere Ausblick ist letztlich das, worauf nicht nur die Börse wartet.