News Angebliche Packaging-Probleme: Nvidia Rubin Ultra reizt CoWoS-L von TSMC aus

Volker · 31. März 2026

Seit Wochenbeginn wird spekuliert, ob Nvidias Rubin Ultra wirklich wie geplant Ende 2027 kommen wird. Laut aktuellen Gerüchten, die sich auf Analysten berufen, scheint es Probleme beim Packaging bei TSMC zu geben. Demnach ist das Produkt wohl zu groß und zu komplex und überreizt so das CoWoS-Design.

Zur News: Angebliche Packaging-Probleme: Nvidia Rubin Ultra reizt CoWoS-L von TSMC aus

ZeroCoolRiddler · 31. März 2026

Ich rate mal.
Es wird nur knappe Stückzahlen geben.
Diese werden sehr viel teurer verkauft?

ThirdLife · 31. März 2026

@ZeroCoolRiddler Spielt für uns ja keine Rolle. Die können den Kram für 100 Mio pro Chip von mir aus an die AI-Bros verticken. 😂

dodolein · 31. März 2026

Bei diesem Design ist mit bisher nie gesehenem Stromhunger dieser Grafikkarten zu rechnen.

Laut Toms Hardware könnte eine einfache Rubin-GPU um die 2 kW TDP haben, Rubin Ultra dann ca. 3,5 kW.

Finde ich schockierend.

FrozenPie · 31. März 2026

War-Page, Warp-Age... Wenn man das Wort noch nie gesehen hat, weiß man erst gar nicht wie man's lesen soll

stefan92x · 31. März 2026

dodolein schrieb:
Finde ich schockierend.

Warum? Die einzige Metrik, die hier relevant ist, ist Flops/Watt, und das nicht pro GPU berechnet sondern pro Datacenter. Und das wird immer besser, auch wenn (oder eher gerade weil) der Verbrauch pro GPU steigt.

HolySkillet · 31. März 2026

Als Reticle-Size-Limit in der Branche gilt die Maximalgröße eines einzelnen Chips, der mit gängigen Belichtungsmaschinen Kantenlängen von bis zu 26 × 33 mm bzw. 858 mm² haben kann.

Ich verstehe noch nicht, was Belichtungsmachinen mit Recticlegröße (zumindest in dieser Größenordnung) zu tun haben.
Werden Wafer nicht immer noch im Ganzen belichtet?
Oder ist das ein Yieldproblem?

stefan92x · 31. März 2026

HolySkillet schrieb:
Werden Wafer nicht immer noch im Ganzen belichtet?

Nein, Chip für Chip wird auf dem Wafer belichtet. Und das kann halt maximal dieses Reticle-Limit sein.

LamaMitHut · 31. März 2026

dodolein schrieb:
Bei diesem Design ist mit bisher nie gesehenem Stromhunger dieser Grafikkarten zu rechnen.

Laut Toms Hardware könnte eine einfache Rubin-GPU um die 2 kW TDP haben, Rubin Ultra dann ca. 3,5 kW.

Finde ich schockierend.

Schockierend ist eher, dass einige keine Ahnung von Effizienz haben.

CDLABSRadonP... · 31. März 2026

dodolein schrieb:
Bei diesem Design ist mit bisher nie gesehenem Stromhunger dieser Grafikkarten zu rechnen.

Laut Toms Hardware könnte eine einfache Rubin-GPU um die 2 kW TDP haben, Rubin Ultra dann ca. 3,5 kW.

Finde ich schockierend.

stefan92x schrieb:
Warum? Die einzige Metrik, die hier relevant ist, ist Flops/Watt, und das nicht pro GPU berechnet sondern pro Datacenter. Und das wird immer besser, auch wenn (oder eher gerade weil) der Verbrauch pro GPU steigt.

Oder, um einen Vergleich mit CPUs zu wagen: Es ist besser, eine CPU mit einem 16-Channel-I/O-DIE und 16 CCDs zu konstruieren als in gleicher Gen ein Dual-Sockel-Board mit zwei 8-Channel-I/O-DIEs und 8CCDs. Ersteres wird zwar als einzelnes Package betrachtet das doppelte an Strom schlucken, die Plattform insgesamt wird aber weniger brauchen und höhere Performance bringen. (da die Latenzen auf Grund der reduzierten Distanz geringer ausfallen)

mae · 31. März 2026

stefan92x schrieb:
Warum? Die einzige Metrik, die hier relevant ist, ist Flops/Watt

Warum sollte das so sein? Ich finde Nutzen/W z.B. viel relevanter. Wobei "Nutzen" natuerlich nicht so leicht zu messen und sehr abhaengig von der Art der Nutzung ist. Jedenfalls steigt in vielen Bereichen der Nutzen nicht linear mit dem Aufwand. Wenn z.B. ein typischer Nutzen von AI der ist, dass ein Arbeitgeber 20% seiner Belegschaft kuendigen kann und (vorerst) dafuer weniger an Big Tech abliefern muss als die Lohnkosten dieser 20% vorher waren, und er mit den hoeherverbrauchenden AI-Chips jetzt 21% kuendigen kann, wird der Mehrertrag fuer Big Tech dann tatsaechlich so stark steigen wie die zusaetzlichen Energiekosten?

TeeKayEV · 31. März 2026

mae schrieb:
Warum sollte das so sein? Ich finde Nutzen/W z.B. viel relevanter. Wobei "Nutzen" natuerlich nicht so leicht zu messen und sehr abhaengig von der Art der Nutzung ist. Jedenfalls steigt in vielen Bereichen der Nutzen nicht linear mit dem Aufwand.

Das ist aber anwendungs-, anwender- und vor allem auch interpretationsabhängig. Was du als schlecht ansiehst, sieht der nächste als guten Nutzen an. Rechenleistung/W ist halbwegs objektiv (auch bedingt anwendungsabhängig) - was mit der Rechenleistung getan wird, kann dann jeder selbst entscheiden.

foofoobar · 31. März 2026

mae schrieb:
Warum sollte das so sein? Ich finde Nutzen/W z.B. viel relevanter.

Der typische Nutzen von Floatingpoint Monstern ist alles was Flops benötigt.

Kadett_Pirx · 31. März 2026

stefan92x schrieb:
Warum? Die einzige Metrik, die hier relevant ist, ist Flops/Watt, und das nicht pro GPU berechnet sondern pro Datacenter. Und das wird immer besser, auch wenn (oder eher gerade weil) der Verbrauch pro GPU steigt.

Nö, es ist irgendwann auch die "Metrik" interessant, wieviel Energie absolut für den ganzen "Schwachsinn" verballert wird.

LamaMitHut · 31. März 2026

@Kadett_Pirx was bei Rubin bezogen auf "Aufgabe xy" halt deutlich weniger ist, als beim Vorgänger.

derSafran · 31. März 2026

FrozenPie schrieb:
War-Page, Warp-Age... Wenn man das Wort noch nie gesehen hat, weiß man erst gar nicht wie man's lesen soll

Habe auch dreimal lesen müssen, bis ich auf "Worpitsch" gekommen bin, vom verformen

Nighteye · 31. März 2026

Kein wunder das immer mehr Leaker sagen, 3nm RTX 6000 für Gamer kommt evtl erst 2028.
Ganz schöne durststrecke, von 2022 bis 2028 den gleichen Prozess für RTX GPU,s bei Nvidia.

bensen · 31. März 2026

Kadett_Pirx schrieb:
Nö, es ist irgendwann auch die "Metrik" interessant, wieviel Energie absolut für den ganzen "Schwachsinn" verballert wird.

Wie viel für den ganzen "Schwachsinn" verbraten wird, hat aber rein gar nichts mit dem Hardware-Design zu tun. @stefan92x hat also vollkommen recht.

TeeKayEV · 31. März 2026

Kadett_Pirx schrieb:
Nö, es ist irgendwann auch die "Metrik" interessant, wieviel Energie absolut für den ganzen "Schwachsinn" verballert wird.

Energie sind Wattstunden, Leistung sind Watt. Ein Chip mit 3000 W Leistungsaufnahme, der für 1s läuft, um eine Berechnung durchzuführen, "verballert" absolut weniger Energie als ein Chip mit 300 W Leistungsaufnahme, der für die gleiche Berechnung eine Minute benötigt. Darum ist es sehr viel ökonomischer, bei z.B. Folding@Home eine 600 W RTX 5090 zu nutzen als eine 160 W RTX 2060.

Kadett_Pirx · 31. März 2026

LamaMitHut schrieb:
@Kadett_Pirx was bei Rubin bezogen auf "Aufgabe xy" halt deutlich weniger ist, als beim Vorgänger.

erstmal ist es mehr pro Chip und wieviel besser als bisherige Chips kann den Rubin die anstehenden "KI"-Aufgaben lösen? Aufgrund der Beschränkung des "I" vermute ich mal, daß hier mit Atombomben auf den Spatzen-Grenznutzen geschossen wird.

News Angebliche Packaging-Probleme: Nvidia Rubin Ultra reizt CoWoS-L von TSMC aus

Ost 1

Admiral Pro

Captain

Lieutenant

Lt. Junior Grade

Rear Admiral

Cadet 2nd Year

Rear Admiral

Captain

Admiral

Commander

TeeKayEV

Gast

Rear Admiral

Lieutenant

Captain

Lieutenant Pro

Lt. Commander

Fleet Admiral

TeeKayEV

Gast

Lieutenant

Passend zum Thema