Fireplace
Mobile Footer Layer

News Angebliche Packaging-Probleme: Nvidia Rubin Ultra reizt CoWoS-L von TSMC aus

Volker

Ost 1
Teammitglied
Registriert
Juni 2001
Beiträge
20.049
  • Gefällt mir
Reaktionen: schneeland, Chismon, BlinkBlink und 10 andere
Ich rate mal.
Es wird nur knappe Stückzahlen geben.
Diese werden sehr viel teurer verkauft?
 
  • Gefällt mir
Reaktionen: Kitsune-Senpai, schneeland, rentex und 6 andere
@ZeroCoolRiddler Spielt für uns ja keine Rolle. Die können den Kram für 100 Mio pro Chip von mir aus an die AI-Bros verticken. 😂
 
  • Gefällt mir
Reaktionen: goldeye, rentex, BlinkBlink und 2 andere
Bei diesem Design ist mit bisher nie gesehenem Stromhunger dieser Grafikkarten zu rechnen.

Laut Toms Hardware könnte eine einfache Rubin-GPU um die 2 kW TDP haben, Rubin Ultra dann ca. 3,5 kW.

Finde ich schockierend.
 
  • Gefällt mir
Reaktionen: Sebbi, rentex und HolySkillet
War-Page, Warp-Age... Wenn man das Wort noch nie gesehen hat, weiß man erst gar nicht wie man's lesen soll :D
 
  • Gefällt mir
Reaktionen: Kitsune-Senpai, BlinkBlink, derSafran und 3 andere
dodolein schrieb:
Finde ich schockierend.
Warum? Die einzige Metrik, die hier relevant ist, ist Flops/Watt, und das nicht pro GPU berechnet sondern pro Datacenter. Und das wird immer besser, auch wenn (oder eher gerade weil) der Verbrauch pro GPU steigt.
 
  • Gefällt mir
Reaktionen: Syrato, phanter, slow_snail und 6 andere
Als Reticle-Size-Limit in der Branche gilt die Maximalgröße eines einzelnen Chips, der mit gängigen Belichtungsmaschinen Kantenlängen von bis zu 26 × 33 mm bzw. 858 mm² haben kann.

Ich verstehe noch nicht, was Belichtungsmachinen mit Recticlegröße (zumindest in dieser Größenordnung) zu tun haben.
Werden Wafer nicht immer noch im Ganzen belichtet?
Oder ist das ein Yieldproblem?
 
HolySkillet schrieb:
Werden Wafer nicht immer noch im Ganzen belichtet?
Nein, Chip für Chip wird auf dem Wafer belichtet. Und das kann halt maximal dieses Reticle-Limit sein.
 
  • Gefällt mir
Reaktionen: Kitsune-Senpai, phanter und HolySkillet
dodolein schrieb:
Bei diesem Design ist mit bisher nie gesehenem Stromhunger dieser Grafikkarten zu rechnen.

Laut Toms Hardware könnte eine einfache Rubin-GPU um die 2 kW TDP haben, Rubin Ultra dann ca. 3,5 kW.

Finde ich schockierend.
Schockierend ist eher, dass einige keine Ahnung von Effizienz haben.
 
  • Gefällt mir
Reaktionen: phanter und Chaosbreed
dodolein schrieb:
Bei diesem Design ist mit bisher nie gesehenem Stromhunger dieser Grafikkarten zu rechnen.

Laut Toms Hardware könnte eine einfache Rubin-GPU um die 2 kW TDP haben, Rubin Ultra dann ca. 3,5 kW.

Finde ich schockierend.
stefan92x schrieb:
Warum? Die einzige Metrik, die hier relevant ist, ist Flops/Watt, und das nicht pro GPU berechnet sondern pro Datacenter. Und das wird immer besser, auch wenn (oder eher gerade weil) der Verbrauch pro GPU steigt.
Oder, um einen Vergleich mit CPUs zu wagen: Es ist besser, eine CPU mit einem 16-Channel-I/O-DIE und 16 CCDs zu konstruieren als in gleicher Gen ein Dual-Sockel-Board mit zwei 8-Channel-I/O-DIEs und 8CCDs. Ersteres wird zwar als einzelnes Package betrachtet das doppelte an Strom schlucken, die Plattform insgesamt wird aber weniger brauchen und höhere Performance bringen. (da die Latenzen auf Grund der reduzierten Distanz geringer ausfallen)
 
  • Gefällt mir
Reaktionen: Pesky_ und stefan92x
stefan92x schrieb:
Warum? Die einzige Metrik, die hier relevant ist, ist Flops/Watt

Warum sollte das so sein? Ich finde Nutzen/W z.B. viel relevanter. Wobei "Nutzen" natuerlich nicht so leicht zu messen und sehr abhaengig von der Art der Nutzung ist. Jedenfalls steigt in vielen Bereichen der Nutzen nicht linear mit dem Aufwand. Wenn z.B. ein typischer Nutzen von AI der ist, dass ein Arbeitgeber 20% seiner Belegschaft kuendigen kann und (vorerst) dafuer weniger an Big Tech abliefern muss als die Lohnkosten dieser 20% vorher waren, und er mit den hoeherverbrauchenden AI-Chips jetzt 21% kuendigen kann, wird der Mehrertrag fuer Big Tech dann tatsaechlich so stark steigen wie die zusaetzlichen Energiekosten?
 
  • Gefällt mir
Reaktionen: Kadett_Pirx
mae schrieb:
Warum sollte das so sein? Ich finde Nutzen/W z.B. viel relevanter. Wobei "Nutzen" natuerlich nicht so leicht zu messen und sehr abhaengig von der Art der Nutzung ist. Jedenfalls steigt in vielen Bereichen der Nutzen nicht linear mit dem Aufwand.
Das ist aber anwendungs-, anwender- und vor allem auch interpretationsabhängig. Was du als schlecht ansiehst, sieht der nächste als guten Nutzen an. Rechenleistung/W ist halbwegs objektiv (auch bedingt anwendungsabhängig) - was mit der Rechenleistung getan wird, kann dann jeder selbst entscheiden.
 
  • Gefällt mir
Reaktionen: NguyenV3, stefan92x, 12nebur27 und eine weitere Person
stefan92x schrieb:
Warum? Die einzige Metrik, die hier relevant ist, ist Flops/Watt, und das nicht pro GPU berechnet sondern pro Datacenter. Und das wird immer besser, auch wenn (oder eher gerade weil) der Verbrauch pro GPU steigt.
Nö, es ist irgendwann auch die "Metrik" interessant, wieviel Energie absolut für den ganzen "Schwachsinn" verballert wird.
 
  • Gefällt mir
Reaktionen: Fallout667
FrozenPie schrieb:
War-Page, Warp-Age... Wenn man das Wort noch nie gesehen hat, weiß man erst gar nicht wie man's lesen soll :D
Habe auch dreimal lesen müssen, bis ich auf "Worpitsch" gekommen bin, vom verformen :D
 
Kein wunder das immer mehr Leaker sagen, 3nm RTX 6000 für Gamer kommt evtl erst 2028.
Ganz schöne durststrecke, von 2022 bis 2028 den gleichen Prozess für RTX GPU,s bei Nvidia.
 
Kadett_Pirx schrieb:
Nö, es ist irgendwann auch die "Metrik" interessant, wieviel Energie absolut für den ganzen "Schwachsinn" verballert wird.
Wie viel für den ganzen "Schwachsinn" verbraten wird, hat aber rein gar nichts mit dem Hardware-Design zu tun. @stefan92x hat also vollkommen recht.
 
  • Gefällt mir
Reaktionen: LamaMitHut, stefan92x und 12nebur27
Kadett_Pirx schrieb:
Nö, es ist irgendwann auch die "Metrik" interessant, wieviel Energie absolut für den ganzen "Schwachsinn" verballert wird.
Energie sind Wattstunden, Leistung sind Watt. Ein Chip mit 3000 W Leistungsaufnahme, der für 1s läuft, um eine Berechnung durchzuführen, "verballert" absolut weniger Energie als ein Chip mit 300 W Leistungsaufnahme, der für die gleiche Berechnung eine Minute benötigt. Darum ist es sehr viel ökonomischer, bei z.B. Folding@Home eine 600 W RTX 5090 zu nutzen als eine 160 W RTX 2060.
 
LamaMitHut schrieb:
@Kadett_Pirx was bei Rubin bezogen auf "Aufgabe xy" halt deutlich weniger ist, als beim Vorgänger.
erstmal ist es mehr pro Chip und wieviel besser als bisherige Chips kann den Rubin die anstehenden "KI"-Aufgaben lösen? Aufgrund der Beschränkung des "I" vermute ich mal, daß hier mit Atombomben auf den Spatzen-Grenznutzen geschossen wird.
 
Zurück
Oben