News Rekordumsätze: Microns HBM-Zug nimmt Fahrt auf und hat viel Geld geladen

ETI1120 · 30. Juni 2025

eastcoast_pete schrieb:
]Die Radeon VII war, auch wegen des Einsatzes von teurem HBM, eine GPU an der AMD mit jeder Karte eher Geld verloren als verdient hat.

So ist es. Bei Vega wird nicht viel hängen geblieben sein und bei Radeon VII kam es AMD nicht darauf an.

Die Vega 20 war von Anfang an für Profi Karten konzipiert, wo höhere Preise erzielt werden. Die Zielgruppe sieht man auch an der FP64 Performance.

AMD hat kurzfristig beschlossen die Radeon VII herauszubringen, als Platzhalter bis Navi kommt. Sobald Navi draußen war hat AMD ziemlich schnell die Radeon VIi eingestellt. Die Profi-Versionen liefen noch lange.

Alleine schon der Umstand dass die viel kleinere 5700 XT mit erheblich weniger Bandbreite so nahe an die Radeon VIi kam sollte eigentlich zu denken geben.

Mit RDNA 2 kam der Infinity Cache und damit war offensichtlich, dass es kein HBM für Gaming Grafik Karten geben wird, weil es schlicht nicht notwendig ist.

Das Caching beim Gaming sehr gut funktioniert ist eigentlich offensichtlich, wie schnell ändern sich die dargestellten Inhalte?

eastcoast_pete · 30. Juni 2025

stefan92x schrieb:
@eastcoast_pete d) die Modelle müssen in den Speicher passen und HBM ermöglicht höhere Kapazitäten als GDDR. Der Punkt fehlte dir noch, ist aber auch enorm wichtig. Denn sobald Modellparameter im Betrieb nachgeladen werden müssen, wird die Verbindung zur CPU zum Flaschenhals und die Performance bricht ein.

Stimmt; wobei auch GDDR durchaus "in groß" angelegt werden kann, wenn die Beschleuniger entsprechend ausgelegt sind. Die RTX6000 ist auch deshalb ziemlich spannend, obwohl große Modelle wie DeepSeek R1 gerne deutlich mehr RAM hätten. Weshalb die, die sich's leisten können und an HBM3, 3E oder 4 rankommen, trotzdem immer auf sehr viel HBM und extrem schnelle Vernetzung setzen werden.

Ich vermute auch (Spekulatius!), daß die Notwendigkeit, HBM2E benutzen zu müssen einer der Gründe ist, warum zB Huaweis großer KI Beschleuniger ungefähr das 2-3 Fache an Strom für dieselbe Rechenleistung benötigt wie der equivalente von Nvidia. Wobei Huawei ja auch nicht auf TSMCs EUV Knoten fertigen lassen kann. Dafür hat China viel billigen Strom.

stefan92x · 30. Juni 2025

eastcoast_pete schrieb:
Stimmt; wobei auch GDDR durchaus "in groß" angelegt werden kann, wenn die Beschleuniger entsprechend ausgelegt sind. Die RTX6000 ist auch deshalb ziemlich spannend

Das stimmt, aber ein GB200 hat immer noch viermal so viel Speicher mit achtmal so schneller Anbindung, da bleibt der Unterschied zwischen GDDR und HBM eben doch noch deutlich bestehen. Verglichen mit dem, was man sonst von Grafikkarten gewohnt ist, ist die RTX6000 aber tatsächlich ein Monster, es ist noch nicht lange her, dass man nur mit HBM in den Bereich kam.

Suche

News Rekordumsätze: Microns HBM-Zug nimmt Fahrt auf und hat viel Geld geladen

ETI1120

Captain

eastcoast_pete

Commander

stefan92x

Commodore

Ähnliche Themen

Passend zum Thema

Xtacking 4.0 Neuer 3D-NAND von YMTC soll in Serie gehen

Für A14-Chips ab 2028 TSMC legt in Kürze den Grundstein für die neue Fab 25

Umstrukturierungen Intel bittet angeblich Ex-Partner Apple um Finanzspritze