News HBM4 ist fertig: SK Hynix schickt HBM4 mit „über 10 Gbps“ für Nvidia in Serie

Volker

Ost 1
Teammitglied
Registriert
Juni 2001
Beiträge
19.534
  • Gefällt mir
Reaktionen: Pry_T800, SweetOhm, schneeland und 6 andere
2 davon auf meine Grafikkarte...
 
  • Gefällt mir
Reaktionen: Firezeed, Flutefox, Abexa und eine weitere Person
@SSD960 Ich finde es bis heute schade, dass wenn wir schon Grafikkarten jenseits von 1000€ haben, diese nicht wenigstens mit "Spezial-RAM" bestückt werden. Ich meine bei der Fury X und Vega war es ja auch möglich.
Und es gäbe diverse kleine Vorteile.

Wenn also Nvidia einen 800mm² N2 Gaming Chip bringen würde mit 64 GB HBM4(e) würde ich die 2000€ eher verstehen.
Auch weil man dank HBM ja nach wie vor effizienter ist, könnte es auch eine effiziente Variante geben, müsste nicht richtung 600 Watt gehen für mich...
 
  • Gefällt mir
Reaktionen: Firezeed, SweetOhm, SSD960 und 2 andere
@BAR86
Die Preise der consumer GPUs sind ein Witz im Vergleich zu denen der Enterpriseklasse. Da kannst du keinen Anspruch auf den besten und schnellsten RAM haben. Enterprise ist eine ganz andere Liga
 
  • Gefällt mir
Reaktionen: N85 und Randfee
@c2ash
Nicht Enterprise, sondern die AI-Blase. Das wird doch nur deshalb so hart gepusht. Falls die Blase platzt, so fallen auch praktisch alle use cases für HBM weg und somit fie Preise.
Wir hatten ja HBM schon in bezahlbraen Consumer-GPUs 🤷‍♂️
 
  • Gefällt mir
Reaktionen: Eee-PC, SweetOhm, SSD960 und 2 andere
BAR86 schrieb:
@SSD960 Ich finde es bis heute schade, dass wenn wir schon Grafikkarten jenseits von 1000€ haben, diese nicht wenigstens mit "Spezial-RAM" bestückt werden. Ich meine bei der Fury X und Vega war es ja auch möglich.
Und es gäbe diverse kleine Vorteile.

Wenn also Nvidia einen 800mm² N2 Gaming Chip bringen würde mit 64 GB HBM4(e) würde ich die 2000€ eher verstehen.
Auch weil man dank HBM ja nach wie vor effizienter ist, könnte es auch eine effiziente Variante geben, müsste nicht richtung 600 Watt gehen für mich...
Für was? Die 32GB der 5090 werden nicht mal ansatzweise in Spielen genutzt, Bandbreite gibts mit GDDR7 im Überfluss. Es würde die Grafikkarten nur noch teurer machen ohne einen Nutzen zu haben.
 
  • Gefällt mir
Reaktionen: Palomino, schneeland, herrStreusalz und eine weitere Person
c2ash schrieb:
@BAR86
Die Preise der consumer GPUs sind ein Witz im Vergleich zu denen der Enterpriseklasse.
öhm... danke für die Info... glaubst du jetzt im Ernst, dass das was Neues ist für mich?Muss meinetwegen auch nicht der neueste HBM sein, reicht ja auch die vorige GEn oder Chips die die Leistung nicht schaffen
Ergänzung ()

TheInvisible schrieb:
Für was? Die 32GB der 5090 werden nicht mal ansatzweise in Spielen genutzt, Bandbreite gibts mit GDDR7 im Überfluss. Es würde die Grafikkarten nur noch teurer machen ohne einen Nutzen zu haben.
also mir fällt da genug ein, wir haben hier die Titans am start, da laufen allerhand wissenschaftliche Berechnungen drauf weil wir das Geld für Quadros nicht ausgeben und auch nicht für HPC Beschleuniger.
Auch als AI Playground wäre es nett.

Zumal RAM eigentlich nicht so teuer ist und man auch 64GB in Zukunft mit Mods voll kriegt wenn man nur an Spiele denkt
 
  • Gefällt mir
Reaktionen: Randfee, SweetOhm und Charminbaer
SK Hynix verdient sich als bisher alleinigher Lieferrant von NVidia eine Goldene Nase am Ki Markt. Die können also die preis eso hoch machen wie sie wollen. NVidia wird alles kaufen und seinerseits die preise einfach höher machen. Da treffen an für sich schon 2 Monopole aufeinander die eine suppl chain bilden.

Können nur hoffen das Samsung und andere Mitbewerber da schnell hinterher kommen. Das wird alles nicht besser für den Markt. Und ich meine das allgemein. Ich rede nicht von Gamer Grafikkarten. Aber diese Künstliche inflation die im Grunde genommen durch monopolisten erzeugt wird, trifft am ende immer auch die Bevölkerung und frisst sie auf. Es braucht endlich mehr Fähiger Mitbewerber in der Technologie Branche.
 
  • Gefällt mir
Reaktionen: SweetOhm und feris
Hat Samsung mittlerweile eigentlich hinbekommen HBM 3 in ordentlicher Qualität für Nvidia herzustellen?
 
BAR86 schrieb:
also mir fällt da genug ein, wir haben hier die Titans am start, da laufen allerhand wissenschaftliche Berechnungen drauf weil wir das Geld für Quadros nicht ausgeben und auch nicht für HPC Beschleuniger.
Die letzte Titan? Also 2080Ti mit 24GB Speicher?
Können die überhaupt noch gut mithalten?
 
@ruthi91 sind schon etwas lahm, daher wünsche ich mir einen ordentlichen Nachfolger, ohne Frau und Kinder verkaufen zu müssen ;)
 
  • Gefällt mir
Reaktionen: N85 und Randfee
@BAR86
"Glaubst du das ist was neues für MICH" 😂
Sorry dass ich dein Ego verletzt habe 😎
 
  • Gefällt mir
Reaktionen: N85, menace_one und herrStreusalz
Vielleicht kommt ja ne Radeon RX X090 XTC (ganz schön viel X hier) oder ne RTX Pro 7000/RTX 6090 mit sowas :daumen:
Ergänzung ()

TheInvisible schrieb:
Es würde die Grafikkarten nur noch teurer machen ohne einen Nutzen zu haben.
Geil isses trotzdem
 
  • Gefällt mir
Reaktionen: BAR86
c2ash schrieb:
@BAR86
"Glaubst du das ist was neues für MICH" 😂
Sorry dass ich dein Ego verletzt habe 😎
Nein, du hast mich nur zum Schmunzeln gebracht.
Ich denke das wär nichtmal für Bauer Hans was neues, aber es extra zu erwähnen in einem Forum voller Tech Nerds fand ich schon witzig. Da rechne ich noch nichtmal meine Arbeit mit ein...
Ergänzung ()

TheInvisible schrieb:
Es würde die Grafikkarten nur noch teurer machen ohne einen Nutzen zu haben.
Nicht wirklich btw, bei den oberen Grafikkarten zahlt man ja nicht fürs RAM sondern Angebot und Nachfrage, du könntest eine 2000€ Karte sowohl mit dem einen, als auch anderen ausstatten.
32GB HBM (um den Vergleich zur Geforce 5090 zu machen) kosten wie viel?
 
  • Gefällt mir
Reaktionen: SweetOhm und herrStreusalz
@BAR86
Wieso hast du es dann überhaupt erwähnt für die consumer GPUs, wenn es eh nur für Enterprise ist. Jetzt widersprichst du dir selbst. Laut deiner Aussage ist es doch ein Nerd Forum. Warum also solch eine Aussage von dir?
 
Zuletzt bearbeitet:
@c2ash Ich fände es auch super, wenn es im Consumerbereich kommt. Dass die obersten Karten übertrieben viel RAM kriegen ist doch normal.
Eine 6080 mit 24GB oder 32GB würde ich ebenso begrüßen, ist aber nicht so wahrscheinlich wie eine Karte die ohnedies nördlich von 2000€ kostet. Und wenn ich schon eine Karte - die erst in 2 Jahren kommt - mit Spezialram kaufe, mit unnötig viel Geld will ich sowohl als Gamer, als auch als jemand der ab und zu darauf was anderes lafuen lässt, lieber zu viel als zu wenig RAM haben. Also 48 oder 64 GB.

Ich würde es für die Arbeit genauso nutzen wie als Gamer.
HBM hat ja nicht nur den Vorteil, dass es schneller ist, es ist ja auch effizienter und die SI fressen weniger Chipfläche was widerum entweder den Chip kleiner macht oder eben mehr Platz für mehr Shader und Co.

Also ja, ich will eine Titan oder 6090 mit HBM, weil wenn man 2000€+ ausgibt darf es auch was besseres sein.

Und ja, es ist ein Nerdforum für Nerdhardware wir reden hier aber über Enterprisehardware, ich würde sie halt gerne in "normaleren" Consumerprodukten sehen, so schwer ist das ja nicht zu verstehen, oder?
Auch weil die Consumerprodukte eher das ist, was wir zum Rumspielen bekommen - also sowohl für die Arbeit, als auch fürs Privatvergnügen. Wobei ich Privat lieber keine 600W Brocken haben will... HBM aber wie gesagt geringfügig effizienter wäre und man hypothetisch die Leistung einer Karte die mit GDDR6 600W Frisst vielleicht auch deutlich sparsamer umsetzen könnte.
Insofern wäre (älteres) HBM auch für Notebookchips interessant, zumindest technisch.
Da die Leute sich eh schon dämlich zahlen, nur damit das Notebook klein und Effizient ist, wäre das einmal interessant

Kurzum gesagt, für ein Premiumprodukt wie die hyptothetische 6090 oder 7090 hätte ich gerne auch Premium RAM. Der Preis ist sowieso Fantasiesache, das hat mit dem Speicher nix mehr zu tun.
So könnten aktuelle Grafikkartenhersteller ohne weiteres 32 GB RAM Verbauen (GDDR6 ist grünstig, GDDR7 etwas teurer). Kann niemand ernsthaft behaupten, dass viel RAM viel kostet.
1757680580128.png
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Eee-PC, N85, Randfee und 2 andere
Sad Samsung noises 😭
 
  • Gefällt mir
Reaktionen: Ayo34
Hi@all!

Huhu
@BAR86

HBM4 vs GDDR7.png


Da muss man nichts mehr dazu sagen,
warum es im Consumerbereich nicht eingesetzt wird.

1. Alle Kapazität geht an die AI/KI, was vollkommen logisch ist,
da wird die Kohle mit gemacht.
2. Könnte man eine 5090 mit HBM4 bestücken geht diese ganz weit über 3000 Euro am Markt an den Kunden.

Gruß
Mehlstaub
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: N85 und c2ash
@MehlstaubtheCat dann sollen sie in Consumer-Karten zumindest HBM3(e) reinpacken, der kostet zumindest nicht ganz so viel :daumen:
Ergänzung ()

MehlstaubtheCat schrieb:
ganz weit über 3000 Euro am Markt an den Kunden.
Frag mal bei Asus :)
 
  • Gefällt mir
Reaktionen: SweetOhm und Charminbaer
MehlstaubtheCat schrieb:
Hi@all!

Huhu
@BAR86

Anhang anzeigen 1656473

Da muss man nichts mehr dazu sagen,
ich kann es nicht fassen, dass du im ernst einfach eine KI Fragst und die Daten keineswegs hinterfragst.
Sind wir als Menschheit schon so verblödet, dass wir sagen "hey ich geb das jetzt einfach ein und dann kopier ichs rüber, stimmt ja 100%ig"?
(Zumal das der Beweis ist, dass KI offenbar DIE Zukunft ist, man muss selbst nicht mehr denken und es ist auch leider sehr direkt die Unterstützung dafür, dass KI Firmen weiter KI Chips kaufen und somit die GPU Preise indirekt mit befeuern)
MehlstaubtheCat schrieb:
warum es im Consumerbereich nicht eingesetzt wird.
Dasselbe wird übrigens seit 10 Jahren gesagt und es stimmt dennoch nicht, es gab ja damals auch Konsumerprodukte
Die Fury, die Vega und sogar einen Intel Mobilchip mit AMD GPU und HBM.

Abgesehen davon spreche ich ja nicht von den 200€ Karten, sondern den 2000+€ Karten, wo es durchaus möglich (!) wäre.

Auch das weit verbreitete Märchen - dass RAM die GPUs so teuer macht habe ich weiter oben widerlegt, außer man ist gezwungen den letzten, neueseten RAM zu nehmen. Was man ja eben auch bei HBM nicht ist.
Sobald hier auf eine neue GEN gesetzt wird, werden ja Ressourcen frei.
MehlstaubtheCat schrieb:
1. Alle Kapazität geht an die A, wass vollkommen logisch ist,
da wird die Kohle mit gemacht.
ja das ist klar, aber das heißt nicht, dass man nicht auch einen Teil davon abführen kann falls er nicht mehr benötigt wird. Im AI Bereich wird aktuell nur auf das absolut neueste gesetzt, aber die Produktion von etwas älteren, nicht so hoch getakteten Chips hört ja nicht plötzlich auf, sondern läuft noch ein wenig weiter. Mit der Dauer wird die Produktion ja auch günstiger.
MehlstaubtheCat schrieb:
2. Könnte man eine 5090 mit HBM4 bestücken geht diese ganz weit über 3000 Euro am Markt an den Kunden.
Erstens muss es nicht HBM4 sein, HBM3 reicht ja auch, zweitens stimmt das ja so nicht pauschal.
Wenn etwa HBM4 4x so viel kostet wie GDDR7, vielleicht kostet HBM3 4x so viel wie GDDR6. Die Preise von GDDR6 hab ich dir ja oben gezeigt. Das sind aber keine KI Preise sondern aktuelle Handelspreise



PS:
Ich kann auch doof eine KI zitieren, da steht, dass man sich durch den Wechsel auf GDDR7 nur "über 50% pro GB" spart. Und auch die Theorie, dass dadurch Produkte teurer würden ist widerlegt, wenn man sich aktuelle Speicherpreise ansieht:
1757686172047.png


GDDR7 und HBM-Speicher: Eine umfassende Kosten-Nutzen-Analyse und Marktausblick



1. Executive Summary: Die strategische Disparität bei der Speicherpreisgestaltung


Während GDDR7 und HBM beides hochbandbreitige Speicherlösungen für Grafikprozessoren (GPUs) und KI-Beschleuniger sind, sind ihre Preisgestaltung und ihre Anwendungsbereiche grundlegend unterschiedlich. GDDR7 bietet aufgrund seiner konventionellen Fertigung und Integration einen erheblichen Kostenvorteil, was es zur dominierenden Wahl für Consumer- und kostensensitive Anwendungen macht. HBM hingegen erzielt einen Premiumpreis, der durch seine komplexe, fortschrittliche Verpackung getrieben wird, liefert aber ein Leistungs- und Effizienzprofil, das für die anspruchsvollsten KI- und High-Performance-Computing (HPC)-Workloads unerlässlich ist. Die Wahl zwischen den beiden ist daher keine einfache Sparmaßnahme, sondern eine strategische Entscheidung, die auf dem Anwendungsfall, den Leistungsanforderungen und den langfristigen Gesamtbetriebskosten basiert.
Die vorliegende Analyse kommt zu dem Ergebnis, dass GDDR7 derzeit mehr als 50 % günstiger pro Gigabyte ist als HBM, was die Speicherkosten in bestimmten Konfigurationen um das bis zu Fünffache senken kann.1 Der HBM-Markt erlebt indessen ein explosives Wachstum, das bis 2030 voraussichtlich einen Wert von fast
49 Milliarden US-Dollar erreichen wird, gegenüber einer Bewertung von knapp 1 Milliarde US-Dollar im Jahr 2023.2 Diese hohe Nachfrage bei gleichzeitig begrenztem Angebot führte in den letzten Jahren zu einem Verkäufermarkt. Analysen deuten jedoch darauf hin, dass eine signifikante Preiskorrektur bevorsteht, wobei ein
zweistelliger Preisrückgang im Jahr 2026 erwartet wird, da das Angebot die Nachfrage einholt.3
GDDR7 überschreitet strategisch seine traditionelle Rolle im Gaming-Segment und erobert einen neuen Markt im Bereich der KI-Inferenz und des Edge Computing.4 Seine Mischung aus hoher Bandbreite, geringer Latenz und Kosteneffizienz positioniert es als eine praktikable Alternative zu HBM in Anwendungsbereichen, in denen das Gleichgewicht zwischen Leistung und Preis entscheidend ist.


2. Die Kernfrage: Dekonstruktion der Kostendifferenz



Direkter Kostenvergleich und Kontext


Der Kostenunterschied zwischen GDDR7 und HBM ist signifikant und beruht auf fundamentalen architektonischen und fertigungstechnischen Unterschieden. Ein direkter Vergleich zeigt, dass GDDR7-Speicher deutlich kostengünstiger ist. Ein Beispiel dafür ist der spezialisierte Rubin CPX-Beschleuniger, der anstelle von HBM auf 128 GB GDDR7 DRAM setzt.1 Dieser strategische Wechsel senkt die Speicherkosten des Produkts um das Fünffache und den Preis pro Gigabyte um
mehr als 50 % im Vergleich zu einer HBM-basierten Alternative.1 Diese Kosteneinsparung ist ein Schlüsselfaktor, der GDDR7 zur idealen Wahl für kostensensitive Produkte in Massenmärkten macht.
Dies steht im krassen Gegensatz zum High-End-HBM-Markt. Ein Flaggschiff-Produkt wie die NVIDIA H100 GPU hat angeblich Produktionskosten von rund 3.300 US-Dollar, wird aber für 25.000 bis 30.000 US-Dollar verkauft.7 Ein erheblicher Teil dieser Wertschöpfung und Marge ist direkt auf die Integration von HBM zurückzuführen. Die Preise für GDDR-Speicherchips sind hingegen wesentlich niedriger. Ein Blick auf die jüngere Vergangenheit zeigt, dass der Spotpreis für 8 GB GDDR6-VRAM vor einem Jahr auf nur
18 US-Dollar gefallen ist, was die Kosteneffizienz dieser Technologie unterstreicht.8 Die jüngsten Markteinführungen von GDDR7-Grafikkarten, wie der NVIDIA GeForce RTX 5090 mit 32 GB GDDR7, spiegeln ebenfalls diesen Ansatz wider, mit Einzelhandelspreisen von rund
2.000 bis 3.000 US-Dollar für das gesamte Produkt, bei dem der Speicher nur einen Bruchteil der Gesamtkosten ausmacht.9


Detaillierte Analyse der HBM-Kostentreiber


Die hohen Kosten von HBM resultieren nicht primär aus dem Preis des rohen Siliziums, sondern sind eine direkte Folge des komplexen und anspruchsvollen Herstellungsprozesses. Der zentrale Kostentreiber sind die fortschrittlichen 2.5D- und 3D-Stacking-Technologien, die auf Through-Silicon Via (TSV)-Interconnects angewiesen sind.2 Der Fertigungsprozess ist wesentlich aufwendiger als bei herkömmlichen Speichern. Er beinhaltet das vertikale Stapeln mehrerer Speicher-Dies auf einem
Silizium-Interposer, der selbst eine teure und komplizierte Komponente ist.10 Dieser Prozess erfordert spezialisierte, kostspielige Anlagen, eine akribische Planung und ein präzises Wärmemanagement, um die hohen Leistungsdichten zu bewältigen.2
Eine detaillierte Aufschlüsselung der Kosten für 2.5D-Packaging verdeutlicht die Komplexität. Die Herstellung von TSVs und die Montage der Komponenten auf dem Interposer machen jeweils 18 % bzw. 15 % der Kosten aus.11 Hinzu kommen Verluste durch geringere Ausbeute: 7 % Ausbeuteverlust bei der TSV-Erstellung und 15 % bei der Montage steigern die Endkosten erheblich.11 Allein die Kosten für den "rohen Interposer" können bis zu 9 % der Gesamtkosten ausmachen.11 Diese hohen technischen und finanziellen Hürden beschränken den Pool der HBM-Anbieter auf ein konzentriertes Triopol:
SK Hynix, Samsung Electronics und Micron Technology.2


Detaillierte Analyse der GDDR7-Kostentreiber


Die Kosteneffizienz von GDDR7 resultiert aus einem einfacheren, etablierten Herstellungs- und Verpackungsprozess. Im Gegensatz zu HBM, bei dem die Speicherchips vertikal gestapelt werden, werden GDDR7-Chips in der Regel direkt auf der Hauptplatine (PCB) der Grafikkarte verlötet.13
Dieser konventionelle Ansatz umgeht die Notwendigkeit von teuren Silizium-Interposern und komplexen TSV-Fertigungsprozessen, was sowohl die Produktionskosten als auch die Ausbeuteverluste im Zusammenhang mit fortschrittlicher Verpackung erheblich reduziert.1 Die einfachere Integration ermöglicht auch eine größere Modularität und Flexibilität. GPU-Hersteller können für einen einzigen GPU-Die eine breite Palette an VRAM-Kapazitäten anbieten, indem sie einfach die Anzahl der auf der Platine verlöteten GDDR7-Chips anpassen.13 Dies steht im Gegensatz zur festen Kapazität von HBM, die direkt in den GPU-Die integriert ist.


Erkenntnisse der zweiten und dritten Ordnung: Die Ökonomie der Knappheit und die "HBM-Steuer"


Die hohen Kosten von HBM sind nicht nur eine Funktion seiner Materialkosten, sondern auch ein strategisches Instrument. Da die Herstellung von HBM komplex ist und die Anzahl der Lieferanten begrenzt ist 2, ist das Angebot für die neuesten High-End-Chips, die in der KI-Beschleunigung verwendet werden, oft knapp.7 Diese Knappheit ermöglicht es GPU-Herstellern, eine Wert-basierte Preisstrategie zu verfolgen.17 Anstatt den Preis einfach auf der Grundlage der Produktionskosten festzulegen, können sie eine komplette Lösung (GPU plus HBM) zu einem massiven Aufschlag verkaufen, wobei der HBM-Speicher die primäre Komponente ist, die diesen Mehrwert ermöglicht.
Das eklatante Beispiel der H100 GPU, deren Einzelhandelspreis um ein Vielfaches höher ist als die gemeldeten Produktionskosten, veranschaulicht, wie der Anbieter von der angespannten Versorgungslage profitiert.7 Dieser Sachverhalt hat in der Branche eine Diskussion über eine "HBM-Steuer" ausgelöst, bei der die Kosten des Speichers direkt an die Kunden weitergegeben werden, was zu außerordentlichen Gewinnmargen führt. Um diese Abhängigkeit zu verringern, entwickeln einige konkurrierende Unternehmen ihre eigenen anwendungsspezifischen integrierten Schaltkreise (ASICs), um den Speicher von der GPU-Rechenleistung zu entkoppeln und die HBM-Chips direkt von den Herstellern zu beziehen. Damit wollen sie sich von NVIDIAs gebündelten Angeboten und den damit verbundenen Premiumpreisen befreien.7


3. Die technologische Kluft: Architektur, Leistung und Effizienz



Bandbreite und Busbreite


Der grundlegendste architektonische Unterschied zwischen GDDR7 und HBM liegt in der Art und Weise, wie sie Bandbreite bereitstellen. HBM erzielt eine massive aggregierte Bandbreite durch seine extrem breite Busschnittstelle.10 Beispielsweise verfügt HBM3 über eine
1024-Bit-Schnittstelle, die eine Bandbreite von 819 GB/s pro Gerät ermöglicht.19 Diese Bandbreite kann durch die Integration mehrerer HBM-Stacks auf einem einzigen Chip auf mehrere Terabytes pro Sekunde skaliert werden, was für datenintensive Workloads unerlässlich ist.10
GDDR7 hingegen erreicht seine hohe Bandbreite durch eine hohe Datenrate pro Pin und eine viel schmalere Busschnittstelle.10 Während GDDR7 beeindruckende Geschwindigkeiten von bis zu
48 Gbit/s pro Pin erreichen kann, hat es typischerweise einen Bus mit nur 32 Bit.10 Dies führt zu einer pro-Gerät-Bandbreite von
128 bis 192 GB/s.10 GDDR7 erzielt dies durch den Einsatz fortschrittlicher Signaltechniken wie der
3-Bit-Pulsamplitudenmodulation (PAM3), die die Effizienz der Datenübertragung im Vergleich zur Vorgängerversion GDDR6 um 50 % verbessert.10


Latenz und Energieeffizienz


HBMs gestapelte Architektur reduziert die physikalische Distanz zwischen dem Speicher-Die und der GPU oder dem Beschleuniger drastisch. Diese kurzen Interconnects in Verbindung mit der breiteren Busschnittstelle und den niedrigeren Taktraten führen zu einer überragenden Energieeffizienz und einer geringeren Wärmeentwicklung im Vergleich zu GDDR.13 HBM4, die nächste Generation, wird voraussichtlich
deutlich energieeffizienter sein als GDDR7.20 GDDR7 hingegen benötigt höhere Frequenzen, um seine Bandbreitenziele zu erreichen, was zu einem
höheren Stromverbrauch und größeren Herausforderungen beim Wärmemanagement führt.13
Hinsichtlich der Latenz gibt es eine nuancierte Debatte. Während HBMs kurze Signalwege im Allgemeinen die Latenz verbessern, gibt es Berichte, die auf eine "Latenzgrenze" bei HBM hinweisen, die es für eine hohe Anzahl kleinerer Berechnungen, die für einige GPU-Workloads typisch sind, weniger geeignet macht.21 GDDR, das für diese Art von Arbeitslasten optimiert ist, kann in solchen spezifischen Szenarien eine bessere Leistung erbringen.21


Technische Spezifikationen im Vergleich: GDDR7 und HBM


Die folgende Tabelle bietet einen direkten Vergleich der technischen Spezifikationen, der die fundamentalen Unterschiede in der Designphilosophie der beiden Speichertypen hervorhebt.

[TR]
[td]Merkmal[/td][td]GDDR7[/td][td]HBM[/td]
[/TR]
[TR]
[td]Bandbreite pro Gerät[/td][td]128 - 192 GB/s[/td][td]819 GB/s (HBM3)[/td]
[/TR]
[TR]
[td]Busbreite[/td][td]32-bit (pro Gerät)[/td][td]1024-bit (HBM3)[/td]
[/TR]
[TR]
[td]Geschwindigkeit pro Pin[/td][td]32 - 48 Gbps[/td][td]6.4 Gbps (HBM3)[/td]
[/TR]
[TR]
[td]Signaltechnologie[/td][td]PAM3[/td][td]NRZ[/td]
[/TR]
[TR]
[td]Architektur[/td][td]2D-Flachchip[/td][td]2.5D/3D-Stapel[/td]
[/TR]
[TR]
[td]Typische Spannung[/td][td]1.2V[/td][td]1.2V und niedriger[/td]
[/TR]
[TR]
[td]Energieeffizienz (relativ)[/td][td]Geringer als HBM[/td][td]Höher als GDDR7[/td]
[/TR]
[TR]
[td]Hauptanwendungsfall[/td][td]Gaming, KI-Inferenz, Workstations[/td][td]KI-Training, HPC, Rechenzentren[/td]
[/TR]


4. Das strategische Gebot: Anwendungsfälle und Wertversprechen


Die Kostenunterschiede zwischen GDDR7 und HBM sind keine einfache technische Einschränkung, sondern eine strategische Wahl, die auf den spezifischen Anwendungsanforderungen und dem Geschäftsmodell basiert. Jede Technologie ist für ihr jeweiliges Marktsegment optimiert und bietet dort das beste Wertversprechen.

Das exklusive Terrain von HBM: KI-Training und HPC


Die architektonischen Vorteile von HBM machen es zum Goldstandard für KI-Training und HPC-Workloads.10 Die Verarbeitung riesiger Datenmengen, die zum Trainieren großer Sprachmodelle (LLMs) und für komplexe wissenschaftliche Simulationen erforderlich ist, erfordert eine
massive Speicherbandbreite, um die Rechenkerne der GPU kontinuierlich mit Daten zu versorgen.10 Nur HBM kann diese Bandbreite liefern, ohne einen Datenengpass zu erzeugen, der die Gesamtleistung des Systems einschränkt.13
Das Wertversprechen für HBM liegt nicht in den geringen Kosten pro Gigabyte, sondern in seiner Fähigkeit, die Produktivität erheblich zu steigern und die Bearbeitungszeit für komplexe Probleme zu verkürzen.13 Für Unternehmenskunden, bei denen die Rechenzeit Millionen von Dollar kosten kann, ist die hohe Anfangsinvestition in HBM ein lohnendes Unterfangen, da die Effizienzgewinne die zusätzlichen Kosten bei weitem überwiegen.


Das sich erweiternde Terrain von GDDR7: Gaming und KI-Inferenz


GDDR7 bleibt die optimale Speicherlösung für Consumer-GPUs im Gaming- und Workstation-Bereich.5 Die Kombination aus hoher Bandbreite und Kosteneffizienz ist perfekt für anspruchsvolle Echtzeit-Anwendungen wie Raytracing und hochauflösendes Gaming.5
GDDR7 ist auch zunehmend eine bevorzugte Lösung für KI-Inferenz-Workloads am Edge und in Rechenzentren.4 Inferenz erfordert zwar hohe Geschwindigkeiten und geringe Latenz, benötigt aber nicht die gleiche immense Bandbreite wie das Training großer Modelle. GDDR7 liefert eine „hervorragende Kombination aus hoher Bandbreite und geringer Latenz“ zu einem Preis, der den Einsatz von Beschleunigern für die Inferenz im großen Maßstab erheblich wirtschaftlicher macht.4 Es ermöglicht eine breitere Akzeptanz von KI in Anwendungen, bei denen die Kosten eine wichtige Rolle spielen.


Anwendung und Wertmatrix



[TR]
[td]Speichertyp[/td][td]Schlüsselanwendungen[/td][td]Geschäftsziele[/td][td]Begründung[/td]
[/TR]
[TR]
[td]HBM[/td][td]KI-Training, HPC, Große Sprachmodelle[/td][td]Maximale Leistung, schnellere Durchbrüche[/td]
[td]Unübertroffene aggregierte Bandbreite, überragende Energieeffizienz, Verkürzung der Zeit bis zur Lösung 10[/td]
[/TR]
[TR]
[td]GDDR7[/td][td]Gaming, Workstations, KI-Inferenz[/td][td]Maximale Investitionsrendite, breite Akzeptanz[/td]
[td]Hohe Leistung zu geringeren Kosten, ideal für Massenmärkte, gute Balance zwischen Bandbreite und Latenz 1[/td]
[/TR]


5. Wettbewerbslandschaft und Dynamik der Lieferkette



Das HBM-Triopol


Der HBM-Markt ist von einer kleinen Gruppe spezialisierter Hersteller dominiert: SK Hynix, Samsung Electronics und Micron Technology.2
SK Hynix hat eine führende Position mit einem Marktanteil von rund 54 % 12, die durch eine starke Allianz mit NVIDIA gestärkt wird.3
Samsung bemüht sich aktiv darum, diese Lücke zu schließen, indem es die Validierung von HBM3E beschleunigt und aggressive Preisstrategien verfolgt.12 Das Unternehmen soll HBM3E für NVIDIAs H20-GPU zu Preisen angeboten haben, die
20-30 % unter denen von SK Hynix liegen, was den intensiven Wettbewerb um die Marktführerschaft unterstreicht.23
Micron ist ebenfalls ein wichtiger Akteur, der die Produktion hochfährt und wichtige Lieferverträge, wie den über 3 Milliarden US-Dollar mit AMD, abschließt.24


Das neue Schlachtfeld GDDR7


Parallel zum HBM-Wettlauf hat sich der Markt für GDDR7 zu einem neuen, heiß umkämpften Schlachtfeld entwickelt.25 Alle drei dominierenden Hersteller, Samsung, SK Hynix und Micron, haben GDDR7-Produkte oder -Muster angekündigt oder auf den Markt gebracht.
Samsung war der erste, der GDDR7 mit einer Geschwindigkeit von 32 Gbit/s entwickelte, während SK Hynix ein Produkt mit 40 Gbit/s vorstellte und Micron mit 32 Gbit/s antrat und eine Steigerung der Bandbreite um 60 % gegenüber GDDR6 anstrebt.25 Diese Bemühungen zielen darauf ab, sich Aufträge von großen GPU-Herstellern wie NVIDIA für die kommenden RTX 50-Serie zu sichern.26


Erkenntnisse der zweiten und dritten Ordnung: Geopolitik als Engpass in der Lieferkette


Die Knappheit auf dem HBM-Markt wird nicht nur durch die Komplexität der Herstellung verursacht, sondern auch durch geopolitische Faktoren. Die HBM-Lieferkette ist aufgrund der Konzentration der Hersteller und der Abhängigkeit von spezialisierten Geräten, die überwiegend von westlichen Zulieferern stammen, anfällig.16 Diese Abhängigkeit bedeutet, dass Exportkontrollen und Handelspolitik direkte Engpässe darstellen können. Ein deutliches Beispiel hierfür ist Chinas Bestreben, eine eigene KI-Infrastruktur aufzubauen. Obwohl das Land über ausreichende Fertigungskapazitäten für KI-Prozessoren verfügt, werden seine Ambitionen durch den
Mangel an HBM-Lieferketten behindert.16 Dieser Zustand verschafft westlichen Unternehmen einen
anhaltenden Vorteil und wandelt HBM von einem einfachen technologischen Produkt in einen strategischen nationalen Vermögenswert um, dessen Kosten von globalen politischen Entscheidungen beeinflusst werden.


6. Zukunftsausblick: Preisprognose und Technologien der nächsten Generation



HBM-Preiskorrektur am Horizont


Trotz der derzeit hohen Preise und der ausverkauften Produktionskapazitäten 27 warnen Analysten von Goldman Sachs vor einem erheblichen Marktwandel. Sie prognostizieren einen
zweistelligen Preisrückgang für HBM im Jahr 2026.3 Der Grund dafür ist, dass der schnelle Ausbau der Produktionskapazitäten der großen Hersteller voraussichtlich die Nachfrage übertreffen wird, was zu einem Überangebot führt, das den Durchschnittspreis nach unten drückt.3
Die HBM-Branche zeigt eine typische zyklische Entwicklung. Derzeit herrscht eine Situation, in der die kurzfristige Nachfrage das Angebot übersteigt.27 Die drei Hauptakteure haben darauf mit massiven Investitionen in neue Fabriken und Kapazitäten reagiert.3 Der Bau und die Qualifizierung dieser neuen Kapazitäten dauert jedoch Jahre 7, was zu einer zeitlichen Verzögerung zwischen der Investition und dem Markteintritt führt. Sobald dieses neue Angebot den Markt im Jahr 2026 überschwemmt, wird sich der Verkäufermarkt in einen Käufermarkt verwandeln. Dieser zyklische Verlauf verdeutlicht, dass für große Abnehmer von HBM eine langfristige strategische Planung unerlässlich ist, um die zu erwartende Preisvolatilität zu bewältigen.


Das exponentielle Marktwachstum von GDDR7


Der GDDR7-Markt ist nicht nur im Entstehen begriffen, sondern steht vor einem explosiven Wachstum. Das Marktvolumen wird voraussichtlich von 2,88 Milliarden US-Dollar im Jahr 2024 auf 7,91 Milliarden US-Dollar im Jahr 2030 wachsen, was einer jährlichen Wachstumsrate (CAGR) von 18,29 % entspricht.6 Ein weiterer Bericht prognostiziert sogar ein noch aggressiveres Wachstum auf
19,56 Milliarden US-Dollar bis 2033 bei einer CAGR von 32,6 %.28 Dieses rasante Wachstum wird durch die wachsende Verbreitung von GDDR7 in verschiedenen High-Growth-Sektoren, einschließlich Gaming, KI-Inferenz und dem aufstrebenden Automobilsektor, angetrieben.6 Allerdings könnten Handelspolitiken, wie die vorgeschlagenen
25 % Zölle auf Halbleiter, einen strategischen Gegenwind darstellen und die Kosten für Hersteller und Verbraucher gleichermaßen erhöhen.6


Der Blick nach vorn: Die Roadmaps zu HBM4 und darüber hinaus


Der Innovationswettlauf ist unerbittlich. Die Branche bereitet sich bereits auf die nächsten Speichergenerationen vor. HBM3E ist derzeit der Mainstream-Standard, aber HBM4 wird voraussichtlich bereits 2025 auf den Markt kommen.26 Es wird eine revolutionäre
2048-Bit-Speicherschnittstelle bieten und die Bandbreite voraussichtlich erneut verdoppeln.26 Ebenso lässt die JEDEC-Spezifikation für GDDR7 Raum für eine zukünftige Erweiterung auf
48 GT/s, eine signifikante Steigerung gegenüber den anfänglichen 32 GT/s.4 Diese kontinuierliche Innovation wird die grundlegende Leistungs- und Preisdisparität zwischen den beiden Speichertypen aufrechterhalten, wobei jeder seine eigene strategische Nische bedient.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: N85, Charminbaer und MalWiederIch
Zurück
Oben