News Neues Design-Konzept: SK Hynix will HBM und GPU zu einem Chip vereinen

Man stelle sich SoC's vor bei denen die iGPU dedizierten vram hat.
Gerade für "kleinere" Geräte wie das SteamDeck klingt das schon spannend.
 
ghecko schrieb:
Ich wünschte AMD würde APU und HBM vereinen. Es führt kein Weg dran vorbei, der GPU-Teil muss schneller werden aber die Speicherbandbreite wächst nicht schnell genug mit. Künftige APUs werden HBM brauchen, ob mit Interposer oder On-DIE.

Sherman789 schrieb:
Das fände ich sehr interessant als Gegenentwurf zu Apples M Serie. Mit KI und Media-Encodern auf einem x64 SoC.

Ghostshield schrieb:
Zen 5c / 8 Core / 16 Threads/ 16MB L3
RDNA4 / 20CUs / 2560 Shader / 80TMUs / 64 ROPs
HBM4 / 32 GB / 1024 Bit / 4,0 Gbps / 512GB/s
(Speicher für die Effizienz untertaktet und untervoltet)

das wäre mein Traum SOC für ein Handheld

Apple zeigt doch dass es für all das kein HBM braucht. Apple nutzt langsamen LPDDR5-6400 und kommt trotzdem auf 400 GByte/s mit 8 channeln in 4 stacks mit ihrem M1/2/3 Max. Und wesentlich schnellerer LPDDR ist ja schon verfügbar.

Das begrenzte Bandbreite liegt einfach daran dass AMD&Co keine breiten Interfaces verbauen wollen. Nicht daran das auf LPDDR gesetzt wird
 
  • Gefällt mir
Reaktionen: Sherman789
phanter schrieb:
Das begrenzte Bandbreite liegt einfach daran dass AMD&Co keine breiten Interfaces verbauen wollen. Nicht daran das auf LPDDR gesetzt wird
Guter Punkt. Fraglich, ob das so ohne weiteres ohne gravierende Änderungen an der Architektur möglich ist?
 
phanter schrieb:
Apple zeigt doch dass es für all das kein HBM braucht
Ich will aber keine Kopie des M mit Unified Memory. Apples Lösung ist weder Günstiger als HBM noch platzsparender.

Ein HBM-Stack als VRAM reicht und die DDR5-Channel bleiben nach wie Vor für die CPU reserviert.
So kann man den RAM nach wie vor erweitern anstatt beim Kauf festzulegen, wie viel man nimmt.
Dann steigen auch nicht die Board-Preise weiter. Quadchannel DDR5 vergrößert Sockel und Aufwand für die Boardpartner immens.
 
Ghostshield schrieb:
Zen 5c / 8 Core / 16 Threads/ 16MB L3
RDNA4 / 20CUs / 2560 Shader / 80TMUs / 64 ROPs
HBM4 / 32 GB / 1024 Bit / 4,0 Gbps / 512GB/s
(Speicher für die Effizienz untertaktet und untervoltet)

das wäre mein Traum SOC für ein Handheld
Und das wird nicht billig - keine Ahnung, wie groß der Markt da sein könnte
 
ghecko schrieb:
Ich will aber keine Kopie des M mit Unified Memory. Apples Lösung ist weder Günstiger als HBM noch platzsparender.

Ein HBM-Stack als VRAM reicht und die DDR5-Channel bleiben nach wie Vor für die CPU reserviert.
So kann man den RAM nach wie vor erweitern anstatt beim Kauf festzulegen, wie viel man nimmt.
Dann steigen auch nicht die Board-Preise weiter. Quadchannel DDR5 vergrößert Sockel und Aufwand für die Boardpartner immens.

HBM unified wäre am kleinsten aber 4-8 channel LPDDR kommt direkt danach
HBM VRAM only oder 4 echte DDR channels wären mit Abstand größer und auch stromhungriger! Zudem unflexibler in der Nutzung.

Zusätzlich kostet HBM selbst mindestens 3x (eher 5+x) so viel wie lpddr. Also für 8GB HBM + 16GB DDR5 könntest du auch direkt 48GB LPDDR5 verbauen und wärst in allen belangen besser aufgestellt. Auch da du keinen teuren Interposer brauchst. Die 48GB RAM sowohl von der CPU als auch GPU eingesetzt werden können, und sogar Bandbreiten mäßig da du ja nur auf einen einzelnen Stack HBM setzen würdest. Diese Konfiguration macht gar keinen Sinn.
 
phanter schrieb:
Also für 8GB HBM + 16GB DDR5 könntest du auch direkt 48GB LPDDR5 verbauen und wärst in allen belangen besser aufgestellt. Auch da du keinen teuren Interposer brauchst.
Nur passt das in keinen AM5-Sockel mehr. Ich bezweifle stark dass 8-16GB HBM2/3 mehr kosten als Unmengen an LPDDR5 auf das Substrat zu klatschen. Zumal die bei Apple auch gestacked sind und alles andere ans günstig.
 
phanter schrieb:
Hm, wozu überhaupt APUs?

Weil es genug Menschen gibt (wie mich) die keine RTX4090 brauchen, aber dennoch gerne mehr GPU-Leistung im Prozessor hätten als aktuell. Insbesondere wenn es um Systeme wie den Deskmini geht, die NUC-Klasse oder Laptops. Aber der Desktop muss teil des Systems bleiben und das beißt sich eben mit Apples Ansatz. Die Boardpartner werden keine 5 unterschiedlichen RAM-Konfigurationen bei jedem Prozessor für jedes Board vorhalten um das alles dann verlötet zu verkaufen. Wenn das nicht in einen Sockel passt, ist der PC-Markt ausgeschlossen.
 
Zuletzt bearbeitet:
ghecko schrieb:
Hm, wozu überhaupt APUs?
In Mobile (ebenfalls NUC)-> platzsparend, Energiesparend, etc... LPDDR optimale Lösung
Im Desktop -> günstig da weniger Komponenten, .... DDR5 ausreichend
Im High-End Desktop:
-Massiv höhere RAM Bandbreite für die CPU
-Verhältnismäßig riesige VRAM Größen für die GPU
-Synergien für kombinierte Workloads

Du willst irgendwie eine medium Lösung die teurer ist als CPU+GPU, unflexibler, keinen Strom spart, aber dafür.... was genau erreicht?
 
phanter schrieb:
Du willst irgendwie eine medium Lösung die teurer ist als CPU+GPU
Was ich bezweifle. Es ist ja nicht so als hätten wir HBM nicht schon in Konsumerprodukten gehabt.
phanter schrieb:
Gesockelt und freie Auswahl bei der RAM-Konfiguration ist Flexibilität. Apple ist unflexibel.
phanter schrieb:
keinen Strom spart
Keine Ahnung wo du das her hast, aber HBM spart definitiv Strom gegenüber einer dedizierten GPU derselben Leistungsklasse.
phanter schrieb:
aber dafür.... was genau erreicht?
APUs im PC-Markt mit allen derzeitigen Vorteilen ohne die DC DDR5 Bandbreitenbegrenzung.
 
ghecko schrieb:
Was ich bezweifle. Es ist ja nicht so als hätten wir HBM nicht schon in Konsumerprodukten gehabt.
  • Also die GPU-Die mm² ändern sich ja nicht. Die werden ja eher teuerer da sie nun ein Teil eines größeren Chips sind, und ja weiter ein separates Speicherinterface (HBM) brauchen
  • HBM selbst ist teurer als GDDR
  • Du brauchst einen Interposer der Größe Chip + HBM, der abgesehen davon dass er sehr teuer ist aktuell auch überhaupt nicht verfügbar ist, da TSMC&Co am Packaging Limit sind, da alle Interposer für AI&Co gebraucht werden
  • Was du dir sparst ist ein bisschen PCB und ein paar Spannungswandler
Sehe nicht wo deine APU da günstig wird.
ghecko schrieb:
Gesockelt und freie Auswahl bei der RAM-Konfiguration ist Flexibilität. Apple ist unflexibel.
Aber keine Wahl bei der VRAM konfiguration
ghecko schrieb:
APUs im PC-Markt mit allen derzeitigen Vorteilen ohne die DC DDR5 Bandbreitenbegrenzung.
Aber erneut wozu?
möglichst klein (NUC) etc... ist wieder die mobile Lösung mit LPDDR besser
Und falls groß nimm halt einfach ne dGPU
 
phanter schrieb:
Sehe nicht wo deine APU da günstig wird.
Mir geht es nicht darum dass sie günstig ist, sie sollte nur nicht teurer sein als die CPU und GPU, die sie ersetzt.
phanter schrieb:
Aber keine Wahl bei der VRAM konfiguration
Wann hatten wir das denn das letzte mal? Du propagierst Apples Ansatz aber kritisierst Inflexibilität beim VRAM meines Ansatzes?
phanter schrieb:
Aber erneut wozu?
Wir drehen uns hier im Kreis, aber irgendeinen Nutzen scheinen APUs zu haben, sonst würde es sie nicht geben.
Du präferierst den Weg den Apple beschreitet, ich nicht. Können wir glaube ich dabei belassen.
 
phanter schrieb:
Sehe nicht wo deine APU da günstig wird.
Wenn deine APU 100 W verbraten darf, hast du schon eine sehr starke Kombi.
Zusammen mit HBM ist der Platzverbrauch auch gering.
Du musst auf ein Laptop-Mainboard halt keine eigenständige GPU drauf pflanzen, was den Produktionskosten des Mainboards und der Kühlung, da eventuell kompakter, zugute kommen sollte.
Nur, der bisher einzige Versuch in diese Richtung wurde wieder eingestellt.
Da wären 8 GB HBM und eine RDNA mit 20 - 30 CUs problemlos unterzubringen. Und ja, 8 GB sollten als Einstieg vollkommen reichen.
Die größte Frage ist natürlich, ob so eine Unified-Memory-Architektur mit kombinierten DDR5 günstig möglich ist. Da kann ich mir vorstellen, das ein einzelner RAM-Channel ausreichend ist, sofern DDR5-6400 genutzt wird. Dieser muss ja nur die CPU versorgen.
 
ghecko schrieb:
Mir geht es nicht darum dass sie günstig ist, sie sollte nur nicht teurer sein als die CPU und GPU, die sie ersetzt.
Und das werden sie halt. Vor allem, da du eine APU um einen Desktopsockel designst, die eigentlich aber in den allermeisten Fällen nicht in dem Sockel eingesetzt wird. Die paar APUs die für AM5 verkauft werden machen einen winzigen Anteil der APUs aus die AMD verkauft
ghecko schrieb:
Wann hatten wir das denn das letzte mal? Du propagierst Apples Ansatz aber kritisierst Inflexibilität beim VRAM meines Ansatzes?
Wie gesagt, die Basis config sind 48GB zum selben Preis wie 8Gb HBM, was wahrscheinlich alle als minimum ansehen würden. Bringste vielleicht noch eine 96GB Zweitvariante und du hast alles abgedeckt. Glaube nicht dass hier viele Konfigurationen nötig sind.
ghecko schrieb:
Wir drehen uns hier im Kreis, aber irgendeinen Nutzen scheinen APUs zu haben, sonst würde es sie nicht geben.
Gibt es in deiner Form ja nicht. Gibt es ja nur in meiner Form
ghecko schrieb:
Du präferierst den Weg den Apple beschreitet, ich nicht. Können wir glaube ich dabei belassen.
Apple Ansatz ist generell fragwürdig. Aber nicht wenn man sich rein auf APUs beschränkt
Ergänzung ()

andi_sco schrieb:
Wenn deine APU 100 W verbraten darf, hast du schon eine sehr starke Kombi.
Zusammen mit HBM ist der Platzverbrauch auch gering.
Du musst auf ein Laptop-Mainboard halt keine eigenständige GPU drauf pflanzen, was den Produktionskosten des Mainboards und der Kühlung, da eventuell kompakter, zugute kommen sollte.
Nur, der bisher einzige Versuch in diese Richtung wurde wieder eingestellt.
Da wären 8 GB HBM und eine RDNA mit 20 - 30 CUs problemlos unterzubringen. Und ja, 8 GB sollten als Einstieg vollkommen reichen.
Die größte Frage ist natürlich, ob so eine Unified-Memory-Architektur mit kombinierten DDR5 günstig möglich ist. Da kann ich mir vorstellen, das ein einzelner RAM-Channel ausreichend ist, sofern DDR5-6400 genutzt wird. Dieser muss ja nur die CPU versorgen.
Mobile macht halt wieder LPDDR5 unified viel mehr Sinn. Da sind wir uns ja einig. Er will ja nur HBM für nen Desktopsockel
 
ghecko schrieb:
Handheld? Das möchte ich in Laptops und PCs.
Was ich aber noch hinzufügen möchte sind 2 DDR5-Channel, um den Speicherbereich der CPU zu erweitern.
Quasi das was Apple verkackt hat. Nachrüstbaren RAM und M.2-Steckplätze.
mit Zen 5c RDNA4 und HBM4 kann man erst 2025 rechnen und dann kommt auch die Halo APU mit 8C+8c 40CUs 256Bit LPDDR5 für Notebooks.
phanter schrieb:
Apple zeigt doch dass es für all das kein HBM braucht. Apple nutzt langsamen LPDDR5-6400 und kommt trotzdem auf 400 GByte/s mit 8 channeln in 4 stacks mit ihrem M1/2/3 Max. Und wesentlich schnellerer LPDDR ist ja schon verfügbar.

Das begrenzte Bandbreite liegt einfach daran dass AMD&Co keine breiten Interfaces verbauen wollen. Nicht daran das auf LPDDR gesetzt wird
Nachteil an Apples Lösung:
Es brauch viel platz auf den Board
ein 512Bit interface ist größer als ein 4096bit HBM interface und benötigt mehr Strom.

mit HBM und ein Stack lässt es sich alles auf ein Chip stapeln.

andi_sco schrieb:
Und das wird nicht billig - keine Ahnung, wie groß der Markt da sein könnte
Was ich so heraus finden konnte ist das ein so ein HBM Stack bei ~160-200$ liegen dürfte.
das Gesamte Tablet könnte am ende in der Region vom ROG Ally liegen 699-799€
 
Ghostshield schrieb:
Es brauch viel platz auf den Board
ein 512Bit interface ist größer als ein 4096bit HBM interface und benötigt mehr Strom.

phanter schrieb:
Der Transistor Verbrauch im Chip selber dürfte auch höher sein. War ja schließlich eines der angepriesenen Vorteile für HBM
 
Zurück
Oben