News HBM2 mit AI: Samsungs Spezial-RAM bringt Processing-In-Memory

Volker

Ost 1
Teammitglied
Registriert
Juni 2001
Beiträge
18.281
Auf Basis von klassischem HBM2 (ohne e) hat Samsung eine Adaption mit programmierbarer Kontrolleinheit entwickelt, die vornehmlich für AI-Beschleunigung und damit für den entsprechenden Markt gedacht ist. Dafür gibt es auf der einen Seite große Boni, auf der anderen Seite müssen aber Kompromisse eingegangen werden.

Zur News: HBM2 mit AI: Samsungs Spezial-RAM bringt Processing-In-Memory
 
  • Gefällt mir
Reaktionen: Smartbomb, Sennox, C4rp3di3m und 4 andere
Hi,

wow, klingt sehr interessant. Bin gespannt, wie sich das Thema noch entwickelt.

VG,
Mad
 
  • Gefällt mir
Reaktionen: Col.Maybourne
Wenn das System auf Bereiche zielt, die sehr stark von der Speicherbandbreite abhängen, könnte darunter dann auch Mining fallen? Wäre natürlich zu schön, wenn dafür dann spezielle Karten mit AI-HBM2 hergestellt werden könnten und dafür dann nicht mehr Consumer-Karten hergenommen werden müssten...
 
Von mir aus gibt es ein Daumen Runter!!
Wieso??
Weil HBM3 so ewig ewig lang dauert bis es mal hier ankommt...
und HBM2e ebenso.
Leicht Frustrierend.
 
Hi,

Claus1221 schrieb:
Wäre natürlich zu schön, wenn dafür dann spezielle Karten mit AI-HBM2 hergestellt werden könnten und dafür dann nicht mehr Consumer-Karten hergenommen werden müssten...

man könnte auch jetzt schon spezialisierte Miner-Hardware nutzen - das hält diese Leute jedoch nicht davon ab, zusätzlich auch die Consumer-Karten zu kaufen. Ich denke, das wäre hier nicht anders.

@-Ps-Y-cO-

wo ist denn das Problem, wenn Dinge für die Zukunft angekündigt werden? Ist doch völlig normal und sinnvoll...

VG,
Mad
 
  • Gefällt mir
Reaktionen: Claus1221 und Col.Maybourne
Claus1221 schrieb:
Wenn das System auf Bereiche zielt, die sehr stark von der Speicherbandbreite abhängen, könnte darunter dann auch Mining fallen?

Es könnte theoretisch funktionieren, die 1,2tflops FP16 könnten für einen solchen Chip gerade so reichen denk ich.

Die Frage ist sicher auch ob es Software seitig möglich ist.
 
  • Gefällt mir
Reaktionen: Claus1221
Claus1221 schrieb:
Wenn das System auf Bereiche zielt, die sehr stark von der Speicherbandbreite abhängen, könnte darunter dann auch Mining fallen?
Das Ding kann leider nur Multiply und Add, beides in FP16. Das wirkt doch arg eingeschränkt, wobei ich kein Experte für Mining bin. Aber so eine Grafikkarte ohne GPU, nur mit HBM-PIM vollgekleistert... Wäre sicher für einige Dinge ganz interessant.
 
  • Gefällt mir
Reaktionen: Snudl und Claus1221
@Volker Wie kommt ihr zur Schlussfolgerung, dass eine GPU genau so energieeffizient wäre? Ich habe mich mit der Technik nicht näher befasst, aber wenn ich das richtig interpretiere, soll die Energieersparnis vor allem aus der Vermeidung von Schnittstellen zwischen Speicher und Gerät resultieren. Das wäre die konsequente Forsetzung des altbekannten Prinzips, Speicher mehr und mehr in die Nähe der Logikeinheiten zu bringen und durch kurze Wege den Energieverbrauch zu senken.
 
  • Gefällt mir
Reaktionen: Aeropony und C.J.
Colindo schrieb:
Das Ding kann leider nur Multiply und Add, beides in FP16. Das wirkt doch arg eingeschränkt, wobei ich kein Experte für Mining bin.
Allgemein betrachtet, reicht das nicht?
Die Frage ist doch letztendlich nur wie viele Taktzyklen sowohl diese als auch darauf basierende Operationen brauchen, verglichen mit der Performance von anderen Systemen, und bei diesem Drecksmining auch im Vergleich zur Leistungsaufnahme.
Mir kommt das sehr pauschal vor.
 
deineMudda schrieb:
Wie kommt ihr zur Schlussfolgerung, dass eine GPU genau so energieeffizient wäre? Ich habe mich mit der Technik nicht näher befasst, aber wenn ich das richtig interpretiere, soll die Energieersparnis vor allem aus der Vermeidung von Schnittstellen zwischen Speicher und Gerät resultieren.
War jetzt nur eine Vermutung, aber niedriger Takt und massive Parallelität helfen halt auch, nicht nur die Speichernähe. Ein Teil ist auch die hohe Speicherbandbreite, die die PCUs vor Ort haben, aber ob die GPU die theoretisch auch haben könnte, ist halt nicht klar.

Also ich verstehe schon, dass es Energie spart, kurze Leitungen zu haben. Aber dass die zwischen HBM und GPU soviel ausmachen würden... Ich weiß ja nicht.
Ergänzung ()

TriggerThumb87 schrieb:
Mir kommt das sehr pauschal vor.
Dafür müsste man schon wissen, wie Mining-Codes funktionieren. Für normales GPGPU würde es definitiv nicht reichen, und darauf basiert Mining ja.
 
Zuletzt bearbeitet:
deineMudda schrieb:
@Volker Das wäre die konsequente Forsetzung des altbekannten Prinzips, Speicher mehr und mehr in die Nähe der Logikeinheiten zu bringen und durch kurze Wege den Energieverbrauch zu senken.

Das denke ich auch. Statt dass alle Daten einmal zur GPU und wieder zurücktransportiert, bleiben sie direkt vor Ort. Ich meine Nvidia hätte schon zu Kepler-Zeiten gesagt, dass Datentransport innerhalb des Chips (und außerhalb sowieso) der immer dominierende Faktor bei der Effizienz sein wird. Ich wette eine 6800XT würde deutlich mehr Strom verbrauchen, wenn sie statt des Infinity Caches ein doppeltes Speicherinterface hätte.

Colindo schrieb:
Also ich verstehe schon, dass es Energie spart, kurze Leitungen zu haben. Aber dass die zwischen HBM und GPU soviel ausmachen würden... Ich weiß ja nicht.

Es hat ja schon extrem viel Strom gespart ein GDDR-Interface durch HBM zu ersetzen. Auch innerhalb des Chips kosten die Wege viel Strom, denn die im HBM prozessierten Daten müssen ja nicht nur vom HBM-Chip bis zum Speichercontroller der GPU, sondern da auch noch über etliche Wege bis in die Compute Units hinein. Während diese Compute Units weiterhin kleiner und sparsamer werden, bleiben die Wege bis zum Speicher gleich lang, weil die Chips selber nicht kleiner werden, sondern einfach mehr Recheneinheiten auf gleicher Fläche verbaut werden. Dadurch steigt der Energiebedarf für den Transport gegenüber dem eigentlichen Rechnen immer weiter an.
 
  • Gefällt mir
Reaktionen: Smartbomb, deineMudda und Colindo
Befehlssatz mit 9 Opcodes :D
 
Hätte ja gerne wieder eine AMD Grafikkarte mit HBM gekauft, gab es na der Fury nicht mehr, oder?

mfg
 
Hä? Jede VEGA hatte HBM und auch die Radeon VII. Zuletzt sogar mit 16GB Speicher! 😊
 
  • Gefällt mir
Reaktionen: -Ps-Y-cO- und C4rp3di3m
@DTB das ist aber schon was länger her oder, hat eine der aktuellen Karten HBM?

mfg
 
@C4rp3di3m
Ja! Die Radeon VII

7nm-GPU und 16GB HBM2
Diese ist sehr aktuell. Wenn nicht sogar Fortgeschrittener als 3090/6900XT


Du wirst nur Keine Bekommen dank der Miner.

und sag nicht sie sei nicht Aktuell, nur weil man sie nicht Kaufen kann ^^
Ein 7nm-Chip ist für mich Aktuell

GV100
GP100

wären auch noch "aktuell", wenn auch mit 12nm bzw. 16nm
mit 5999€ bzw. 9999€ aber ausser reichweite.

A100
P100
G100 ebenso
(auch ausser reichweite, Preismässig)
 
  • Gefällt mir
Reaktionen: Smartbomb und C4rp3di3m
Naja aber eine GPU der 69XX Klasse mit HBM, wäre ja was ich Kaufen möchte.
Die VII gibt es ja schon länger, also ich meine was neues mit HBM, aber kein Pro/CAM gedöns.

mfg
 
Ich denke eher bei RDNA3 bzw. NAVI31 wird es wieder HBM-Speicher geben, da AMD vor hat ein Multi-GPU-Package zu bauen worauf man auch gleich den HBM-Speicher mit draufsetzen kann. Aber ob das wirklich so geplant ist?
Abwarten...
 
  • Gefällt mir
Reaktionen: Smartbomb, Colindo und -Ps-Y-cO-
RNDA 2 mit HBM ?
Da würden die Leute nur wieder Meckern dass das ja vieeel zu teuer sei.

Da nun die Problematik mit dem Mining besteht, sind die beiden so oder so die Bösen und werden natürlich die Preise der nächsten GPU Gen Saftig nach Oben Korrigieren sodass auch Scalper lieber 2x Überlegen.

Und da dann HBM mit an Board zu haben... puhh....
Alleine das MCM wird sich AMD vergolden lassen (zurecht, da innovation)
Und dann noch HBM ? ^^
... Legt schon mal Geld unter das Kopfkissen.
7700XT = 999$
7800XT = 1149$
7900XT = 1499$

alle mit HBM und MCM = Der Aufschrei wird Riesig! ;)
/Glaskugel_ende
 
  • Gefällt mir
Reaktionen: The_King
Zurück
Oben