News AMD Instinct: MI300X mit 192 GB HBM3 und 153 Milliarden Transistoren

MichaG · 14. Juni 2023

Für den AI- und HPC-Sektor hat AMD bereits im Januar die APU MI300A mit Zen-4-Kernen und CDNA-3-GPU angekündigt. Jetzt folgt eine rein GPU-basierte Variante: Die MI300X erhöht auf 153 Milliarden Transistoren und 192 GB HBM3, um darin große LLMs auszuführen.

Zur News: AMD Instinct: MI300X mit 192 GB HBM3 und 153 Milliarden Transistoren

Krik · 14. Juni 2023

Das Chiplet-Design scheint sich für AMD echt auszuzahlen.

Büro-CPU? 1-2x CPU-Chiplets, 0-1x GPU-Chiplets, 0-1x Cache-Chiplets
Gamer-CPU? 1-2x CPU-Chiplets, 0-1x GPU-Chiplets, 1-2x Cache-Chiplet
Server-CPU? Ja zu CPU-Chiplets, ja zu Cache-Chiplets
KI-Beschleiniger? 0x CPU-Chiplets, 8x GPU-Chiplets, extra-ja zu Cache-Chiplets

SANDTIGER · 14. Juni 2023

Puh Schön schön ....nur Superlative bin aber gespannt ob wir HBM(3) nochmal in Consumer Produkten sehen die sollen ja Energie effizienter sein als GDDR Ram
Bei 24GB Ram sollte es schon was bringen wenn es kein Effiziens-Märchen war da bin ich von der 7XXX Generation der Grafikkarten irgendwie ein bisschen enttäuscht.

Chesterfield · 14. Juni 2023

Nvidias Quartaszahlen haben eine klare Sprache gesprochen, daher klar wo auch die Reise auch für
AMD gehen wird ! KI !!!!

S.Kara · 14. Juni 2023

Beim Speicher hat Nvidia noch die H100 NVL mit 188 GB HBM3 in der Pipeline.

Was KI angeht ist Nvidia seit Jahren vor AMD. Wenn der Speicher knapp wird stüzt die Leistung extrem ab, hier kann AMD durchaus mit den 192 GB punkten, muss aber über den Preis kommen. Wenn der nah an der 80er Variante liegt siehts gut aus.

projectneo · 14. Juni 2023

Das große Problem von AMD ist nicht die Hardware, zwar dürfte wie im Artikel erwähnt NVidia noch immer die Nase in Punkto Leistung vorn haben aber das Hauptproblem ist das Ökosystem und der Support. Dir bringt die ganze Hardware nichts, wenn sie nicht vernünftig programmiert werden kann oder schon die Implementierung Zicken macht. Da hat AMD noch einen weiten Weg vor sich und es ist leider wie so oft, AMD muss in den Bereichen erst investieren bevor Kunden aufspringen.

BDR529 · 14. Juni 2023

All das bringt AMD leider wenig, wenn die größte Bandbreite an KI Software auf Nvidia (CUDA) zugeschnitten ist. Da muss zuerst einmal was passieren, bis AMD überhaupt eine Chance hat zu Nvidia aufzuholen.

BxBender · 14. Juni 2023

Da kann man mal sehen, wie man die Transistoren einsetzen kann.
Apple baut damit einen Mini-PC, AMD einien riesigen Serverbackstein.
So grundverschieden kann die Ausrichtung sein.
Daher halte ich diese ewigen Äpfel mit Birnen Vergleiche für unnötig.
Die Präsentationsfolien und "Benchmarks" sind eh nicht aussagekräftig und nur für den eigenen Vorteil hochoptimiert.

Austronaut · 14. Juni 2023

Vielleicht bremst das den Höhenflug von Nvidia etwas ein und man merkt das dann auch an den Preisen für Consumer Produkten. Ist wohl Wunschdenken...

BxBender · 14. Juni 2023

_Aqua_ schrieb:
Das Chiplet-Design scheint sich für AMD echt auszuzahlen.

Büro-CPU? 1-2x CPU-Chiplets, 0-1x GPU-Chiplets, 0-1x Cache-Chiplets
Gamer-CPU? 1-2x CPU-Chiplets, 0-1x GPU-Chiplets, 1-2x Cache-Chiplet
Server-CPU? Ja zu CPU-Chiplets, ja zu Cache-Chiplets
KI-Beschleiniger? 0x CPU-Chiplets, 8x GPU-Chiplets, extra-ja zu Cache-Chiplets

Das System ist vor allen Dingen kostenoptimiert.
Natürlich hat ein monolitisches Design in zahlreichen Ausführungen, angepasst auf die jeweils nötige Anwendung, immer noch seine eigenen Vorteile, verschlingt aber unter anderem halt Unsummen an Entwicklung und ist halt auch nicht unendlich skalierbar.
Ich finde AMD's Ansatz auf jeden Fall zukunftssicherer.

DevPandi · 14. Juni 2023

_Aqua_ schrieb:
KI-Beschleiniger? 0x CPU-Chiplets, 8x GPU-Chiplets, extra-ja zu Cache-Chiplets

Bei der Server-APU und der Server-GPU ist der Cach-Chiplet der integrale Bestandteil, weil dieser neben dem IF quasi die Kommunikation übernimmt. Er ist hier ebenso der Bestandteil, der hier den unified Memory in dieser Form erst möglich macht.

Es gibt die Basetiles mit Infinity-Fabric und den Memory-Controllern für den HBM. Die Basetiles werden per IF verbunden und darauf dann die CPU und GPU. Eine "einfache" Lösung, die aber sehr viel bringt. Ich bin gespannt ob man "ähnliches" später bei RDNA4 oder RDNA5 sieht, wenn sie dann mehre GCDs nutzen werrden/wollen. Der Aufbau würde einiges einfacher machen.

SANDTIGER schrieb:
Bei 24GB Ram sollte es schon was bringen wenn es kein Effiziens-Märchen war da bin ich von der 7XXX Generation der Grafikkarten irgendwie ein bisschen enttäuscht.

Ja und Nein. HBM unterliegt ab manchen Punkten den gleichen Grenzen wie GDDR-Speicher und das Mehr an Leistung kommt dann primär über den Takt, der die Vorteile bei Effizienz ein Stückweit dann negiert.

Das Hauptproblem bei HBM3 ist aber, dass dieser pro GiB deutlich teurer ist - komplexere Herstellung - und man das Interface nicht belieibig verbreitern kann und auch nicht entsprechend viele Interfaces pro Chip unterbringen kann.

HBM könnte DDR und GDDR nur ablösen auf allen Feldern, wenn er günstiger werden würde. Das ist aber aktuell nicht in Sicht.

S.Kara schrieb:
Was KI angeht ist Nvidia seit Jahren vor AMD.

Ja und Nein zur gleichen Zeit. Bei der Hardware - den Tensor-Kernen - ist NVIDIA voraus. Gleichzeitig ist der KI-Markt aber in weiten Teilen nicht so abhängig von NVIDIA, wie es der HPC-Markt allgemein durch CUDA ist.

Viele denken - siehe Zitat - das NVIDIA hier "der" Platzhirsch ist, dank CUDA, das stimmt aber zum Glück nicht.

BDR529 schrieb:
All das bringt AMD leider wenig, wenn die größte Bandbreite an KI Software auf Nvidia (CUDA) zugeschnitten ist.

Nein, da erliegst du einem Irrtum. Gerade im KI-Bereich ist NVIDIA auf Softwareseite eben nicht der Platzhirsch - zum Glück. Google, Meta und Co haben das Feld von ML bereits vor NVIDIA stark beackert und haben entsprechend ihre Frameworks Hardwareagnostisch umgesetzt. TensorFlow und Co als Framework können mit verschiedenen "Treibern" versehen werden, entsprechend gibt es einen CUDA-Unterbau, aber auch einen Metal - wenn man Apple-Rechner hat - einen DirectML und Co.

NVIDIA scheint hier eine "Übermacht" zu sein, weil NVIDIA - gerade beim Marketing zu den "Consumern" alles daran setzt um eine Verbindung KI und NVIDIA herzustellen, nur Firmen wie Google, Apple, Microsoft, Meta und Co mögen keine einseitige Abhängigkeit, da sie sich damit Erpressbar machen und entsprechend gehen die da vor.

Intel arbeitet ja auch an entsprechenden API-Unterbau für TensorFlow und Co mit ihrer OneAPI. In diesem Bereich ist NVIDIA also garnicht mal so fest im Sattel, wie man durch das Marketing meinen könnte.

vegagamer · 14. Juni 2023

SANDTIGER schrieb:
bin aber gespannt ob wir HBM(3) nochmal in Consumer Produkten sehen

Die letzten Karten waren soweit ich weiß ja die Vega Serie. Obwohl ich bei der Vega schon fast nicht von Consumer sprechen möchte. Ich meine die Karten sind ja dermaßen untergegangen…was schade war bzw. ist.

D0m1n4t0r · 14. Juni 2023

Ist ja alles schön und gut, aber ich will auch eine Consumer Variante davon als ganz normale Grafikkarte. Mit HBM3.
Baut ne Karte die so schnell wie die RTX 4090 ist und packt 32 GB HBM Speicher drauf. Nvidia würde sowas für 2000 Euro verkaufen. Bin mir sicher bei dem Preis würde sich das auch für AMD lohnen sowas zu fertigen.

Glyphus · 14. Juni 2023

DevPandi schrieb:
Nein, da erliegst du einem Irrtum. Gerade im KI-Bereich ist NVIDIA auf Softwareseite eben nicht der Platzhirsch - zum Glück. Google, Meta und Co haben das Feld von ML bereits vor NVIDIA stark beackert und haben entsprechend ihre Frameworks Hardwareagnostisch umgesetzt. TensorFlow und Co als Framework können mit verschiedenen "Treibern" versehen werden, entsprechend gibt es einen CUDA-Unterbau, aber auch einen Metal - wenn man Apple-Rechner hat - einen DirectML und Co.

Wie sieht das eigentlich unter Linux aus für AMD? DirectML ist da sicher aussen vor und ROCm wird wohl nie produktive Level erreichen. Wie perfomant ist man da mit OpenCL unterwegs?

KurzGedacht · 14. Juni 2023

D0m1n4t0r schrieb:
Ist ja alles schön und gut, aber ich will auch eine Consumer Variante davon als ganz normale Grafikkarte. Mit HBM3.

Nö willst du (vermutlich?) eher nicht. AMD hat ja die computing und gaming Architekturen getrennt. Das hier ist keine RDNA Architektur und nur bedingt für gaming geeignet.
Die werden wie damals Vega das Problem haben , dass sie die theoretische Rechenleistung in Games nicht wirklich umgesetzt bekommen.

habla2k · 14. Juni 2023

Der Name erinnert mich an

Son-Goku-Ultra-Instinct-Goku-Mastered-ultra-instinct-Dragon-Ball-Dragon-Ball-Z-Kai-Super-Saiya...png

Slowz · 14. Juni 2023

DevPandi schrieb:
Viele denken - siehe Zitat - das NVIDIA hier "der" Platzhirsch ist, dank CUDA, das stimmt aber zum Glück nicht.

Nein, da erliegst du einem Irrtum. Gerade im KI-Bereich ist NVIDIA auf Softwareseite eben nicht der Platzhirsch - zum Glück. Google, Meta und Co haben das Feld von ML bereits vor NVIDIA stark beackert und haben entsprechend ihre Frameworks Hardwareagnostisch umgesetzt. TensorFlow und Co als Framework können mit verschiedenen "Treibern" versehen werden, entsprechend gibt es einen CUDA-Unterbau, aber auch einen Metal - wenn man Apple-Rechner hat - einen DirectML und Co.

Das Problem ist aber, dass es Bereiche gibt, in denen AMD leider keiner Alternative zu Nvidia darstellt. Ich arbeite bspw. in der (KI-)Forschung und mir ist bisher nicht ein einziges Paper untergekommen, in dem nicht PyTorch oder Tensorflow mit einer Nvidia Grafikkarte genutzt wird. Das betrifft auch Paper von Google, Microsoft und Co. Evtl. sieht das im Produktiveinsatz anders aus, dennoch würde ich Nvidia definitiv als Platzhirsch sehen.

LamaMitHut · 14. Juni 2023

Gibt ja noch andere spannende KI-Monster von IBM (das mit dem virtuellen L3 Cache ist krass) oder Cerebras WSE-2.

Das Wettrüsten beginnt gerade erst.

vegagamer · 14. Juni 2023

Slowz schrieb:
Das Problem ist aber, dass es Bereiche gibt, in denen AMD leider keiner Alternative zu Nvidia darstellt. Ich arbeite bspw. in der (KI-)Forschung und mir ist bisher nicht ein einziges Paper untergekommen, in dem nicht PyTorch oder Tensorflow mit einer Nvidia Grafikkarte genutzt wird. Das betrifft auch Paper von Google, Microsoft und Co. Evtl. sieht das im Produktiveinsatz anders aus, dennoch würde ich Nvidia definitiv als Platzhirsch sehen.

AMD hatte sehr lange eine meiner Meinung nach ziemlich Konservative GPU Sparte. Kein Wunder also, das Nvidia sich hier die Markt gesichert hat. Trotzdem scheint AMD es ja langsam auf die Kette zu bekommen, was sich definitiv positiv auf den Markt und die Technologie auswirken kann. Konkurrenz belebt ja bekanntlich das Geschäft.

BAR86 · 14. Juni 2023

SANDTIGER schrieb:
Puh Schön schön ....nur Superlative bin aber gespannt ob wir HBM(3) nochmal in Consumer Produkten sehen die sollen ja Energie effizienter sein als GDDR Ram
Bei 24GB Ram sollte es schon was bringen wenn es kein Effiziens-Märchen war da bin ich von der 7XXX Generation der Grafikkarten irgendwie ein bisschen enttäuscht.

die größte Stromerspqrnis kommt AFAIR vom Speichercontroller, nicht vom Speicher

News AMD Instinct: MI300X mit 192 GB HBM3 und 153 Milliarden Transistoren

Redakteur

Fleet Admiral

Lt. Commander

Fleet Admiral

Captain

Lt. Commander

Lt. Commander

Lt. Commander

Lt. Commander

Lt. Commander

Redakteur

Lt. Junior Grade

Commodore

Ensign

Lt. Commander

Commodore

Lt. Commander

Commander

Lt. Junior Grade

Lt. Commander

Ähnliche Themen