News 2-ExaFLOPs-Supercomputer: In El Capitan steckt AMDs gesockelte APU Instinct MI300

Volker

Ost 1
Teammitglied
Registriert
Juni 2001
Beiträge
18.361
  • Gefällt mir
Reaktionen: flo.murr, Smartbomb, Skysnake und 8 andere
Das wird ein Monster.
 
  • Gefällt mir
Reaktionen: Onkel Föhn, Max0071980, Tzk und 3 andere
Bin sehr gespannt was die APU zu leisten im Stande ist.
Natürlich auch was AMD in Sachen AI abliefern kann.
Da hinken sie ja noch teils deutlich hinterher.
Aber schon mal sehr gute Aussichten.
 
  • Gefällt mir
Reaktionen: flo.murr
Unglaublich! ... Alleine das die stärksten PCs nur wenige zehntel TFlops erreichen lässt schon erahnen was das für ein Monster wird. Grob gerechnet mit dem Faktor 10.000x schneller als ein guter PC bedeutet das, was der in einer Sekunde schafft, macht ein guter Heim PC in zweieinhalb bis Drei Stunden :o :evillol:
 
Hoffe dass wir auch solche APUs bekommen mit HBM Speicher !!
Schon ein 5700G deckt heute immens viel ab.

APUs ... wie war das? "The future is Fusion"
Hoffentlich auch für den kleinen Endkunden im Heim PC
 
  • Gefällt mir
Reaktionen: Haldi und Salutos
"
Über zwei 2 ExaFLOPS FP64-Leistung soll erzielt werden, also knapp das Doppelte (oder eventuell später auch mehr) des aktuellen Frontier-Designs.
Waren im März 2020 allerdings nur maximal 30 Megawatt im Gespräch, nennen die Macher heute bis zu 40 Megawatt, die jedoch nicht gerissen werden sollen."

ich kann mir ja vieles Vorstellen aber das das Teil nicht effizienter Arbeitet wie Aktuelle Hardware glaube ich nicht. Und die Formulierung könnte man auch auslegen
Anfangs 2EF aber Potential für 40MW was davon anfangs gebraucht wird ?? eventuell nur 20 man will aber noch aufrüsten daher die Erhöhung der Maximal Leistung
 
  • Gefällt mir
Reaktionen: Makso und stefan92x
Gepi87 schrieb:
Unglaublich! ... Alleine das die stärksten PCs nur wenige zehntel TFlops erreichen lässt schon erahnen was das für ein Monster wird. Grob gerechnet mit dem Faktor 10.000x schneller als ein guter PC bedeutet das, was der in einer Sekunde schafft, macht ein guter Heim PC in zweieinhalb bis Drei Stunden :o :evillol:
Falsch das wäre ein Faktor von 10. Millionen! Denn nach Tera kommt erst Peta und dann Exa. ;) Dein Rechner braucht also 5000 bis 6000 Stunden (208 bis 250 Tage!) um El Capitans Sekunde zu toppen, da der ja auch 2 Exaflops packt.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: IllusionOn, McTheRipper, Newbie_9000 und 4 andere
Diesen Aufbau (Zen4/5, GNC3, und HBM3) für die PS5 Pro/PS6 bzw. xbox ...
 
  • Gefällt mir
Reaktionen: Ned Flanders, Haldi und Makso
Gepi87 schrieb:
Unglaublich! ... Alleine das die stärksten PCs nur wenige zehntel TFlops erreichen
Da hast du aber ein paar Jahre Entwicklung verpasst. Große GPUs für Consumer schaffen schon einige dutzend TFlops, auch iGPUs knacken mittlerweile die TFlops-Grenze.

Und da die 2 EFlops ja auch primär vom GPU-Teil geliefert werden, ist das ein legitimer Vergleich.
Ergänzung ()

Cr4y schrieb:
Diesen Aufbau (Zen4/5, GNC3, und HBM3) für die PS5 Pro/PS6 bzw. xbox ...
Realistischer wäre wohl Zen 4, RDNA3 und GDDR, HBM sehen wir bei Consumern wohl nicht mehr.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Newbie_9000 und Skysnake
stefan92x schrieb:
Realistischer wäre wohl Zen 4, RDNA3 und GDDR, HBM sehen wir bei Consumern wohl nicht mehr.
Ich rechne fur Notebooks eher ein Logik Chip mit infinty Cache und drauf eine APU Kombi. Dann reicht vermutlich auch einfacher DDR5.
Vor Zen Zeiten hat AMD schon Muster BSP von APUs gezeigt mit Cache Pools, die das Design auch effizienter machen soll.
Bei den aktuellen Grafikkarten sieht man es ja bereits. Die sind teils so effizient, weil der Infinty Cache den Datenbus entlastet.
Es wird eh schon vermutet. Den ersten Schritt macht CDNA und RDNA zieht nach. Also vllt gibt es 2024 die erste ordentliche Gaming APU. Wenn auch für nächstes Jahr bereits ein großer Schritt angekündigt wurde. Aber eben ohne infinty cache.
 
Bin mal gespannt, ob AMD das 1:4-Verhältnis wirklich auf einen Chip packt. Das wäre schon eine gigantische Verkleinerung einer Node, da müssen nur Kühlung und Stromversorgung nicht zuviel Platz verbrauchen.

Gegenüber den aktuellen Blades von Frontier mit 2 CPUs und 16 GPUs (wo 1:8 wohl sinnvoller war?) wird das alles auf 2 einzelne Platinen geschrumpft. Zum Teil sollte allein durch die Verkleinerung schon die Effizienz steigen. Dazu der Infinity-Cache, auf den die Chips gestapelt werden. Wahnsinn.
 
  • Gefällt mir
Reaktionen: Ned Flanders
-Ps-Y-cO- schrieb:
Hoffentlich auch für den kleinen Endkunden im Heim PC
Naja eher für die Workstation. Das ding wird so ordentlich Saft haben, gute Zentrale Kühllösung und schön kompakt.
Aber wird halt wohl auch bissel was kosten.

Auch wenns das Ganze im laptop extrem klein machen würde, Aber Laptop grösse ist eh druch den Bildschirm definiert.
 
Na da bin ich mal wirklich gespannt, wie sie das Kapazitätsproblem mit HBM in den Griff bekommen. Denn HBM+DDR macht zu viele Probleme. Aber gut eventuell ist das mit HBM3 auch hinfällig. Es steigt ja die Kapazität.
 
Max FP64 Leistung/max Stromverbrauch ist als Effizentsangabe etwas irreführend weil man Supercomputer nicht auf Linpack sondern auf das Problem optimiert. Bestes Beispiel ist der Fugaku der nur auf CPUs setzt.
 
Colindo schrieb:
Bin mal gespannt, ob AMD das 1:4-Verhältnis wirklich auf einen Chip packt. Das wäre schon eine gigantische Verkleinerung einer Node, da müssen nur Kühlung und Stromversorgung nicht zuviel Platz verbrauchen.
Wenn man die Chiplets betrachtet ist es ein 1:1.
1655936341864.png


Im Bards Peak Node von Frontier ist jedes CCD mit einem GCD per Infintity Fabric Link verbunden.
Diese Kopplung ist im obigen Slide per Farbe dargestellt
Colindo schrieb:
Gegenüber den aktuellen Blades von Frontier mit 2 CPUs und 16 GPUs (wo 1:8 wohl sinnvoller war?) wird das alles auf 2 einzelne Platinen geschrumpft.

Es gibt eine sehr interessante Grafik von AMD aus dem Jahr 2017.

1655939406601.png


Das Bild zeigt eine APU mit
  • 8 GCDs die jeweils per 3DStacking 4 HBM-Stacks haben
  • 8 CCDs
Ich habe keine Ahnung, ob EHP noch etwas mit der MI300 APU zu tun hat oder komplett verworfen wurde. Es fehlt der Cache. Aber wenn so etwas umgesetzt würde wäre es ganz sicher bahnbrechend und ist auch ein 3D Chiplet Packaging.

Ich kann mir aber nicht vorstellen, dass man HBM neben GPU und neben CPU unterbringen kann


Colindo schrieb:
Zum Teil sollte allein durch die Verkleinerung schon die Effizienz steigen. Dazu der Infinity-Cache, auf den die Chips gestapelt werden. Wahnsinn.
Aber selbst wenn die Effizienz massiv steigt, wird das Kühlen sehr herausfordernd.

-Ps-Y-cO- schrieb:
Hoffe dass wir auch solche APUs bekommen mit HBM Speicher !!
Wie viel sollen sie kosten?
Die MI100 kostet ca. 5000 Euro. Für die MI250 X habe ich keine Preise gefunden, aber sie dürfte teurer als die MI100 sein.
Für die MI300 APU rechne ich mit 5-stelligen Preisen.

-Ps-Y-cO- schrieb:
APUs ... wie war das? "The future is Fusion"
Das Problem war aber nicht die Hardware, sondern die Software.
Ohne Software blieben die APUs in der Nische Lösung für genügsame Spiele stecken.

pipip schrieb:
Ich rechne fur Notebooks eher ein Logik Chip mit infinty Cache und drauf eine APU Kombi.
Damit rechne ich auch.
pipip schrieb:
Dann reicht vermutlich auch einfacher DDR5.
Aber für was reicht DDR5 + Inifinity Cache?
Es wäre interessant Tests zu sehen. Aber ich gehe davon aus, dass AMD mit Rembrandt DDR5 ziemlich ausgereizt hat.

Alles was mehr bringen soll, benötigt IMO Infinity Cache. Aber hier sind keine Wunder zu erwarten. Und es hat seinen Preis.
pipip schrieb:
Es wird eh schon vermutet. Den ersten Schritt macht CDNA und RDNA zieht nach. Also vllt gibt es 2024 die erste ordentliche Gaming APU.
Und hier scheiden sich seit je her die Geister, was ordentlich bedeutet.

Das eigentliche Problem ist das Systemdesign. Mit dem klassischen Systemdesign von PCs werden die APUs immer eine Nischenlösung bleiben.
 
Dass CPU&GPU am selben Infinity-Cache ansetzen dürfte gegenüber jetzigen designs, gerade im HPC-Umfeld, nochmal einiges bringen.
Auch für Konsolen eigentlich geniales Design (die zweite xbox hat das ja versucht, aber ist daran gescheitert dass es zu wenig war und noch als RAM adressiert werden musste), für PCs durch das Mantra der Aufrüstbarkeit natürlich schwierig.
 
ETI1120 schrieb:
Und hier scheiden sich seit je her die Geister, was ordentlich bedeutet.
Also wenn es um APUs geht, gehe ich jetzt immer von Notebooks und Handheld aus.
Ist ein embedded Cache logik Chip und oben drauf eine APU teuer herzustellen im Jahr 2024 ? Gute Frage. Wenn der Cache aber dann am Ende so groß ist wie die APU selbst, dann könnte man schon von einem größeren Cache ausgehen.
Außerdem wer weiß welche Optionen es gibt. Muss es ein SRAM sein ? (EDRAM)
Könnte sein dass es vllt ein Cache&Logik Chip ist, denn man neben APU auch für GPUs und CPUs sehen werden und somit in Massen produziert wird ?
Ich lass mich da überraschen. Denk aber fur FHD und RSR, FSR, FSR 2.0 in Kombination wird 2024 einiges möglich sein.
 
pipip schrieb:
Also wenn es um APUs geht, gehe ich jetzt immer von Notebooks und Handheld aus.
Ist ein embedded Cache logik Chip und oben drauf eine APU teuer herzustellen im Jahr 2024 ?
Für alle APUs definitiv ja.

Aber für einige ist es auch im Notebook sicher eine Option.

Und die iGPUs die ohne Infinity Cache nicht ausgereizt werden können, betreibt man eben mit einem kleineren Takt, wodurch sie im Vergleich zu einer normal ausgelegten (kleiner, höherer Takt) weniger verbrauchen.
pipip schrieb:
Ich lass mich da überraschen. Denk aber fur FHD und RSR, FSR, FSR 2.0 in Kombination wird 2024 einiges möglich sein.
IMO wäre eine solche iGPU mit Infinity Cache Option für Notebooks sehr attraktiv. Sie würde viele mobile Grafikkarten überflüssig machen. Im mobilen Markt sind die Grafikkarten durch den Powerbedarf begrenzt.

Im Desktopmarkt sieht es ein bißchen anders aus. Im Vergleich können die dGPUs immer eine Schippe drauflegen. Auf der anderen Seite gibt es jede Menge Spiele für die eine solche iGPU mit Infinity Cache vollkommen ausreichend wäre.
 
  • Gefällt mir
Reaktionen: yummycandy
@ETI1120 Ja, das mit dem 1:1 zwischen den Chiplets von Frontier hatte ich gesehen, aber damit kann ich ehrlich gesagt nichts anfangen. Ist so eine Direktverbindung irgendwo so sinnvoll nutzbar, dass sie den Mehrwert einer asymmetrischen Verwendung (also z.B. mehr CPU-Chiplets pro GCD, weil eine Aufgabe sie braucht) übertrumpft? Schwer vorstellbar. Und diese Zuteilung wird bei El Capitan ja anscheinend wieder aufgehoben, da mehr CPU-Chiplets und weniger GCDs da sein werden. Zumindest sieht es momentant so aus.
 
Cr4y schrieb:
(Zen4/5, GNC3, und HBM3) für die PS5 Pro/PS6 bzw. xbox
Ob CDNA3 sich so gut für DX/Vulkanshader eignet? Die Architektur ist komplett auf Compute ausgerichtet und nichts anderes. Mal davon abgesehen das alles im Chip fehlt, was man für eine Grafikausgabe benötigt. Somit finde ich auch die Bezeichnung APU unpassend. Hier ist keine GPU verbaut, das sind einfach nur HPC-Beschleuniger, in einem Package mit x86-CPU Kernen.

Aber ja, eine RDNA2/3 APU mit Zen5 und HBM hätte ich auch gerne.
 
Zurück
Oben