ISC 2023

Instinct MI300A in El Capitan: Vier Mal 24 Zen-4-Kerne, CDNA 3 und 128 GB HBM3 pro Blade

Volker Rißka
19 Kommentare
Instinct MI300A in El Capitan: Vier Mal 24 Zen-4-Kerne, CDNA 3 und 128 GB HBM3 pro Blade
Bild: ISC

Offiziell hatte AMD zur ISC 2023 keine Neuheiten im Gepäck, doch die Macher des kommenden Supercomputers El Capitan plauderten ein wenig über MI300A als Herzstück dieser Lösung. Dort werden neue AMD-Recheneinheiten erstmals als riesige APU vier Mal pro Node eingesetzt, ein Produkt, das bald ein Jahrzehnt lang entwickelt wurde.

4 × MI300A pro HPE-Blade

Bereits vor Jahren angekündigt geht die Fertigstellung des neuen ExaFLOP-Systems El Capitan auf die Zielgerade. Die technischen Grundlagen der HPC-APU hatte AMD bereits selbst zu Beginn dieses Jahres offengelegt: Mittels 146 Milliarden Transistoren werden in TSMCs N5-Fertigung 24 Zen-4-Kerne und CDNA3-Grafikeinheit gefertigt und auf einen Base Layer aus TSMCs N6-Fertigung gesetzt, auf dem 128 GByte HBM3 sowie der Infinity Cache zu finden sind. Der CPU-Teil belegt dabei laut Schaubild rund ein Viertel des Chips, die Grafikeinheit wie vermutet die restlichen Dreiviertel. Denn auf Exascale-Leistung kommt man nur mittels GPU.

AMD Instinct MI300 - 24 CPU-Kerne rechts unten, die restlichen 3 Quadranten sind GPU
AMD Instinct MI300 - 24 CPU-Kerne rechts unten, die restlichen 3 Quadranten sind GPU (Bild: ISC)

Pro Blade werden in El Capitan vier dieser großen Instinct MI300A verbaut, was sich deutlich von den Frontier-Nodes unterscheidet, die ComputerBase vor einem Jahr auf der ISC 2022 ablichten konnte. Bei beiden ist HPE der Hersteller.

MI300A at HPE: The HPE compute blade
MI300A at HPE: The HPE compute blade (Bild: ISC)

Effizienz mit „nur“ 30 MW Verbrauch im Blick

El Capitan wird nach wie vor mit über 2 ExaFLOPS Leistung spezifiziert, aber auch deshalb, weil am Lawrence Livermore National Laboratory beim Energiebedarf nicht „All In“ gegangen wird. El Capitan wird dort keine Systeme ersetzen oder ablösen, die bestehenden Supercomputer werden weiter genutzt. Die Spezifikation für El Capitan sieht deshalb maximal 40 Megawatt vor, im Alltag sollen realistisch jedoch „nur“ rund 30 Megawatt Verbrauch anliegen. Dennoch wurde am Standort die Energieversorgung verbessert, 85 MW für die Systeme werden von zusätzlichen 15 MW für die Kühlung ergänzt.

Aufwertung der Energieversorgung für Exascale-System
Aufwertung der Energieversorgung für Exascale-System (Bild: ISC)

Damit würde das System rund 50 Prozent mehr Energie verbrauchen als Frontier, welches bei rund 21 Megawatt im Einsatz rangiert, aber vermutlich (mindestens) rund doppelt so viel leisten. Für Aurora waren zuletzt bis zu 60 Megawatt aber auch theoretisch deutlich über 2 ExaFLOPS im Gespräch – eine Krone könnte El Capitan also vermutlich spielend leicht holen.

El Capitan bei rund 30 MW im Einsatz
El Capitan bei rund 30 MW im Einsatz (Bild: ISC)

Abnahme erst Ende 2024

Wenngleich El Capitan noch in diesem Jahr gebaut wird, wird die finale Abnahme erst im Jahr 2024 erfolgen. Laut aktuellem Plan wird es auch eher Ende des Jahres werden. Intels Aurora könnte so zumindest eine Weile an der Spitze der Supercomputer stehen, wenn sie zum Ende dieses Jahres ihr Ergebnis einreichen.

ISC 2023 (21.–25. Mai 2023): Alle News auf der Themenseite!
  • Hardware auf der ISC 2023: Höher, schneller und weiter – um nicht mehr jeden Preis
  • Intel zur ISC 2023: Roadmap-Änderungen, Falcon Shores und 63.744 GPUs
  • Instinct MI300A in El Capitan: Vier Mal 24 Zen-4-Kerne, CDNA 3 und 128 GB HBM3 pro Blade
  • +2 weitere News