AMD Instinct MI430X: AMDs echter HPC-Chip ist „6 Mal schneller“ als Nvidia Rubin
AMD hat überraschend einen Ausblick auf die Leistung des Instinct MI430X gegeben. Ausnahmsweise ist das kein AI-Beschleuniger, er zielt auf andere Szenarien im HPC-Segment: Denn in der Wissenschaft, bei Simulationen und vielen weiteren Anwendungen ist die Berechnung bei doppelter Genauigkeit weiterhin extrem wichtig.
Es gibt auch noch etwas neben AI
Der Trend zuletzt war unverkennbar: Große GPUs werden nur noch zu einem Zweck gebaut – für AI. Dafür wurden die Datenformate immer kleiner, auf FP8 und BF8 folgten FP6 und FP4, dazu viele Formate, die in ähnlichem Umfeld unterwegs sind wie MXFP6 und MXFP4. Der Fokus hierbei ist Schnelligkeit und möglichst geringer Speicherbedarf, aber alles auf Kosten der Genauigkeit. Dieser Ansatz führt in gewissen Bereichen aber zu Ergebnissen, die man genau nicht haben will.
AMD hatte sich deshalb bei der kommenden Familie AMD Instinct MI400 bereits früh dazu entschlossen, nicht nur voll in Richtung AI zu schwenken – so mit der Serie MI450/455X umgesetzt –, sondern auch einen echten HPC-Chip aufzulegen: den MI430X. Im Herbst des letzten Jahres bestätigte das Unternehmen den Chip erstmals offiziell, als er bereits erste Großaufträge einsammeln konnte.
>200 TFLOPS native FP64-Leistung
Jetzt gibt AMD einen ersten Ausblick auf die Leistung der Beschleunigerlösung mit 432 GByte HBM4. Mit über 200 TFLOPs nativer FP64-Leistung wird sie in dem Bereich „mehr als sechsmal so schnell“ sein wie Rubin. Der Vergleich ist aber, wie eingangs ausgeführt, etwas von Äpfeln mit Birnen: Nvidia Rubin ist ein reiner AI-Beschleuniger mit Fokus auf FP4 & Co, FP64 läuft dort, wenn überhaupt, nur nebenbei noch mit, einen echten FP64-Gegenspieler hat Nvidia gar nicht mehr. Rubin dürfte wiederum in FP4-Disziplinen dem MI430X überlegen sein – den dazu passenden Wert nennt AMD heute natürlich nicht.
Zur besseren Einordnung hilft da eher der Blick zu Instinct MI355X: 78,6 TFLOPs FP64-Leistung bietet der Chip, ein MI325X kam zuvor schon mal auf 81,6 TFLOPs FP64-Leistung, der ältere MI300X auf 81,7 TFLOPs. Man sieht auch hier, dass der Fokus bei AMD in eine andere Richtung ging. Eine deutlich stärkere Leistung in der FP64-Disziplin ist es aber zweifelsohne auch im eigenen Haus.
AMD feierte in den letzten Jahren große Erfolge im HPC-Segment, stellt weltweit die Hardware für die schnellsten Supercomputer. Genau dies ist auch die Zielgruppe für den neuen Chip, erste Aufträge wie Discovery am Oak Ridge National Laboratory, USA, und auch Alice Recoque in Frankreich untermauern dies. Letzterer wird bereits mit über einem ExaFLOP FP64-Leistung beworben und damit zu Europas schnellsten HPC-Systemen gehören.
Finale Spezifikationen und Details werden zum Event AMD Advancing AI 2026 am 22/23. Juli erwartet.