HPC-Beschleuniger: Intel Data Center GPU Max startet mit PCIe 5.0

Michael Günsch
22 Kommentare
HPC-Beschleuniger: Intel Data Center GPU Max startet mit PCIe 5.0
Bild: Intel

Parallel zur neuen Server-CPU-Generation Sapphire Rapids hat Intel neue GPU-basierte Rechenbeschleuniger für den Bereich High Performance Computing (HPC) eingeführt. Die Intel Data Center GPU Max genannten Karten mit PCIe 5.0 nutzen die Xe-HPC-Architektur und schnellen HBM-Speicher.

Bereits im November 2022 hatte Intel die unter dem Codenamen Ponte Vecchio geführten Beschleuniger-Karten für Supercomputer vorgestellt. Jetzt gibt es mit dem offiziellen Marktstart weitere Details.

Intel Xe-HPC-GPUs kommen mit PCIe 5.0

Bestätigt ist nun etwa, dass die drei Modelle Max 1100, Max 1350 und Max 1550 jeweils PCIe 5.0 nutzen. Genauer handelt es sich um die Schnittstelle PCIe 5.0 x16, die in jede Richtung rund 64 GB/s brutto übertragen kann.

Max 1550 Max 1350 Max 1100
Formfaktor OCP Accelerator Module (OAM) OCP Accelerator Module (OAM) Erweiterungskarte (Add-In Card)
Schnittstelle PCIe 5.0 x16
Architektur Xe-HPC
Xe-Kerne 128 112 56
Ray-Tracing-Einheiten 128 112 56
XMX-Einheiten 1.024 896 448
Vektor-Einheiten 1.024 896 448
Maximaler GPU-Takt 1.600 MHz 1.550 MHz 1.550 MHz
GPU-Basistakt 900 MHz 750 MHz 1.000 MHz
Speicher HBM2e
Speichergröße 128 GB 96 GB 48 GB
Speicherbus 1.024 Bit 1.024 Bit 1.024 Bit
Speicherdurchsatz 3,2 TB/s 2,4 TB/s 1,2 TB/s
TDP 600 W 450 W 300 W
Videoausgänge keine

Um die allerersten „Grafikkarten“ mit PCIe 5.0 handelt es sich aber nicht, denn mit der Moore Threads MTT S80 hatte ein chinesisches Unternehmen bereits auf diese Schnittstelle gesetzt. Letztere ist aber primär für Spieler bestimmt, während bei den Intel-Max-GPUs nicht einmal ein Bild ausgegeben wird, denn die Grafikchips werden hier ausschließlich für kommerzielle oder wissenschaftliche Rechenaufgaben im Data Center genutzt.

Im Formfaktor OCP Accelerator Module (OAM) liegen die Modelle Max 1550 und Max 1350 vor, während die Max 1100 eine klassische Steckkarte für den PCIe-Slot ist. Die Max 1550 bietet mit 128 Xe-Cores und 128 GB HBM2e (High Bandwidth Memory) die höchste Leistung. Der größte Chip soll laut Intel mehr als 100 Milliarden Transistoren auf 47 Tiles vereinen, aus denen der Chip zusammengesetzt wird.

Die Max 1350 bildet mit noch 112 Xe-Kernen und 96 GB Speicher die Mittelklasse, während die Max 1100 mit 56 Kernen und lediglich 48 GB nicht ganz die Hälfte des Flaggschiffes bietet.

Xeon Max + GPU Max

Schon die neuen Xeon Max CPUs mit HBM sollen Anwendungen, die von schnellem Speicher profitieren, deutlich beschleunigen. In Kombination mit den Xe-HPC-GPUs sei aber noch deutlich mehr drin.

Zur Demonstration hat Intel den Large-scale Atomic/Molecular Massively Parallel Simulator (LAMMPS) auserkoren, der für Molekulardynamik-Simulationen genutzt wird. Hier kann die Leistung gegenüber einem Xeon Platinum 8380 der vorherigen Generation bereits mit einem neuen Xeon Max mit HBM um etwa 30 Prozent gesteigert werden. Wird ein Xeon Max mit HBM mit den Data Center GPUs der Max Series kombiniert, steigt die Leistung fast um den Faktor 13. Allerdings werden dafür gleich sechs GPUs benötigt.

Intels LAMMPS-Demo mit Xeon und GPU der Max Series
Intels LAMMPS-Demo mit Xeon und GPU der Max Series (Bild: HPC Wire)

GPU Max im Supercomputer Aurora

Die GPUs der Max Series sollen im kommenden Supercomputer Aurora Verwendung finden. Die neuen Xeon Max (Sapphire Rapids mit HBM) kamen dafür aber zu spät. Daher wird Aurora zunächst auf Sapphire Rapids ohne HBM setzen.

Mehr Informationen zur Architektur der Intel Data Center GPU Max sowie den neuen Intel Xeon Scalable der 4. Generation liefern die folgenden Artikel: