Supercomputer: KIT nimmt drei Nvidia DGX A100 in Betrieb

Nicolas La Rocco
33 Kommentare
Supercomputer: KIT nimmt drei Nvidia DGX A100 in Betrieb
Bild: KIT

Das Karlsruher Institut für Technologie (KIT) hat als erster Standort in Europa drei DGX-A100-Systeme auf Basis der neuen Ampere-Architektur von Nvidia in Betrieb genommen. Die Anwendungen der Forscher sollen damit auch für den mit A100-Beschleunigern ausgestatteten Supercomputer HoreKa optimiert werden.

Die drei DGX A100 kommen beim Steinbuch Centre for Computing (SCC) zum Einsatz und wurden aus Mitteln der Helmholtz Artificial Intelligence Cooperation Unit (HAICU) finanziert. Für eines der mit acht A100-SXM4-Modulen, sechs NVSwitches, zwei AMD Rome alias Epyc 7742, 1 TB RAM, 15 TB NVMe-SSD-Speicher und neun Mellanox ConnectX-6 ausgestatteten Systeme ruft Nvidia 199.000 US-Dollar vor Steuern auf.

Nvidia DGX A100
Nvidia DGX A100 (Bild: Nvidia)

Konventionelle Computersysteme an ihren Grenzen

Martin Frank, Direktor am Steinbuch Centre for Computing (SCC) am KIT und Professor am Institut für Angewandte und Numerische Mathematik (IANM) des KIT, beschreibt den Zugriff auf die spezielle Hardware für die KI-Beschleunigung als entscheidenden Wettbewerbsfaktor. „Beim Training einer KI mit großen Datensätzen kommen konventionelle Computersysteme an ihre Grenzen. Viele KI-Algorithmen lassen sich aber durch den Einsatz spezieller Hardware beschleunigen.

Künstliche Intelligenz (KI) und Maschinelles Lernen (ML) kommen in verschiedenen Bereichen des KIT als Bestandteil der Forschung zur Anwendung. Die Entwicklung autonomer Robotersysteme oder neuartiger Funktionsmaterialien, die Optimierung von Energiesystemen oder die Verbesserung von Klimamodellen sind Beispiele dafür. In der Helmholtz Artificial Intelligence Cooperation Unit (HAICU) des KIT sollen mit den neuen DGX-A100-Systemen Ähnlichkeiten zwischen Anwendungen identifiziert und ausgenutzt sowie die Entwicklung neuer Methoden vorangetrieben werden.

HoreKa mit 740 A100-Beschleunigern geplant

Mit den drei DGX A100 kann sich das KIT zudem auf den Einsatz weiterer A100-Beschleuniger im geplanten Supercomputer HoreKa (Hochleistungsrechner Karlsruhe) vorbereiten und Anwendungen dafür optimieren. Die Inbetriebnahme des HoreKa ist für den Sommer 2021 geplant. Der Supercomputer wird 740 Nvidia A100 in Kombination mit 60.000 Intel-Xeon-Kernen der nächsten Generation sowie mehr als 220 TB Hauptspeicher nutzen. Beim Kommunikationsnetzwerk vertraut das KIT mit einem InfiniBand-HDR-Netzwerk von Mellanox, das 200 Gbit/s pro Port bietet, ebenfalls auf Nvidia. Zwei parallele Spectrum-Scale-Dateisysteme mit einer Gesamtkapazität von mehr als 15 PB dienen der Datenablage. Der HoreKa wird 2021 mit einer Rechenleistung von circa 17 PetaFLOPS voraussichtlich zu den zehn leistungsfähigsten Rechnern Europas gehören. Deutschlands schnellster Supercomputer ist derzeit der Hawk.