Nvidia DGX-1: Supercomputer mit 8 Tesla P100 für künstliche Intelligenz

Michael Günsch 43 Kommentare
Nvidia DGX-1: Supercomputer mit 8 Tesla P100 für künstliche Intelligenz

Eines der ersten Produkte auf Basis der angekündigten Pascal-GPU GP100 ist eine Art „Superkomplettrechner“. Nvidia beschreibt den DGX-1 als „First Deep Learning Supercomputer in a Box“. In dem Server-Rack stecken acht Tesla P100, denen zwei Intel Xeon mit 16 Kernen, 512 GB RAM und vier 1,92-TB-SSDs im RAID zur Seite stehen.

Künstliche Intelligenz und Deep Learning gehörten zu den Kernthemen der Eröffnungsrede des Nvidia-CEO zur GTC 2016. Diese Bereiche erfordern viel Rechenleistung, die Nvidias High-End-GPU GP100 auf Basis der neuen Pascal-Architektur liefern soll. Die ersten Rechenbeschleuniger auf deren Basis tragen die Bezeichnung Tesla P100 und kommen in einer Gruppe von gleich acht Karten in dem kleinen Supercomputer DGX-1 zum Einsatz.

Nvidia DGX-1
Nvidia DGX-1 (Bild: Nvidia)

Verbunden sind die GPUs über die NVLink-Technik mit einer höheren Durchsatzrate als bei PCI Express. Zusammen sollen die acht Pascal-GPUs bei FP16-Gleitkommaberechnungen auf bis zu rund 170 TFLOPs (peak) kommen, ein einzelner Chip liefert dabei 21,2 TFLOPs. Nvidia vergleicht die Leistung mit derer von 250 x86-Servern und beruft sich auf Leistungswerte von Intel-Dual-Sockel-Systemen mit Xeon E5-2697 v3 ohne GPU-Beschleuniger.

Nvidia DGX-1 mit 8 Tesla P100
Nvidia DGX-1 mit 8 Tesla P100
Nvidia DGX-1 mit 8 Tesla P100
Nvidia DGX-1 mit 8 Tesla P100

Mit Hilfe der rund 60 Kilogramm schweren 3U-Server sollen vor allem Forscher und Datenanalysten im Bereich künstliche Intelligenz ein leistungsstarkes Werkzeug erhalten. Passend dazu werden spezielle Treiber, ein SDK für Deep Learning sowie spezifische CUDA-Bibliotheken angeboten.

Der Superkomplettrechner wird 129.000 US-Dollar kosten und soll bereits im Juni in den Vereinigten Staaten erhältlich sein. Andere Regionen sollen ab dem dritten Quartal bedient werden.

Nvidia DGX-1
GPUs 8 × Nvidia Tesla P100 (GP100) mit je 16 GB VRAM
CPU 2 × Intel Xeon E5-2698 v3 (Haswell-EP)
mit 16 Kernen, 32 Threads und 2,3 bis 3,6 GHz
Rechenleistung ~ 170 TFLOPs (GPU bei FP16)
RAM 512 GB DDR4-2133 LRDIMM
Storage 4 × 1,92 TB SSD, RAID 0
Netzwerk Dual 10 GbE, 4 IB EDR
Software Ubuntu Server Linux OS
DGX-1 Recommended GPU Driver
Gewicht 134 lbs (61 kg)
Abmaße 866 × 444 × 131 mm (T × B × H)
Strom Maximum Power Requirements 3.200 Watt
Update 06.04.2016 06:56 Uhr

Im Showcase der GTC 2016 durften nach der Keynote auch die ersten Hersteller entsprechende Systeme ausstellen. Mit dabei ist eine Lösung von QuantaPlex, die auf zwei Mainboards einmal die beiden Xeon-Prozessoren und auf der anderen Platine die acht Tesla P100 setzt und diese in einem flachen 3U-Gehäuse unterbringt. Die Anordnung der Tesla-Karten ist dabei extrem dicht gestaltet, was aufgrund der neuen Anschlüsse der Karten auf der Rückseite möglich ist.