Nvidia DGX-1 : Supercomputer mit 8 Tesla P100 für künstliche Intelligenz

, 43 Kommentare
Nvidia DGX-1: Supercomputer mit 8 Tesla P100 für künstliche Intelligenz

Eines der ersten Produkte auf Basis der angekündigten Pascal-GPU GP100 ist eine Art „Superkomplettrechner“. Nvidia beschreibt den DGX-1 als „First Deep Learning Supercomputer in a Box“. In dem Server-Rack stecken acht Tesla P100, denen zwei Intel Xeon mit 16 Kernen, 512 GB RAM und vier 1,92-TB-SSDs im RAID zur Seite stehen.

Künstliche Intelligenz und Deep Learning gehörten zu den Kernthemen der Eröffnungsrede des Nvidia-CEO zur GTC 2016. Diese Bereiche erfordern viel Rechenleistung, die Nvidias High-End-GPU GP100 auf Basis der neuen Pascal-Architektur liefern soll. Die ersten Rechenbeschleuniger auf deren Basis tragen die Bezeichnung Tesla P100 und kommen in einer Gruppe von gleich acht Karten in dem kleinen Supercomputer DGX-1 zum Einsatz.

Nvidia DGX-1
Nvidia DGX-1 (Bild: Nvidia)

Verbunden sind die GPUs über die NVLink-Technik mit einer höheren Durchsatzrate als bei PCI Express. Zusammen sollen die acht Pascal-GPUs bei FP16-Gleitkommaberechnungen auf bis zu rund 170 TFLOPs (peak) kommen, ein einzelner Chip liefert dabei 21,2 TFLOPs. Nvidia vergleicht die Leistung mit derer von 250 x86-Servern und beruft sich auf Leistungswerte von Intel-Dual-Sockel-Systemen mit Xeon E5-2697 v3 ohne GPU-Beschleuniger.

Nvidia DGX-1 mit 8 Tesla P100
Nvidia DGX-1 mit 8 Tesla P100
Nvidia DGX-1 mit 8 Tesla P100
Nvidia DGX-1 mit 8 Tesla P100

Mit Hilfe der rund 60 Kilogramm schweren 3U-Server sollen vor allem Forscher und Datenanalysten im Bereich künstliche Intelligenz ein leistungsstarkes Werkzeug erhalten. Passend dazu werden spezielle Treiber, ein SDK für Deep Learning sowie spezifische CUDA-Bibliotheken angeboten.

Der Superkomplettrechner wird 129.000 US-Dollar kosten und soll bereits im Juni in den Vereinigten Staaten erhältlich sein. Andere Regionen sollen ab dem dritten Quartal bedient werden.

Nvidia DGX-1
GPUs 8 × Nvidia Tesla P100 (GP100) mit je 16 GB VRAM
CPU 2 × Intel Xeon E5-2698 v3 (Haswell-EP)
mit 16 Kernen, 32 Threads und 2,3 bis 3,6 GHz
Rechenleistung ~ 170 TFLOPs (GPU bei FP16)
RAM 512 GB DDR4-2133 LRDIMM
Storage 4 × 1,92 TB SSD, RAID 0
Netzwerk Dual 10 GbE, 4 IB EDR
Software Ubuntu Server Linux OS
DGX-1 Recommended GPU Driver
Gewicht 134 lbs (61 kg)
Abmaße 866 × 444 × 131 mm (T × B × H)
Strom Maximum Power Requirements 3.200 Watt

Update 06.04.2016 06:56 Uhr  Forum »

Im Showcase der GTC 2016 durften nach der Keynote auch die ersten Hersteller entsprechende Systeme ausstellen. Mit dabei ist eine Lösung von QuantaPlex, die auf zwei Mainboards einmal die beiden Xeon-Prozessoren und auf der anderen Platine die acht Tesla P100 setzt und diese in einem flachen 3U-Gehäuse unterbringt. Die Anordnung der Tesla-Karten ist dabei extrem dicht gestaltet, was aufgrund der neuen Anschlüsse der Karten auf der Rückseite möglich ist.