Tesla K80: Dual-Kepler mit bis zu 8,7 TFLOPS für Superrechner

17.11.2014 20:20 Uhr

Bild: Nvidia

Ein Jahr ist vergangen, seitdem Nvidia mit der Tesla K40 das bis heute amtierende Flaggschiff im Bereich der GPU-basierten Beschleunigerkarten für Hochleistungsrechner vorstellt hat. Seit heute nimmt die Tesla K80 mit bis zu 8,7 TeraFLOPS bei einfacher und 2,9 TeraFLOPS bei doppelter Genauigkeit den Spitzenplatz ein.

Die Tesla K80 verfügt wie zuvor angenommen über zwei Grafikchips vom Typ GK210. Sie basieren auf der Kepler- und nicht auf der neuen Maxwell-Architektur. Die Zahl der Shadereinheiten beläuft sich auf 2.496 pro Chip und entspricht damit der beschnittenen GK110-GPU der Tesla K20. Die 384 Bit breite Speicheranbindung unterscheidet sich jedoch von der Tesla K20 (320 Bit) und liegt auf dem Niveau von Tesla K20X und Tesla K40. Jedem Chip stehen 12 Gigabyte GDDR5-Speicher zur Verfügung.

	Nvidia Tesla K80	AMD FirePro S9150	AMD FirePro W9100	Nvidia Tesla K40
TFLOPS (SP)	8,74 (Boost)	5,07	5,24	4,29
TFLOPS (DP)	2,91 (Boost)	2,53	2,62	1,43
Max. Power	300 W	235 W	275 W	235 W
GFLOPS (DP) pro Watt	9,7 (Boost)	10,8	9,5	6,1

Die maximale Rechenleistung beträgt laut Nvidia 8,74 TFLOPS bei einfacher Genauigkeit (SP) und maximalem GPU-Takt. Damit übertrifft die Tesla K80 AMDs FirePro S9150 mit einer Hawaii-GPU, benötigt dafür aber mehr Strom und liegt bei der Effizienz hinter der AMD-Karte. Wie bei den anderen Tesla-Modellen auf Basis von Kepler wird bei doppelter Präzision (DP) ein Drittel der SP-Leistung erzielt. Ob die maximale Leistung in der Praxis erreicht wird, hängt von der Kühlung ab. Wie bei den Desktop-Pendants können die maximalen Boost-Frequenzen nur bei ausreichend niedrigen Temperaturen erreicht werden. Als Grafikkarte für Hochleistungsserver wird die aktive Kühlung anderen Systemkomponenten überlassen – die Tesla K80 besitzt keine Lüfter.

	Tesla K80	Tesla K40	Tesla K20X	Tesla K20
Architektur	Kepler (28 nm)
GPU	2 × GK210	GK110B	GK110	GK110
Transistoren	k. A.	7,1 Mrd.
Shadereinheiten	2 × 2.496	2.880	2.688	2.496
GPU-Takt	562 MHz	745 MHz	732 MHz	706 MHz
Boost-Takt	875 MHz	810 MHz, 875 MHz	–	–
Speicherbus	2 × 384 Bit	384 Bit		320 Bit
Speicher	2 × 12 GB GDDR5	12 GB GDDR5	6 GB GDDR5	5 GB GDDR5
Speichertakt	2.500 MHz	3.000 MHz	2.600 MHz
Rechenleistung (SP, max.)	8,74 TFLOPS	4,29 TFLOPS	3,95 TFLOPS	3,52 TFLOPS
Rechenleistung (DP, max.)	2,91 TFLOPS	1,43 TFLOPS	1,31 TFLOPS	1,17 TFLOPS
TDP	300 W	235 W	235 W	225 W
Kühlung	passiv	aktiv/passiv	passiv	aktiv/passiv
Einführungspreis	k. A.	$5.499?	~$3.799	~$3.299
Quelle: Nvidia, Anandtech

Als Einsatzgebiet sieht Nvidia HPC-Systeme mit Aufgabenbereichen wie Astrophysik, Genomforschung, Quantenchemie und andere Datenanalysen. Angeboten wird der Dual-GPU-Beschleuniger von diversen Server-Herstellern wie Asus, Cray, Dell, HP und Supermicro. Den Preis pro Karte kommunizierte Nvidia nicht. Potentielle Kunden können die Tesla K80 kostenlos auf Remote-Clustern testen.

Rechenleistung der Tesla K80 (Bild: Nvidia)