Nvidia Tesla T4: Turing-Grafiklösung mit 8,1 TFLOPs bei nur 75 Watt

Volker Rißka 28 Kommentare
Nvidia Tesla T4: Turing-Grafiklösung mit 8,1 TFLOPs bei nur 75 Watt
Bild: Nvidia

Zur GTC Japan hat Nvidia-CEO Jensen Huang den Nachfolger der speziellen und bereits zwei Jahre alten Tesla P4 enthüllt. Die Tesla T4 basiert auf dem TU104-Grafikchip aus der Turing-Generation und soll bei einer weiterhin geringen Leistungsaufnahme von maximal 75 Watt teilweise die 12-fache Leistung des Vorgänger bieten.

Mehr Leistung in allen Bereichen

65 TFLOPS soll die neue Tesla T4 bei Anwendungen mit halber Genauigkeit (FP16) bieten. Dieser Wert ist aber nur bedingt mit dem Vorgänger vergleichbar, weshalb die 12-fache Leistungssteigerung aufgrund einer etwas anderen Rechenweise zustande kommt. Denn bei einfacher Genauigkeit (FP32) bleiben bei Turings 75-Watt-Lösung noch 8,1 TFLOPS übrig, der Vorgänger bot 5,5 TFLOPS. Geht es an die Spezialfälle mit INT8, INT4 oder experimentelles INT1 sind die Leistungszuwächse ebenfalls deutlich: 130 zu 22 INT8 TOPS, INT4-Unterstützung gab es bei Pascal noch gar nicht.

Dafür verantwortlich zeichnet primär der TU104-Grafikchip von Nvidia, der neben 2.560 Shadern (Cuda Cores) in 40 SMs noch 320 Tensor Cores bietet. Damit wird der Grafikchip nicht vollständig genutzt, denn dieser kann im Maximum 3.072 Shader (48 Streaming-Multiprozessoren (SM)) und 384 Tensor Cores aufbieten, was jedoch der Effizienz geschuldet ist.

Einen großen Sprung nach vorn macht die Tesla T4 im Vergleich zum Vorgänger beim Speicher. Waren es bei der Tesla P4 8 GByte GDDR5-Grafikspeicher und eine Bandbreite von 192 GByte pro Sekunde, sind es bei der Tesla T4 nun 16 GByte GDDR6 mit einer Bandbreite von über 320 GByte pro Sekunde.

Der größere Grafikchip macht es möglich

Doch dies kommt für Nvidia mit einem Preis: Der TU104-Grafikchip ist mit 545 mm² deutlich größer als der GP104, der lediglich 314 mm³ Fläche einnimmt. Die höhere Leistung wird demzufolge auch durch einen deutlich größeren Chip realisiert. Dank 75 Watt wird die PCI-Express-Beschleunigerkarte ohne Anschlüsse jedoch passiv im Luftstrom des Server-Racks gekühlt werden können, zusätzlich Stromanschlüsse sind nicht vorhanden.

Neben Google Cloud und Microsoft als erste Kunden werden in den kommenden Wochen und Monaten auch Cisco, Dell, Fujitsu, HPE, IBM, Oracle, Supermicro und weitere die Lösungen anbieten. Preise werden für diese Produkte wie üblich nicht genannt.