News Nvidia Tesla T4: Turing-Grafiklösung mit 8,1 TFLOPs bei nur 75 Watt

Volker

Ost 1
Teammitglied
Dabei seit
Juni 2001
Beiträge
14.400
#1
Zur GTC Japan hat Nvidia-CEO Jensen Huang den Nachfolger der speziellen und bereits zwei Jahre alten Tesla P4 enthüllt. Die Tesla T4 basiert auf dem TU104-Grafikchip aus der Turing-Generation und soll bei einer weiterhin geringen Leistungsaufnahme von maximal 75 Watt teilweise die 12-fache Leistung des Vorgänger bieten.

Zur News: Nvidia Tesla T4: Turing-Grafiklösung mit 8,1 TFLOPs bei nur 75 Watt
 
Dabei seit
Okt. 2011
Beiträge
27.839
#6
Super - aber ohne einen Preis ist ja keine Budgetplanung möglich.
 
Dabei seit
Apr. 2009
Beiträge
911
#7
@cube413
Gibt verschiedene Arten von Neuronalen Netzen wo du nur 1 Bit zur Darstellung/Berechnung brauchst. Wenn du da jetzt die INT1 Performance nutzen kannst ist das viel Wert. Ist ja aber auch als experimentell deklariert.
 

kullakehx

Lt. Junior Grade
Dabei seit
Mai 2007
Beiträge
324
#9
Dafür verantwortlich zeichnet primär der TU104-Grafikchip von Nvidia, der neben 2.560 Shadern (Cuda Cores) in 40 SMs noch 320 Tensor Cores bietet. Damit wird der Grafikchip nicht vollständig genutzt, denn dieser kann im Maximum 3.072 Shader (48 Streaming-Multiprozessoren (SM)) und 384 Tensor Cores aufbieten, was jedoch der Effizienz geschuldet ist.
Wie ist der Absatz zu verstehen? Wieso sind die 2560 Shader der Effizienz geschuldet? Weil die Ausbeute an brauchbaren SM aus dem Wafer nicht so hoch ist und damit die Anzahl der produzierten Karten steigt? Oder ist man an die Einhaltung der 75 Watt gebunden, damit die PCI-E-Anbindung nicht überlastet wird?
 
Dabei seit
Sep. 2016
Beiträge
132
#12
Statt Karte eher nach Chip fragen.

Im Server brauchst Du nicht den hohen Takt . 75W sind auch eine Ansage.
Und als Resteverwertung dann in der RTX2070 weiterverwendet = preiswerter als teilaktivierte 2080.

Ist schon erstaunlich, das NV gleich mal 3 Chips für RTX raushaut und dann mit 2060 noch ein 4. folgen muss.
 
Dabei seit
Feb. 2012
Beiträge
3.232
#13
Super - aber ohne einen Preis ist ja keine Budgetplanung möglich.
Der Preis wird wohl Verhandlungssache sein. Je nachdem, wie viele du denn haben möchtest. Die offiziellen Preisangaben sind bei solcher Hardware nicht so Aussagekräftig, da die eh kaum einer bezahlt, aber ich würde einfach Mal gucken, was die Quadro mit dem Chip kosten, wird sich hier wohl in einem ähnlichen Bereich bewegen
 

Marius

Vice Admiral
Dabei seit
Nov. 2008
Beiträge
7.073
#14
Tja... Tesla (Autofirma) hat wohl von dieser Tesla nichts gewusst...
 

bensen

Fleet Admiral
Dabei seit
Juli 2003
Beiträge
18.028
#15
Damit wird der Grafikchip nicht vollständig genutzt, denn dieser kann im Maximum 3.072 Shader (48 Streaming-Multiprozessoren (SM)) und 384 Tensor Cores aufbieten, was jedoch der Effizienz geschuldet ist.
Effizienz? Du meinst wohl eher TDP. Ein breiterer Chip wäre bei gleicher Performance effizienter, da man ihn niedriger takten könnte.
 

Waelder

Lt. Commander
Dabei seit
Juli 2012
Beiträge
1.983
#16
bisher fehlt eine Frage mit Crysis :cool:...

nicht schlecht was die Grünen da präsentieren - auch wenn für uns, normale Leute, wenig relevant...
 
Dabei seit
Apr. 2013
Beiträge
6.812
#17
Dabei seit
März 2013
Beiträge
2.217
#18
Dabei seit
Sep. 2016
Beiträge
132
#19
Aber die beste Effizienz bekommt man Vielelicht bei höherem Takt.
Eher nicht.
T4 wird wohl nicht viel anders als Vega sein.
Bei RX56 ist 0,862V für 1400eff.Takt schon am Besten.
Über 0,9V gehts dann langsam exp. steiler.
(nur bei der LCE sieht es etwas besser aus, da scheint V/Takt länger ne Gerade zu sein.)
oder z.Bsp.
die 1080Ti kann auch mit 0,8..0,85V noch ganz gut takten.

Da kommt man mit den niedrigen V auch leichter auf niedr. Temp., was den Wirkungsgrad verbessert.
 
Zuletzt bearbeitet:
Dabei seit
März 2013
Beiträge
2.217
#20
V56 ist alleine effizienter, da sie besser ausgelastet wird. Vielleicht ist das bei Nvidia ja auch so. Wer weiß das schon.

Ein kleinerer Chip bei mehr Takt kann ja so viel höher takten für kaum mehr Volt, dass er doch effizienter ist. Vor allem bei höherer Auslastung.

Das heißt umgekehrt auch, dass man eventuell keinen vollen TU104 in 75w bekommt oder manche lasten, wie volle Tensor cores einfach zu viel brauchen könnten. Manchmal scheint ein kleinerer Chip auch sinnvoller.
 
Top