News Nvidia Tesla T4: Turing-Grafiklösung mit 8,1 TFLOPs bei nur 75 Watt

Volker

Ost 1
Teammitglied
Registriert
Juni 2001
Beiträge
18.361
Zur GTC Japan hat Nvidia-CEO Jensen Huang den Nachfolger der speziellen und bereits zwei Jahre alten Tesla P4 enthüllt. Die Tesla T4 basiert auf dem TU104-Grafikchip aus der Turing-Generation und soll bei einer weiterhin geringen Leistungsaufnahme von maximal 75 Watt teilweise die 12-fache Leistung des Vorgänger bieten.

Zur News: Nvidia Tesla T4: Turing-Grafiklösung mit 8,1 TFLOPs bei nur 75 Watt
 
Super - aber ohne einen Preis ist ja keine Budgetplanung möglich.
 
@cube413
Gibt verschiedene Arten von Neuronalen Netzen wo du nur 1 Bit zur Darstellung/Berechnung brauchst. Wenn du da jetzt die INT1 Performance nutzen kannst ist das viel Wert. Ist ja aber auch als experimentell deklariert.
 
Dafür verantwortlich zeichnet primär der TU104-Grafikchip von Nvidia, der neben 2.560 Shadern (Cuda Cores) in 40 SMs noch 320 Tensor Cores bietet. Damit wird der Grafikchip nicht vollständig genutzt, denn dieser kann im Maximum 3.072 Shader (48 Streaming-Multiprozessoren (SM)) und 384 Tensor Cores aufbieten, was jedoch der Effizienz geschuldet ist.
Wie ist der Absatz zu verstehen? Wieso sind die 2560 Shader der Effizienz geschuldet? Weil die Ausbeute an brauchbaren SM aus dem Wafer nicht so hoch ist und damit die Anzahl der produzierten Karten steigt? Oder ist man an die Einhaltung der 75 Watt gebunden, damit die PCI-E-Anbindung nicht überlastet wird?
 
  • Gefällt mir
Reaktionen: dienst
@der dödel =D
also außer in übungsaufgaben oder vorlesungen ist mir sowas noch nicht unter gekommen. aber vllt gibts da ja wirklich menschen, die das auch real nutzen :D
einfach mal übern tellerrand schauen
 
hollalen schrieb:
Wozu ist diese Karte?

Statt Karte eher nach Chip fragen.

Im Server brauchst Du nicht den hohen Takt . 75W sind auch eine Ansage.
Und als Resteverwertung dann in der RTX2070 weiterverwendet = preiswerter als teilaktivierte 2080.

Ist schon erstaunlich, das NV gleich mal 3 Chips für RTX raushaut und dann mit 2060 noch ein 4. folgen muss.
 
Moselbär schrieb:
Super - aber ohne einen Preis ist ja keine Budgetplanung möglich.
Der Preis wird wohl Verhandlungssache sein. Je nachdem, wie viele du denn haben möchtest. Die offiziellen Preisangaben sind bei solcher Hardware nicht so Aussagekräftig, da die eh kaum einer bezahlt, aber ich würde einfach Mal gucken, was die Quadro mit dem Chip kosten, wird sich hier wohl in einem ähnlichen Bereich bewegen
 
Tja... Tesla (Autofirma) hat wohl von dieser Tesla nichts gewusst...
 
  • Gefällt mir
Reaktionen: FeelsGoodManJPG und psYcho-edgE
Volker schrieb:
Damit wird der Grafikchip nicht vollständig genutzt, denn dieser kann im Maximum 3.072 Shader (48 Streaming-Multiprozessoren (SM)) und 384 Tensor Cores aufbieten, was jedoch der Effizienz geschuldet ist.
Effizienz? Du meinst wohl eher TDP. Ein breiterer Chip wäre bei gleicher Performance effizienter, da man ihn niedriger takten könnte.
 
  • Gefällt mir
Reaktionen: Flo42
bisher fehlt eine Frage mit Crysis :cool_alt:...

nicht schlecht was die Grünen da präsentieren - auch wenn für uns, normale Leute, wenig relevant...
 
  • Gefällt mir
Reaktionen: Pry_T800, Marc53844, FeelsGoodManJPG und eine weitere Person
cube413 schrieb:
Falls du dachtest das wäre ein Int mit 1bit muss ich dich enttäuschen ;)

INT1 = Integer 1 Byte = 0-255

In SQL nennt sich der Datentyp Tinyint.

Ist bspw. für 8bit-Farbkanäle sinnvoll. Oder was auch immer die damit vorhaben in Profi-Anwendungen.
 
bensen schrieb:
Ein breiterer Chip wäre bei gleicher Performance effizienter, da man ihn niedriger takten könnte.
Aber die beste Effizienz bekommt man Vielelicht bei höherem Takt. Dann kann das schon sein.
 
usb2_2 schrieb:
Aber die beste Effizienz bekommt man Vielelicht bei höherem Takt.

Eher nicht.
T4 wird wohl nicht viel anders als Vega sein.
Bei RX56 ist 0,862V für 1400eff.Takt schon am Besten.
Über 0,9V gehts dann langsam exp. steiler.
(nur bei der LCE sieht es etwas besser aus, da scheint V/Takt länger ne Gerade zu sein.)
oder z.Bsp.
die 1080Ti kann auch mit 0,8..0,85V noch ganz gut takten.

Da kommt man mit den niedrigen V auch leichter auf niedr. Temp., was den Wirkungsgrad verbessert.
 
Zuletzt bearbeitet:
GerryB schrieb:
V56 ist alleine effizienter, da sie besser ausgelastet wird. Vielleicht ist das bei Nvidia ja auch so. Wer weiß das schon.

Ein kleinerer Chip bei mehr Takt kann ja so viel höher takten für kaum mehr Volt, dass er doch effizienter ist. Vor allem bei höherer Auslastung.

Das heißt umgekehrt auch, dass man eventuell keinen vollen TU104 in 75w bekommt oder manche lasten, wie volle Tensor cores einfach zu viel brauchen könnten. Manchmal scheint ein kleinerer Chip auch sinnvoller.
 
Zurück
Oben