TU102, TU104, TU106: Nvidias Turing-Chips im (Größen-) Vergleich

12.9.2018 12:38 Uhr

Die für Leaks berüchtigte Website VideoCardz will an Dokumente über die Architektur der neuen Turing-GPUs von Nvidia gelangt sein. Geliefert werden Spezifikationen zu den drei Grafikchips TU102, TU104 und TU106, die auf den Grafikkarten GeForce RTX 2080 Ti, RTX 2080 und RTX 2070 eingesetzt werden sollen.

RTX 2070 mit TU106 und nicht TU104

Ältere Gerüchte, dass die GeForce RTX 2070 mit TU106 einen kleineren Chip anstatt einer weiter abgespeckten Version des TU104 (RTX 2080) erhält, werden durch die Informationen bestärkt. Angeblich soll die RTX 2070 den Vollausbau des TU106 mit 2.304 Shader-Einheiten bekommen. Die RTX 2080 setzt hingegen auf den größeren TU104, der bei der Quadro RTX 5000 3.072 Shader-Einheiten besitzt, bei der RTX 2080 allerdings auf 2.944 beschränkt ist. Das Flaggschiff GeForce RTX 2080 Ti basiert auf einer auf 4.352 aktive Shader limitierten Version der TU102-GPU, die mit 4.608 Shader-Einheiten bei der Quadro RTX 6000 und RTX 8000 eingesetzt wird.

	TU102	TU104	TU106
Fertigung	12nm FFN (TSMC)
Die-Fläche	754 mm²	545 mm²	445 mm²
Transistoren	18,6 Milliarden	13,6 Milliarden	10,6 Milliarden
GPCs	6		3
TPCs	36 (6/GPC)	24 (4/GPC)	18 (6/GPC)
SMs	72 (12/GPC)	48 (8/GPC)	36 (12/GPC)
Tensor Cores	576	384	288
RT Cores	72	48	36
FP32 Cores (CUDAs)	4.608	3.072	2.304
INT32 Cores	4.608	3.072	2.304
ROPs	96	64
TMUs	288	192	144
Memory Interface	384 Bit	256 Bit
L2 Cache	6.144 KB	4.096 KB
Quelle: VideoCardz

TU102 und TU104 sollen je über sechs Graphics Processing Clusters (GPC) verfügen, beim kleineren TU106 seien es nur deren drei. Bei TU102 und TU106 sollen in jedem GPC je sechs Texture Processing Clusters (TPC) vorhanden sein, bei TU104 seien es nur deren vier pro GPC. Allen gemein wiederum sei, dass pro TPC je zwei Streaming-Multiprozessoren (SM) eingesetzt werden.

Die Tabelle schlüsselt auch die Zahl der neuen Tensor- und RT-Kerne (Raytracing) auf, die den wesentlichen Unterschied zu den Vorgängern der Pascal-Architektur ausmachen.

Unter den weiteren Neuerungen wird eine verbesserte Speicherkomprimierung für „50 Prozent mehr effektive Bandbreite im Vergleich zu Pascal“ genannt. Hinzu kommen eine überarbeitete Display- und Video-Engine und der neue „SLI“-Anschluss NVLink für das Zusammenschalten von zwei GeForce RTX 2080 (Ti) – die RTX 2070 besitzt kein NVLink.

Turing ist im Vergleich zu Pascal riesig

Auf Reddit wird über die stattliche Größe der neuen Turing-GPUs diskutiert, von Nutzern erstellte Grafiken liefern einen Größenvergleich mit Pascal anhand symbolisierter Chips (im nicht zwingend korrekten Seitenverhältnis). Dass TU102 mit einer Fläche von 754 mm² die zweitgrößte GPU aller Zeiten nach Nvidias GV100 (Volta) darstellt, hatte Nvidia bereits offiziell verkündet.

Größenvergleich: Nvidia Turing versus Pascal (Bild: via Reddit)

TU104 soll mit 545 mm² fast die Größe des größten Pascal-Chips GP100 mit 610 mm² erreichen. Dass eine xx106-GPU einen kleinen Chip für die Mittelklasse darstellt, ist mit Turing ebenso Geschichte: TU106 wäre mit 445 mm² mehr als doppelt so groß wie der GP106 und sogar rund 42 Prozent größer als der auf der GeForce GTX 1070 und GTX 1080 eingesetzte GP104.

Die zusätzlichen Rechenwerke für Deep Learning (Tensor Cores) und Raytracing (RT Cores) benötigen nun einmal mehr Platz. Das 12nm-FinFET-Verfahren von TSMC bietet zudem keine wesentlich höhere Packdichte als der 16-nm-Prozess bei Pascal.