GeForce GTX 1080 im Test: Ein Paukenschlag in 16 nm mit 1,8 GHz und GDDR5X

Wolfgang Andermahr
1.638 Kommentare
GeForce GTX 1080 im Test: Ein Paukenschlag in 16 nm mit 1,8 GHz und GDDR5X

Die GeForce GTX 1080: Das neue Nvidia-Flaggschiff

Nvidias CEO Jen Hsun Huang hat zur Vorstellung der ersten Grafikkarten mit GPU der Generation Pascal im Mai abermals nicht mit Superlativen gegeizt: GeForce GTX 1080 sowie GeForce GTX 1070 sollen alle Vorgänger inklusive der GeForce GTX Titan X in jeglicher Hinsicht weit übertreffen. Keine unüblichen Versprechen bei einer Produktvorstellung.

Im Test muss sich die GeForce GTX 1080 Founders Edition jetzt in der Praxis beweisen. Das Hauptaugenmerk liegt neben klassischen Benchmarks in einem neuen Testparcours auf zahlreichen weitere Testreihen: Energieeffizienz, Lautstärke, DirectX 12 und neue Funktionen von Pascal stehen auf dem Prüfstand.

Kurzzusammenfassung: Die GeForce GTX 1080 ist zweifelsohne die neue Oberliga. Und das gilt auch für den Preis. 789 Euro verlangt Nvidia für das Referenzdesign mit neuem Namen.

Update: Mittlerweile ist der Test der noch schnelleren Nvidia GeForce GTX 1080 Ti Founders Edition auf Computerbase erschienen.

Die Pascal-Architektur

Der GP100 auf der Tesla P100 war Anfang April die erste offiziell von Nvidia vorgestellte Pascal-GPU, auf der GeForce GTX 1080 sowie der GeForce GTX 1070 kommt jetzt der kleinere Bruder GP104 zum Einsatz. Das Vorgehen ist aus vergangenen Generationen bekannt, dieses Mal unterscheiden sich der große und der kleine Chip aber deutlich voneinander.

Nvidia GP104 Blockschaltbild
Nvidia GP104 Blockschaltbild (Bild: Nvidia)

GP104 im Vergleich zu Maxwell und GP100

Auch der GP104 wird im 16-nm-FinFET-Verfahren von TSMC gefertigt (16nmFF+). Die GPU ist 314 mm² groß und beherbergt 7,2 Milliarden Transistoren. Damit fällt die Packdichte sehr ähnlich zum GP100 aus, der 610 mm² für 15,3 Milliarden Transistoren benötigt. Im Vergleich zu den GPUs im alten 28-nm-Prozess ist die Packdichte um rund 75 Prozent gestiegen.

Chip GP104 GM204 GM200
z.B. auf GTX 1080 / 1070 GTX 980 / 970 GTX 980 Ti
Transistoren ca. 7,2 Mrd. ca. 5,2 Mrd. ca. 8,0 Mrd.
Fertigung 16 nm FinFET TSMC 28 nm HP TSMC 28 nm HP TSMC
Chipgröße 314 mm² 398 mm² 601 mm²
Packdichte* 22,9 13,1 13,3
* In Millionen Transistoren pro mm²

Die Shader wurden von Maxwell übernommen

Während Maxwell gegenüber Kepler große Änderungen bei den Shadereinheiten mitgebracht hat, bleiben die ALUs bei Pascal unangetastet. Wie Jonah Alben, Senior Vice President of GPU Engineering bei Nvidia, bestätigt, ist der Datendurchsatz dieser Einheiten damit pro Takt unverändert geblieben.

GP104 GM204 GK104
Graphics Processor Cluster (GPC) 4 4 4
Streaming Multiprocessors (SMM) pro GPC 5 4 2
Shader pro SSM 128 128 192
TMUs pro SSM 8 8 16
Polymorph-Engine pro SSM (Version) 1 (4.0) 1 (3.0) 1 (2.0)
Shader gesamt 2.560 2.048 1.536
TMUs gesamt 160 128 128

Auch der GP104 setzt sich wie der GM204 aus vier Graphics Processor Cluster (GPC) zusammen, die wiederum die einzelnen Elemente enthalten. Allerdings gibt es pro GPC fünf Streaming Multiprocessors (SMs) anstatt deren vier bei Maxwell. Ihr Aufbau ist wiederum quasi identisch. Jeder SM besteht auf dem GP104 aus 128 Shadereinheiten, acht Texture Mapping Units, zwei separaten Texture/L1-Caches, einem 256 KB großen Registerspeicher sowie einem 96 Kilobyte großen Shadered Memory. Damit kommt man bei dem GP104 auf 2.560 Shader- sowie 160 Textureinheiten.

GP104 GM204 GK104
ROP-Cluster 8 4 4
ROPs pro Cluster 8 16 8
ROPs gesamt 64 64 32
Speichercontroller 8 × 32 Bit 8 × 32 Bit 4 × 64 Bit
Speicherinterface 256 Bit 256 Bit 256 Bit

Pascal ist Maxwell für FinFET mit extremen Taktraten und ein wenig Tuning

Auch an den restlichen Einheiten wie den Instruction Buffern sowie den Warp Schedulern hat es keine Unterschiede gegeben. Das gilt nicht ganz für die Polymorph-Engine, die nun in der Version 4.0 anstatt 3.0 vorliegt. Die genaueren Auswirkungen dieser Anpassung werden später beschrieben. Mit acht ROP-Partitions zu je acht ROPs (64 ROPs insgesamt) sowie einem zwei Megabyte großen L2-Cache (256 KB pro ROP-Partition) bleibt auf dem GP104 auch dies identisch zum GM204. Eine minimale Änderung hat es bei der Konfiguration des Speicherinterfaces gegeben. GP104 setzt wie GM204 auf ein 256-Bit-Interface, das wie bei Maxwell aus acht 32-Bit-Controllern besteht.

GP104 GM204 GK104
L1-Cache je SMM 48 KB 48 KB kein separater L1
L2-Cache je GPU 2.048 KB 2.084 KB 512 KB
Nvidia GP 104 SM
Nvidia GP 104 SM (Bild: Nvidia)

GP104 und GP100 unterscheiden sich in der Konfiguration

Abseits der Fertigungstechnologie finden sich im Vergleich von GP104 zu GP100 damit sogar mehr Unterschiede, die über die massiv geringere Double-Precision-Leistung (1:32 bei GP104 gegenüber 1:2 bei GP100) und den Wegfall von Half Precision (FP16) hinaus gehen. Während GP104 auf den Maxwell-Aufbau einer SM und damit auf 128 ALUs setzt, geht GP100 einen anderen Weg und halbiert die Anzahl der ALUs pro SM. Mit 64 ALUs pro SM liegt diese GPU auf demselben Niveau wie AMDs Graphics-Core-Next-Architektur. Warum Nvidia diesen Schritt gegangen ist, wollte der Hersteller nicht verraten.

Nvidia GTC 2024 (18.–21. März 2024): ComputerBase ist vor Ort!