GeForce GTX 980/970 im Test: Nvidia Maxwell 2.0 für High-End ist da

19.9.2014 4:30 Uhr

Einleitung

Nvidia Maxwell in der zweiten Generation für High-End-Grafikkarten ist da. Die ersten beiden Grafikkarten tragen die Bezeichnung GeForce GTX 980 und 970. Sie ersetzen mit GTX 770, 780 und 780 Ti zu zweit gleich drei Vorgänger. Die alten Karten laufen aus.

Modell	GPU	Preis	Status
GeForce GTX 980	GM204	540 Euro (UVP)
GeForce GTX 780 Ti	GK110	499 Euro	wird eingestellt
GeForce GTX 780	GK110	370 Euro	wird eingestellt
GeForce GTX 970	GM204	320 Euro (UVP)
GeForce GTX 770	GK104	260 Euro	wird eingestellt
Alle Preise auf Basis sofort lieferbarer Angebote

Die neuen Grafikkarten sollen bei der Leistungsfähigkeit überlegen sein und dabei deutlich weniger verbrauchen, verspricht Nvidia. Neue Funktionen, die der Bildqualität zu Gute kommen, gibt es auch. ComputerBase hat die Grafikkarten ausführlich getestet.

Neben der GeForce GTX 980 im Referenzdesign hat sich für den Test die Gigabyte GeForce GTX 980 G1 Gaming in der Redaktion eingefunden. Die günstigere Variante ist durch die Asus GeForce GTX 970 Strix und die Gigabyte GeForce GTX 970 G1 Gaming vertreten.

Maxwell 2.0

Maxwell als Nachfolger der Kepler-Architektur gibt es auf GeForce GTX 750 Ti und GeForce GTX 750 seit über einem halben Jahr. Die auf beiden Grafikkarten verwendete GM107-GPU setzte auf die Maxwell-Architektur der „ersten Generation“, deren oberstes Ziel die bessere Energieeffizienz gewesen sein soll.

Der GM204 der GeForce GTX 980 und GeForce GTX 970 basiert dagegen auf der „zweiten Generation“, die neben der Leistungsaufnahme auch die Geschwindigkeit sowie neue Features in den Fokus stellt. Ein Überblick der Neuerungen.

GPU-Architektur

Auch der GM204 wird von TSMC im bekannten 28-nm-HP-Verfahren hergestellt und umfasst 5,2 Milliarden Transistoren. Die Chipgröße liegt bei 398 mm², was ihn analog zur Ausstattung mit Transistoren näher am GK104 als am GK110 positioniert. Mit rein rechnerisch 13,1 Millionen Transistoren pro Quadratmillimeter liegt der GM204 bei der Packdichte vor den anderen Nvidia-GPUs im Vergleich, aber hinter Hawaii von AMD. Die Entwicklung der Grundarchitektur hat laut Nvidia bereits im Jahr 2011 begonnen.

Chip	GM204	GM107	GK104	GK110	Hawaii
Transistoren	ca. 5,2 Mrd.	ca. 1,9 Mrd.	ca. 3,5 Mrd.	ca. 7,1 Mrd.	ca. 6,2 Mrd.
Fertigung	28 nm HP TSMC	28 nm HP TSMC	28 nm HP TSMC	28 nm HP TSMC	28 nm HP TSMC
Chipgröße	398 mm²	148 mm²	294 mm²	550 mm²	438 mm²
Packdichte*	13,1	12,8	11,9	12,9	14,2
* In Millionen Transistoren pro mm²

Die Grundarchitektur des GM204 lehnt sich stark am GM107 an, anstelle eines Graphics Processor Cluster (GPC) gibt es allerdings deren vier. Im Detail gibt es jedoch Anpassungen, so dass GM204 nicht einfach dem Vierfachen des GM107 entspricht.

Das beginnt bei der Anzahl der Streaming Multiprocessors (SMM) pro GPC, die gegenüber dem GM107 von fünf auf vier gefallen ist. Gegenüber GK104 stellt das allerdings weiterhin eine Verdopplung dar. Beim Aufbau des SMM orientiert sich der große Maxwell-Chip hingegen an der kleinen Variante, 128 Shader und 8 TMUs bedeuten erneut eine klare Veränderung in der Architektur gegenüber Kepler. Dabei gibt Nvidia an, dass die ALUs auf dem GM204 um 40 Prozent schneller rechnen als auf dem GK104 – beim Sprung von GK107 auf GM107 hatte Nvidia von einem Leistungszuwachs von 35 Prozent gesprochen.

	GM204	GM107	GK104
Graphics Processor Cluster (GPC)	4	1	4
Streaming Multiprocessors (SMM) pro GPC	4	5	2
Shader pro SSM	128	128	192
TMUs pro SSM	8	8	16
Polymorph-Engine pro SSM (Version)	1 (3.0)	1 (2.0)	1 (2.0)
Shader gesamt	2.048	640	1.536
TMUs gesamt	128	40	128

In zwei Punkten unterscheiden sich die SMM auf GM107 und GM204 allerdings doch. Nvidia gibt an, die Polymorph-Engine in den SMM erneut überarbeitet zu haben. Worin der Vorteil der Version 3.0 gegenüber der Version 2.0 liegt, darüber schweigt sich der Hersteller allerdings aus. Ein Blockschaltbild weist allerdings einen „Vertex Fetch“ sowie einen zusätzlichen „Attribute Setup“ aus, sodass die neuen Polymorph Engines Grafikobjekte schneller einlesen können sollten.

**Bildvergleich:** Blockdiagramm Nvidia GM204 ⇔ Ein Streaming Multiprocessor Maxwell im Detail

**Bildvergleich:** Blockdiagramm Nvidia GM204 ⇔ Ein Streaming Multiprocessor Maxwell im Detail

Die zweite Änderung innerhalb der SMM ist im L1-Cache zu suchen. Bei GM204 legt der schnelle Zwischenspeicher um 50 Prozent auf nun 96 KB zu. Der L2 Cache außerhalb der SMMs bleibt dagegen mit 2.048 KB unangetastet. Während GM107 gegenüber GK107 also einen großen Schritt macht, ist der Cache „nur“ noch um 512 KB größer als bei GK110.

	GM204	GM107	GK104	GK110
L1-Cache je SMM	96 KB	64 KB	64 KB	64 KB
L2-Cache je GPU	2.048 KB	2.084 KB	512 KB	1.536 KB

Auch abseits der GPCs und ihrer SMMs hat sich gegenüber GK104 etwas getan. So hat Nvidia die Anzahl der ROPs pro Cluster verdoppelt. Mit 64 ROPs bietet bereits GM204 damit ein Drittel mehr als GK110 und die doppelte Anzahl wie GK104. Beim Aufbau des Speicherinterface ist gegenüber GK104 dagegen alles beim Alten geblieben: Vier 64-Bit-Controller sorgen für ein 256 Bit breites Speicherinterface.

	GM204	GM107	GK104	GK110
ROP-Cluster	4	2	4	6
ROPs pro Cluster	16	8	8	8
ROPs gesamt	64	16	32	48
Speichercontroller	4 × 64 Bit	2 × 64 Bit	4 × 64 Bit	6 × 64 Bit
Speicherinterface	256 Bit	128 Bit	256 Bit	384 Bit

Das ist damit um genau 50 Prozent kleiner als auf dem großen Kepler GK110. Der neue Chip soll das durch eine bessere Speicherkomprimierung, die mehr Farbvarianten komprimiert als zuvor (Delta Color Compression), allerdings in Teilen ausgleichen – genau wie AMD mit der Tonga-GPU. Die dritte Generation der Speicherkomprimierung (Fermi: 1. Generation, Kepler: 2. Generation) soll die vorhandene Bandbreite 25 Prozent effizienter nutzen: Rein rechnerisch entspricht das Speicherinterface des GM204 damit einem hypothetischen GK104 mit 320 Bit breitem Speicherinterface.

Die Geschwindigkeit bei der Berechnung in doppelter Genauigkeit (Double Precision) ist auch beim GM204 wie beim Maxwell-Chip der ersten Generation deutlich auf ein Zweiunddreißigstel reduziert.

	GM204	GM107	GK104	GK110
DP/SP-Verhältnis*	1/32	1/32	1/24	1/3
* Leistung Double Precision im Verhältnis zu Single Precision, maximal

In Summe sollen alle Veränderungen gegenüber GK104 und GM107 zur Folge haben, dass GM204 bei gleichem Energieverbrauch doppelt so schnell rechnet wie GK104, stellt Nvidia in Aussicht.