Nvidia GeForce GTX 660 im Test: Kepler in günstig dank GK106

13.9.2012 15:00 Uhr

Einleitung

Vor weniger als einem Monat hatte Nvidia drei Kepler-Grafikkarten auf dem Markt positioniert: Die GeForce GTX 690, GeForce GTX 680 und GeForce GTX 670. Die Modelle sind zwar alle sehr schnell, aber auch teuer. Mit der GeForce GTX 660 Ti haben die Kalifornier die Kepler-Architektur mit einem Marktpreis von rund 280 Euro unter die 300-Euro-Grenze gedrückt, für viele Spieler ist das aber immer noch zu viel.

Dies soll nun die GeForce GTX 660 (ohne Ti) richten, die für weniger als 250 Euro den Besitzer wechseln soll. Nvidia hat es sich für die Karte nicht leicht gemacht, denn es kommt erstmals die GK106-GPU zum Einsatz und nicht mehr der große GK104, der bis inklusive der GeForce GTX 660 Ti verbaut wird.

Zotac GeForce GTX 660 — Asus GeForce GTX 660 DCII TOP

Dementsprechend kann Nvidia nicht nur den Marktpreis weiter nach unten drücken, sondern es ist auch mit einer besseren Energieeffizienz zu rechnen. Ob dies tatsächlich zutrifft, inwieweit es einen Leistungsverlust gegenüber der Ti-Variante gibt und wie man sich gegen die Radeon HD 7850 sowie Radeon HD 7870 platziert, werden wir auf den folgenden Seiten herausfinden. Unser Dank geht dabei an Asus und Zotac, die uns beide eine GeForce GTX 660 zur Verfügung gestellt haben.

Technische Eckdaten

Die GeForce GTX 660 kommt mit einer Premiere daher, denn auf der Grafikkarte wird erstmals die GK106-GPU eingesetzt, die sich unter dem GK104 (GTX 690, GTX 680, GTX 670, GTX 660 Ti), aber über dem GK107 (GTX 650, GT 640) platziert. Der GK106 wird im modernen 28-nm-Prozess bei TSMC gefertigt und setzt sich aus 2,54 Milliarden Transistoren zusammen. Die Die-Fläche weist eine Größe von 214 mm auf, wie Nvidia uns gegenüber bestätigt hat.

Laut Nvidia kommt auf der GeForce GTX 660 der „volle“ GK106 zum Einsatz, es sollen keinerlei Einheiten deaktiviert sein. Die Architektur ist dabei völlig identisch zum GK104, man hat einzig die Anzahl der Ausführungseinheiten reduziert.

So gibt es auf dem GK106 noch drei anstatt vier Graphics Processing Clusters (GPCs) sowie fünf anstatt acht SMX-Blöcke. Jeder verbesserte Streaming-Multiprocessor setzt sich dabei aus 192 skalaren ALUs zusammen, die pro Takt ein MADD (Multiply-ADD) berechnen können. Es sind also 960 Shadereinheiten vorhanden. An jedem SMX sind ebenso 16 vollwertige Textureinheiten angeschlossen, die pro Takt einen Pixel adressieren sowie texturieren können. Das ergibt 80 TMUs auf der GeForce GTX 660. Die Anzahl der Polymorph-2.0-Engines, die für die Raster- und die Tessellation-Leistung zuständig sind, liegt bei fünf.

Der Standardtakt der GeForce GTX 660 liegt bei 980 MHz. Der erhalten gebliebene Turbo auf dem GK106 agiert im Durchschnitt mit 1.033 MHz, wobei dieser auf dem Referenzdesign auf bis zu 1.100 MHz hinauf gehen soll.

Die GeForce GTX 660 kommt mit drei 64-Bit-Speichercontrollern daher, was ein 192 Bit breites Interface ergibt. An dieses wird ein zwei Gigabyte großer Speicher mit 3.004 MHz angeschlossen, wobei ein Controller 1.024 MB versorgt und die beiden anderen jeweils 512 MB. 1,5 GB können dadurch per „Interleaving“ mit den vollen 192 Bit angesteuert werden, während die restlichen 512 MB nur einen einzelnen Controller, sprich 64 Bit, nutzen können. Dasselbe gilt schon für die GeForce GTX 660 Ti und kostet dort, wenn überhaupt, nur minimal an Performance. Wie die Hardware beziehungsweise der Treiber die Daten auf den Speicher aufteilt, ist unklar und gibt Nvidia nicht bekannt. Es ist aber anzunehmen, dass zuerst die schnellen 1,5 Gigabyte genutzt werden und dann nur im Notfall die langsameren, restlichen 512 MB. Jeder Speichercontroller ist auf dem GK106 zudem mit einem eigenen ROP-Cluster mit jeweils acht Raster Operation Processors versorgt. 24 ROPs stehen dem Rechenkern also zur Verfügung.

Der L2-Cache des GK106 weist eine Größe von 384 KB auf und ist damit 128 KB kleiner als auf dem GK104. Die durchschnittliche Leistungsaufnahme der GeForce GTX 660 soll laut Nvidia bei 115 Watt liegen. Bei maximiertem Power Target auf der „+10“-Einstellung soll diese auf 127 Watt ansteigen. Die TDP gibt man mit 140 Watt an, weswegen ein Sechs-Pin-Stromstecker ausreichend ist.

	Radeon HD 7870	Radeon HD 7850	GeForce GTX 560 Ti	GeForce GTX 660 Ti	GeForce GTX 660
Logo
Chip	Pitcairn	Pitcairn	GF114	GK104	GK106
Transistoren	ca. 2,8 Mrd.	ca. 2,8 Mrd.	ca. 1,95 Mrd.	ca. 3,54 Mrd.	ca. 2,54 Mrd.
Fertigung	28 nm	28 nm	40 nm	28 nm	28 nm
Chiptakt	1.000 MHz	860 MHz	822 MHz	915 MHz	980 MHz
Shadertakt	1.000 MHz	860 MHz	1.645 MHz	915 MHz	980 MHz
Boost-Takt	X	X	X	980 MHz	1.033 MHz
Shader-Einheiten (MADD)	1.280 (1D)	1.024 (1D)	384 (1D)	1.344 (1D)	960 (1D)
FLOPs (MAD)	2.560 GFLOPS	1.761 GFLOPS	1.253 GFLOPS	2.459 GFLOPS	1.882 GFLOPS
ROPs	32	32	32	24	24
Pixelfüllrate	32.000 MPix/s	27.520 MPix/s	26.304 MPix/s	21.960 MPix/s	23.520 MPix/s
TMUs	80	64	64	112	80
Texelfüllrate	80.000 MTex/s	55.040 MTex/s	52.608 MTex/s	102.480 MTex/s	78.400 MTex/s
Shader-Model	SM 5.1	SM5.1	SM 5	SM 5.1	SM 5.1
effektive Windows Stromsparfunktion	✓ (ZeroCore)	✓ (ZeroCore)	X	✓	✓
Speichermenge	2.048 MB GDDR5	2.048 MB GDDR5	1.024 MB GDDR5	2.048 MB GDDR5	2.048 MB GDDR5
Speichertakt	2.400 MHz	2.400 MHz	2.004 MHz	3.004 MHz	3.004 MHz
Speicherinterface	256 Bit	256 Bit	256 Bit	192 Bit	192 Bit
Speicherbandbreite	153.600 MB/s	153.600 MB/s	128.256 MB/s	144.192 MB/s	144.192 MB/s
Stromangaben Typisch/Maximal	175/? Watt	130/? Watt	170/? Watt	134/165 Watt	115/140Watt