Test: Nvidia GeForce GTX 660

Günstige Kepler dank GK106
Autor:

Einleitung

Vor weniger als einem Monat hatte Nvidia drei Kepler-Grafikkarten auf dem Markt positioniert: Die GeForce GTX 690, GeForce GTX 680 und GeForce GTX 670. Die Modelle sind zwar alle sehr schnell, aber auch teuer. Mit der GeForce GTX 660 Ti haben die Kalifornier die Kepler-Architektur mit einem Marktpreis von rund 280 Euro unter die 300-Euro-Grenze gedrückt, für viele Spieler ist das aber immer noch zu viel.

Dies soll nun die GeForce GTX 660 (ohne Ti) richten, die für weniger als 250 Euro den Besitzer wechseln soll. Nvidia hat es sich für die Karte nicht leicht gemacht, denn es kommt erstmals die GK106-GPU zum Einsatz und nicht mehr der große GK104, der bis inklusive der GeForce GTX 660 Ti verbaut wird.

Asus GeForce GTX 660 DCII TOP
Asus GeForce GTX 660 DCII TOP
Zotac GeForce GTX 660
Zotac GeForce GTX 660

Dementsprechend kann Nvidia nicht nur den Marktpreis weiter nach unten drücken, sondern es ist auch mit einer besseren Energieeffizienz zu rechnen. Ob dies tatsächlich zutrifft, inwieweit es einen Leistungsverlust gegenüber der Ti-Variante gibt und wie man sich gegen die Radeon HD 7850 sowie Radeon HD 7870 platziert, werden wir auf den folgenden Seiten herausfinden. Unser Dank geht dabei an Asus und Zotac, die uns beide eine GeForce GTX 660 zur Verfügung gestellt haben.

Technische Eckdaten

Die GeForce GTX 660 kommt mit einer Premiere daher, denn auf der Grafikkarte wird erstmals die GK106-GPU eingesetzt, die sich unter dem GK104 (GTX 690, GTX 680, GTX 670, GTX 660 Ti), aber über dem GK107 (GTX 650, GT 640) platziert. Der GK106 wird im modernen 28-nm-Prozess bei TSMC gefertigt und setzt sich aus 2,54 Milliarden Transistoren zusammen. Die Die-Fläche weist eine Größe von 214 mm auf, wie Nvidia uns gegenüber bestätigt hat.

Laut Nvidia kommt auf der GeForce GTX 660 der „volle“ GK106 zum Einsatz, es sollen keinerlei Einheiten deaktiviert sein. Die Architektur ist dabei völlig identisch zum GK104, man hat einzig die Anzahl der Ausführungseinheiten reduziert.

So gibt es auf dem GK106 noch drei anstatt vier Graphics Processing Clusters (GPCs) sowie fünf anstatt acht SMX-Blöcke. Jeder verbesserte Streaming-Multiprocessor setzt sich dabei aus 192 skalaren ALUs zusammen, die pro Takt ein MADD (Multiply-ADD) berechnen können. Es sind also 960 Shadereinheiten vorhanden. An jedem SMX sind ebenso 16 vollwertige Textureinheiten angeschlossen, die pro Takt einen Pixel adressieren sowie texturieren können. Das ergibt 80 TMUs auf der GeForce GTX 660. Die Anzahl der Polymorph-2.0-Engines, die für die Raster- und die Tessellation-Leistung zuständig sind, liegt bei fünf.

GK106-GPU
GK106-GPU

Der Standardtakt der GeForce GTX 660 liegt bei 980 MHz. Der erhalten gebliebene Turbo auf dem GK106 agiert im Durchschnitt mit 1.033 MHz, wobei dieser auf dem Referenzdesign auf bis zu 1.100 MHz hinauf gehen soll.

Die GeForce GTX 660 kommt mit drei 64-Bit-Speichercontrollern daher, was ein 192 Bit breites Interface ergibt. An dieses wird ein zwei Gigabyte großer Speicher mit 3.004 MHz angeschlossen, wobei ein Controller 1.024 MB versorgt und die beiden anderen jeweils 512 MB. 1,5 GB können dadurch per „Interleaving“ mit den vollen 192 Bit angesteuert werden, während die restlichen 512 MB nur einen einzelnen Controller, sprich 64 Bit, nutzen können. Dasselbe gilt schon für die GeForce GTX 660 Ti und kostet dort, wenn überhaupt, nur minimal an Performance. Wie die Hardware beziehungsweise der Treiber die Daten auf den Speicher aufteilt, ist unklar und gibt Nvidia nicht bekannt. Es ist aber anzunehmen, dass zuerst die schnellen 1,5 Gigabyte genutzt werden und dann nur im Notfall die langsameren, restlichen 512 MB. Jeder Speichercontroller ist auf dem GK106 zudem mit einem eigenen ROP-Cluster mit jeweils acht Raster Operation Processors versorgt. 24 ROPs stehen dem Rechenkern also zur Verfügung.

Der L2-Cache des GK106 weist eine Größe von 384 KB auf und ist damit 128 KB kleiner als auf dem GK104. Die durchschnittliche Leistungsaufnahme der GeForce GTX 660 soll laut Nvidia bei 115 Watt liegen. Bei maximiertem Power Target auf der „+10“-Einstellung soll diese auf 127 Watt ansteigen. Die TDP gibt man mit 140 Watt an, weswegen ein Sechs-Pin-Stromstecker ausreichend ist.

Radeon
HD 7870
Radeon
HD 7850
GeForce
GTX 560 Ti
GeForce
GTX 660 Ti
GeForce
GTX 660
Logo AMD-Logo AMD-Logo Nvidia-Logo Nvidia-Logo Nvidia-Logo
Chip Pitcairn Pitcairn GF114 GK104 GK106
Transistoren ca. 2,8 Mrd. ca. 2,8 Mrd. ca. 1,95 Mrd. ca. 3,54 Mrd. ca. 2,54 Mrd.
Fertigung 28 nm 28 nm 40 nm 28 nm 28 nm
Chiptakt 1.000 MHz 860 MHz 822 MHz 915 MHz 980 MHz
Shadertakt 1.000 MHz 860 MHz 1.645 MHz 915 MHz 980 MHz
Boost-Takt X X X 980 MHz 1.033 MHz
Shader-Einheiten
(MADD)
1.280 (1D) 1.024 (1D) 384 (1D) 1.344 (1D) 960 (1D)
FLOPs (MAD) 2.560 GFLOPs 1.761 GFLOPs 1.253 GFLOPs 2.459 GFLOPs 1.882 GFLOPs
ROPs 32 32 32 24 24
Pixelfüllrate 32.000 MPix/s 27.520 MPix/s 26.304 MPix/s 21.960 MPix/s 23.520 MPix/s
TMUs 80 64 64 112 80
Texelfüllrate 80.000 MTex/s 55.040 MTex/s 52.608 MTex/s 102.480 MTex/s 78.400 MTex/s
Shader-Model SM 5.1 SM5.1 SM 5 SM 5.1 SM 5.1
effektive Windows
Stromsparfunktion
✓ (ZeroCore) ✓ (ZeroCore) X
Speichermenge 2.048 MB GDDR5 2.048 MB GDDR5 1.024 MB GDDR5 2.048 MB GDDR5 2.048 MB GDDR5
Speichertakt 2.400 MHz 2.400 MHz 2.004 MHz 3.004 MHz 3.004 MHz
Speicherinterface 256 Bit 256 Bit 256 Bit 192 Bit 192 Bit
Speicherbandbreite 153.600 MB/s 153.600 MB/s 128.256 MB/s 144.192 MB/s 144.192 MB/s
Stromangaben
Typisch/Maximal
175/? Watt 130/? Watt 170/? Watt 134/165 Watt 115/140Watt
Anzeige