GeForce GTX 460 im Test: Nvidia bringt eine neue Preisbrecher-Grafikkarte

 2/28
Wolfgang Andermahr
675 Kommentare

Technische Daten

Radeon
HD 5830
GeForce
GTX 460 768 MB
GeForce
GTX 460 1 GB
GeForce
GTX 465
Logo ATi Radeon Graphics klein Nvidia GeForce Nvidia GeForce Nvidia GeForce
Chip RV870/Cypress GF104 GF104 GF100
Transistoren ca. 2,15 Mrd. ca. 1,95 Mrd. ca. 1,95 Mrd. ca. 3 Mrd.
Fertigung 40 nm 40 nm 40 nm 40 nm
Chiptakt 800 MHz 675 MHz 675 MHz 607 MHz
Shadertakt 800 MHz 1.350 MHz 1.350 MHz 1.215 MHz
Shader-Einheiten
(MADD)
224 (5D) 336 (1D) 336 (1D) 352 (1D)
FLOPs (MADD/ADD) 1.792 GFLOPS 907 GFLOPS 907 GFLOPS 855 GFLOPS
ROPs 16 24 32 32
Pixelfüllrate 12.800 MPix/s 16.200 MPix/s 18.900 MPix/s 13.354 MPix/s
TMUs 56 56 56 44
TAUs 56 56 56 44
Texelfüllrate 44.800 MTex/s 37.800 MTex/s 37.800 MTex/s 26.708 MTex/s
Shader-Model SM 5 SM 5 SM 5 SM 5
Hybrid-CF/-SLI X X X X
effektive Windows
Stromsparfunktion
Speichermenge 1.024 MB GDDR5 768 MB GDDR5 1.024 MB GDDR5 1.024 MB GDDR5
Speichertakt 2.000 MHz 1.800 MHz 1.800 MHz 1.607 MHz
Speicherinterface 256 Bit 192 Bit 256 Bit 256 Bit
Speicherbandbreite 128.000 MB/s 86400 MB/s 115200 MB/s 102.848 MB/s

Anders als die bisherigen GeForce-GTX-400-Karten basiert die GeForce GTX 460 nicht mehr auf dem originalen GF100, sondern baut stattdessen auf die für das obere Mid-Range-Segment angepasste GF104-GPU. Denn bei dieser hat Nvidia einige Optimierungen vorgenommen, um so die beste Leistung bei angemessenen Produktions- und somit Verkaufskosten erreichen zu können. Dementsprechend ist der Rechenkern mit 1,95 Milliarden Transistoren zwar immer noch groß, aber deutlich kleiner als der GF100. Die Fertigung wird weiterhin von TSMCs 40-nm-Prozess übernommen.

GF104-Architektur
GF104-Architektur

Anders als beim großen Bruder sind auf dem GF104 nur noch zwei Graphics Processing Clusters (GPCs) anstatt deren vier übrig geblieben, wobei Nvidia auch deren Zusammensetzung geändert hat. Pro GPC gibt es vier Streaming-Multiprocessors (SM), wobei bei der GeForce GTX 460 aber insgesamt nur sieben aktiviert sind – der Logik nach müsste also noch ein SM abgeschaltet sein. Pro SM gibt es auf dem GF104 48 skalare Shadereinheiten (GF100: 32 ALUs), die pro Takt ein MADD (Multiply-ADD) ausführen können. Der Vollausbau vom GF104 besteht damit aus 384 Shadereinheiten, wobei bei der GeForce GTX 460 nur 336 aktiv sind.

Pro SM gibt es auf dem GF104 vier Dispatch-Einheiten (zwei im GF100), um die Auslastung der ALUs zu erhöhen. Verdoppelt haben sich die Anzahl der Textureinheiten sowie Special-Function-Units im GF104. Acht Texture Mapping Units, kurz TMUs, sind im GF104 pro SM enthalten und dieselbe Anzahl gilt für die SFU. Dementsprechend kann der GF104 auf der GeForce GTX 460 auf 56 Textureinheiten und 56 SFU zurückgreifen – genauso viel wie auf einer GeForce GTX 470.

Gleich geblieben ist dagegen die Anzahl der Polymorph-Engines pro SM, von denen es auf der GeForce GTX 460 sieben gibt, sodass die allgemeine Geometrie- sowie Tessellation-Leistung der RV870-GPU von ATi immer noch weit überlegen ist. Double-Precision ist auf dem GF104 weiterhin vorhanden, aber auf ein Zwölftel der Single-Precision-Leistung reduziert. GF100 bietet dort noch ein Achtel der SP-Leistung. Die volle DP-Performance findet man derzeit nur auf Tesla-Karten vor, auf denen sie genau die Hälfte der SP-Leistung beträgt. An der L1-Cache-Struktur hat es auf dem GF104 keine größeren Änderungen gegeben, dasselbe gilt für die Load-and-Store-Einheiten, die beim Texturzugriff helfen.

GF104-Architektur
GF104-Architektur

Kleiner ist das Speicherinterface auf dem GF104 geworden. Maximal vier 64-Bit-Controller können auf dem GF104 angeschlossen werden, was einem 256-Bit-Speicherinterface entspricht. Die GeForce GTX 460 kommt in dieser Konfiguration sowie in einer mit nur drei Speichercontroller (192 Bit) auf den Markt. Damit sind ungerade Speicherbestückungen wie 768 MB wieder gegeben. Zudem ändert das die Größe des L2-Caches: 512 KB auf der 256-Bit-Karte und 384 KB auf der 192-Bit-Karte (768 KB auf dem GF100). An jeden Controller ist ein ROP-Cluster angeschlossen, der sich aus je acht Raster Operation Clusters zusammensetzt. Die 256-Bit-Variante der GeForce GTX 460 nutzt also 32 ROPs, das 192-Bit-Modell dagegen 24 ROPs.

Die ROPs und das Speicherinterface sind die einzigen Unterschiede bei den GeForce-GTX-460-Varianten. Die Taktraten sind dagegen identisch. So taktet die TMU-Domäne mit 675 MHz, während die Shadereinheiten mit 1.350 MHz angesteuert werden. Der Speicher arbeitet mit 1.800 MHz. Die TDP-Angabe von Nvidia beläuft sich für die 1.024-MB-Karte auf 160 Watt und für die 768-MB-Karte auf 150 Watt. In beiden Fällen sind zwei Sechs-Pin-Stromstecker notwendig.

GF104-GPU
GF104-GPU