Test: Nvidia GeForce GTX 580 (2/29)

Schneller, leiser, etwas sparsamer
Autor:

Technische Daten

Radeon
HD 5870
Radeon
HD 6870
GeForce
GTX 480
GeForce
GTX 580
Logo AMD-Logo AMD-Logo Nvidia-Logo Nvidia-Logo
Chip RV870/Cypress Barts GF100 GF110
Transistoren ca. 2,15 Mrd. ca. 1,7 Mrd. ca. 3 Mrd. ca. 3 Mrd.
Fertigung 40 nm 40 nm 40 nm 40 nm
Chiptakt 850 MHz 900 MHz 700 MHz 772 MHz
Shadertakt 850 MHz 900 MHz 1.401 MHz 1.544 MHz
Shader-Einheiten
(MADD)
320 (5D) 224 (5D) 480 (1D) 512 (1D)
FLOPs (MADD/ADD) 2.720 GFLOPs 2.016 GFLOPs 1.345 GFLOPs 1.581 GFLOPs
ROPs 32 32 48 48
Pixelfüllrate 27.200 MPix/s 28.800 MPix/s 21.000 MPix/s 24.704 MPix/s
TMUs 80 56 60 64
TAUs 80 56 60 64
Texelfüllrate 68.000 MTex/s 50.400 MTex/s 42.000 MTex/s 49.408 MTex/s
Shader-Model SM 5 SM 5 SM 5 SM 5
Hybrid-CF/-SLI X X X X
effektive Windows
Stromsparfunktion
Speichermenge 1.024 MB GDDR5 1.024 MB GDDR5 1.536 MB GDDR5 1.536 MB GDDR5
Speichertakt 2.400 MHz 2.100 MHz 1.848 MHz 2.004 MHz
Speicherinterface 256 Bit 256 Bit 384 Bit 384 Bit
Speicherbandbreite 153.600 MB/s 134.400 MB/s 177.408 MB/s 192.384 MB/s

Die GeForce GTX 580 basiert auf der GF110-GPU, die im 40-nm-Verfahren von TSMC hergestellt wird und sich wie der GF100 aus drei Milliarden Transistoren zusammen setzt. Eine genauere Angabe möchte Nvidia nicht machen.

Der GF110 baut auf die Architektur des GF100 auf, womit unser genereller Technikartikel zur Fermi-Architektur zu einem Großteil weiterhin Gültigkeit hat. Komplett identisch ist die GPU dann aber doch nicht. Denn so unterstützt der GF110 wie der GF104 (GeForce GTX 460) vollwertiges FP16 Filtering in einem Takt, wozu der GF100 noch zwei Takte benötigt hat. Dies soll in einigen texturlastigen Situation etwas Performance bringen – wahrscheinlich ist dies aber nur selten der Fall. Darüber hinaus wurde die Z-Cull-Effizienz durch neue Formate verbessert, sodass der GF110 nicht sichtbare Pixel besser verwerfen und so mehr Rechenaufwand sparen kann. Dadurch soll die Leistung pro Takt auf dem GF110 um bis zu 15 Prozent (3DMark Vantage) höher als auf dem GF100 sein.

Einen wirklichen Performancesprung erlebt der GF110 primär aber durch eine höhere Anzahl an Ausführungseinheiten. Denn während der GF100 nie im Vollausbau eingesetzt worden ist, holt der GF110 das nun nach. Damit stehen dem Käufer 512 skalare Shadereinheiten (GTX 480: 480), 64 vollwertige Textureinheiten (GTX 480: 60) sowie 16 Polymorph-Engines (GTX 480: 15) zur Verfügung.

An den Cache-Strukturen beziehungsweise den Double-Precision-Features (halbierte Leistung gegenüber Single-Precision) hat sich beim GF110 nichts geändert, obwohl zahlreiche Gerüchte davon ausgegangen sind. Genauso wenig stimmen die dort oft kolportierten 128 Textureinheiten.

Darüber hinaus hat Nvidia auf der Transistor-Ebene einige Modifizierungen am GF110 durchgeführt. So hat der Hersteller sämtliche Transistoren auf dem GF100 untersucht und, wo immer möglich, schnell schaltende Transistoren durch langsamere Exemplare ersetzt. Schnell schaltende Transistoren weisen höhere Leckströme auf, weshalb sich durch diese Maßnahme die Leistungsaufnahme senken lässt.

Unangetastet hat Nvidia dagegen das Speicherinterface (sechs 64-Bit-Controller für ein 384-Bit-Interface) sowie die ROPs (pro Speicherinterface ein ROP-Cluster bestehend aus acht ROPs; 48 ROPs insgesamt) gelassen.

Die TMU-Domäne der GeForce GTX 580 wird mit 772 MHz angesteuert, während die Shadereinheiten mit 1.544 MHz arbeiten. Der 1.536 MB große GDDR5-Speicher läuft mit 2.004 MHz. Die übliche Leistungsaufnahme des 3D-Beschleunigers in „gewöhnlichen Applikationen“ wie zum Beispiel Spielen liegt mit 244 Watt leicht unter der einer GeForce GTX 480, die mit 250 Watt angegeben ist. Damit sind weiterhin ein Acht-Pin- und ein Sechs-Pin-Stromstecker notwendig.

GF110-Chip
GF110-Chip