Nvidia-Grafikkarten im Test: Eine neue GeForce 9500 GT und alte 9800 GT

2/30

29.7.2008 15:00 Uhr

Technische Daten

	Radeon HD 3650	GeForce 8600 GTS	GeForce 9500 GT	GeForce 9600 GT
Logo
Chip	RV635	G84	G96	G94
Transistoren	ca. 378 Mio.	ca. 289 Mio.	ca. 314 Mio.	ca. 505 Mio.
Fertigung	55 nm	80 nm	55 nm (zuerst 65 nm)	65 nm
Chiptakt	725 MHz	675 MHz	550 MHz	650 MHz
Shadertakt	725 MHz	1.450 MHz	1.400 MHz	1.625 MHz
Shader-Einheiten (MADD)	24 (5D)	32 (1D)	32 (1D)	64 (1D)
FLOPs (MADD/ADD)	174 GFLOPS	139 GFLOPS*	134 GFLOP/s*	312 GFLOPS*
ROPs	4	8	8	16
Pixelfüllrate	2900 MPix/s	5400 MPix/s	4400 MPix/s	10400 MPix/s
TMUs	8	16	16	32
TAUs	16	16	16	32
Texelfüllrate	5800 MTex/s	10800 MTex/s	8800 MTex/s	20800 MTex/s
Shader-Model	SM 4.1	SM 4	SM 4	SM 4
Hybrid-CF/-SLI	X	X	X	X
effektive Windows Stromsparfunktion	✓	X	X	X
Speichermenge	512 GDDR3	256 GDDR3	512 GDDR3	512 GDDR3
Speichertakt	800 MHz	1.000 MHz	800 MHz	900 MHz
Speicherinterface	128 Bit	128 Bit	128 Bit	256 Bit
Speicherbandbreite	25600 MB/s	32000 MB/s	25600 MB/s	57600 MB/s

Obwohl es die G96-GPU auf der GeForce 9500 GT in dieser Form noch nie gegeben hat, ist der Rechenkern nicht wirklich neu. Einfach ausgedrückt ist der G96 nichts anderes als ein G92-Chip (eingesetzt unter anderem auf der GeForce 8800 GT sowie GeForce 9800 GTX), der auf die Anzahl der Einheiten in dem G84-Vorgänger reduziert worden ist. Gleichzeitig nimmt der Chip dann natürlich die modernere Fertigung sowie einige Verbesserungen in der Architektur mit.

Der G96 wird zu Beginn im mittlerweile etwas angestaubten 65-nm-Prozess bei TSMC hergestellt und trägt mit 314 Millionen Transistoren etwas mehr Schaltungen als der ältere G84. In Kürze soll die Produktion der GPU jedoch auf den 55-nm-Prozess umgestellt werden, mit dem Nvidia die Produktionskosten senken kann. Wann genau dieser Schritt durchgeführt wird, ist aber noch unbekannt.

Dem Käufer einer GeForce 9500 GT stehen 32 skalare Shadereinheiten zur Verfügung, die pro Takt ein MAD (Multiply-ADD) sowie ein MUL (Multiplikation) durchführen können. Letzteres ist aber nur selten für „General Shading“-Aufgaben zu gebrauchen, da das MUL meistens mit Special-Function-Unit-Berechnungen (wie beispielsweise einer Kosinus-Operation) beschäftigt ist. Darüber hinaus gibt es 16 vollwertige Textureinheiten, womit pro Takt 16 bilineare Pixel adressiert und auch texturiert werden können. Die Anzahl der ROPs (Raster Operation Processors) liegt bei acht.

Da die ROPs an das Speicherinterface gekoppelt sind und es pro ROP-Cluster einen 64-Bit-Memorycontroller gibt, ist das Speicherinterface auf dem G96 128 Bit breit. Die TMU-Domäne taktet auf der GeForce 9500 GT mit 550 MHz, während die Shadereinheiten mit 1.400 MHz angesteuert werden. Von der Grafikkarte wird es verschiedene Speichervarianten geben. Die von uns verwendete und schnellste nutzt einen 512 MB großen GDDR3-Speicher, der mit 800 MHz taktet. Zusätzlich gibt es ein günstigeres Modell, das auf DDR2-VRAM mit niedrigeren Frequenzen setzt.

Die generellen Vorteile der G9x-Architektur hat natürlich ebenso der G96 inne. Somit gibt es ein gegenüber der G8x-Architektur verbessertes PureVideo sowie einige Performancemodifizierungen. Hybrid-SLI und vor allem Hybrid-Power, mit dem man die Grafikkarte komplett deaktivieren könnte, um so Strom zu sparen, gibt es auf der GeForce 9500 GT leider nicht.

Über die GeForce 9800 GT gibt es hingegen nicht viel Spannendes zu berichten, da diese vom technischen Aspekt identisch mit der GeForce 8800 GT ist und nur einen anderen Namen trägt. Somit wird der G92 mit 112 Shadereinheiten, 56 Texture Mapping Units, 16 ROPs sowie einem 256-Bit-Speicherinterface genutzt. Die TMU-Domäne wird mit denselben 600 MHz betrieben, die Shadereinheiten mit 1.512 MHz. Der 512 MB große GDDR3-Speicher arbeitet mit 900 MHz. Einen Vorteil gegenüber der GeForce 8800 GT hat die GeForce 9800 GT dann aber doch. So unterstützt sie auf einem passenden Nvidia-Mainboard Hybrid-Power.

*Die von uns angegebenen GFLOP-Zahlen der G80/G92-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.