2/27 GTX 295 im Test : Nvidias neue Multi-GPU-Karte ist kein eindeutiger Gewinner

, 447 Kommentare

Technische Daten

Bevor wir uns mit der GeForce GTX 295 und ihrer Architektur im Detail beschäftigen, möchten wir mit den obligatorischen Spezifikationen des überarbeiteten Chips starten.

Radeon
HD 4870 X2
GeForce
GTX 260 216
GeForce
GTX 280
GeForce
GTX 295
Logo ATi Radeon Graphics klein Nvidia GeForce Nvidia GeForce Nvidia GeForce
Chip 2x RV770 GT200 GT200 2x GT200b
Transistoren ca. 2x 965 Mio. ca. 1,4 Mrd. ca. 1,4 Mrd. ca. 2x 1,4 Mrd.
Fertigung 55 nm 65 nm 65 nm 55 nm
Chiptakt 750 MHz 576 MHz 602 MHz 576 MHz
Shadertakt 750 MHz 1.242 MHz 1.296 MHz 1.242 MHz
Shader-Einheiten
(MADD)
2x 160 (5D) 216 (1D) 240 (1D) 2x 240 (1D)
FLOPs (MADD/ADD) 2x 1.200 GFLOP/s 805 GFLOP/s 933 GFLOPs 2x 894 GLOPs
ROPs 2x 16 28 32 2x 28
Pixelfüllrate 2x 12000 MPix/s 16128 MPix/s 19264 MPix/s 2x 16128 MPix/s
TMUs 2x 40 72 80 2x 80
TAUs 2x 40 72 80 2x 80
Texelfüllrate 2x 30000 MTex/s 41472 MTex/s 48160 MTex/s 2x 46080 MTex/s
Shader-Model SM 4.1 SM 4 SM 4 SM 4
Hybrid-CF/-SLI X
effektive Windows
Stromsparfunktion
Speichermenge 2x 1.024 MB GDDR5 896 MB GDDR3 1.024 MB GDDR3 2x 896 MB GDDR3
Speichertakt 1.800 MHz 999 MHz 1.107 MHz 999 MHz
Speicherinterface 2x 256 Bit 448 Bit 512 Bit 2x 448 Bit
Speicherbandbreite 2x 115200 MB/s 111888 MB/s 141696 MB/s 2x 111888 MB/s

Technische Details

Die Nvidia GeForce GTX 295 setzt auf eine leicht überarbeitete GT200-GPU, die auf den Namen GT200b hört und anstatt im 65-nm- im modernen 55-nm-Verfahren produziert wird. Dadurch wird die GPU kleiner (benötigt weniger Platz auf dem Wafer und ist deswegen günstiger zu produzieren) und die Leistungsaufnahme sinkt, weshalb es überhaupt erst möglich ist, eine Dual-GPU-Karte mit einer Leistungsaufnahme unter 300 Watt zu produzieren.

Der GT200b besteht weiterhin aus 1,4 Mrd. Transistoren und ist im Aufbau absolut identisch mit dem des GT200. An sämtlichen Ausführungseinheiten hat Nvidia keinerlei Veränderungen vorgenommen und auch deren Anzahl ist gleich geblieben. Nichtsdestotrotz entsprechen die beiden GT200b-GPUs auf der GeForce GTX 295 nicht der maximal machbaren Ausbaustufe des Chips, da man das Speicherinterface beschnitten hat.

GeForce GTX 295 Einzelteile
GeForce GTX 295 Einzelteile

Wie bereits erwähnt, ist die GeForce GTX 295 wie die GeForce 9800 GX2 sowie die GeForce 7950 GX2 eine Multi-GPU-Karte, die mit zwei Rechenkernen daher kommt, die jeweils auf einem eigenen PCB ihren Platz finden. Der Konkurrent ATi geht einen leicht anderen Weg und verbaut die GPUs auf einem einzelnen PCB. Damit die GPUs untereinander kommunizieren können, benutzt Nvidia einen nForce-200-Chip, der die ankommenden 16 PCIe-2.0-x16-Lanes auf die beiden Kerne mit der maximalen Bandbreite verteilt. Darüber hinaus sind die PCBs mit einer zur SLI-Bridge vergleichbaren Verbindung ausgestattet.

Die GeForce GTX 295 benutzt die SLI-Technologie, damit die beiden Grafikchips Daten untereinander austauschen können. Dabei kommt mittlerweile beinahe ausschließlich AFR (Alternate Frame Rendering) zum Einsatz, sprich jede GPU rendert ein eigenes Frame. Dies stellt die derzeit optimale Methode zur Performanceverbesserung dar, da AFR auch die Geometrie beschleunigen kann. Quad-SLI nutzt ebenfalls AFR, was sich dann allerdings 4-Way-AFR nennt, da jede GPU an einem eigenen Bild arbeitet.

Neben den Vorteilen von AFR übernimmt man aber logischerweise auch dessen Schwachstellen. So muss jede GPU in ihrem eigenen VRAM auf dieselben Daten zurückgreifen können, weswegen beide Chips die jeweils 896 MB Speicher mit einheitlichen Bits füllen. Darum können effektiv nur 896 MB genutzt werden. Zudem kann man nicht alle Ausführungseinheiten in den Chips doppelt zählen, da einige Berechnungen ebenfalls doppelt anfallen und natürlich die entstehenden Latenzen eine Rolle spielen. Nicht zu vergessen ist das Problem der „Mikroruckler“, das in niedrigen FPS-Bereichen den Spielspaß massiv mindern kann.

Auf jeder GT200b-GPU sind auf der GeForce GTX 295 240 skalare Shadereinheiten aktiv, die pro Takt ein MADD (Multiply-ADD) sowie ein MUL (Multiplikation) berechnen können. Auch sind 80 vollwertige Textureinheiten vorhanden. Damit kommt dieser Teil des Rechenkerns wie auf der GeForce GTX 280 mit der maximalen Leistung daher. Die TMU-Domäne taktet auf der GeForce GTX 295 mit 576 MHz, die Shadereinheiten mit 1.242 MHz.

Beschnitten hat man die GeForce GTX 295 am Speicherinterface, das anstatt 512 Bit „nur“ jeweils 448 Bit breit ist. Dies erreicht man, indem man nicht alle acht 64-Bit-Controller aktiviert, sondern nur noch deren sieben. Somit sind 14 und nicht 16 Speicherbausteine pro Platine vorhanden, was den VRAM auf je 896 MB verringert. Der GDDR3-Speicher wird mit 999 MHz angesteuert. Dadurch entsprechen die Taktraten sowie das komplette Speicherinterface der GeForce GTX 260. Die Anzahl der Shadereinheiten sowie TMUs hat man aber auf dem Niveau der GeForce GTX 280 belassen, weswegen die GeForce GTX 295 eine (doppelte) Kombination aus beiden 3D-Beschleunigern ist, mit einer Tendenz zur GeForce GTX 260 216 hin.

Auf der nächsten Seite: Impressionen