2/30 ATi Radeon HD 2900 XT CrossFire im Test : Angriff auf nVidias SLI-Gespann

, 147 Kommentare

Technische Daten

Radeon
X1950 XTX
Jetway Radeon
HD 2900 XT
GeForce
7950 GX2
GeForce
8800 GTX
GeForce
8800 GTS
(320MB)
Logo Radeon X1950 XTX ATi Radeon Graphics klein GeForce 7950 GX2 GeForce 8800 GTX GeForce 8800 GTS
Chip R580+ R600 G71 G80 G80
Transistoren ca. 384 Mio. ca. 700 Mio. ca. 2x 278 Mio. ca. 681 Mio. ca. 681 Mio.
Fertigung 90 nm 80 nm 90 nm 90 nm 90 nm
Chiptakt 650 MHz 742MHz 500 MHz 575 MHz 500 MHz
Shadertakt 650 MHz 742MHz 500 MHz 1350 MHz 1200 MHz
Pixel-Pipelines 16 X 2x 24 X X
Shader-Einheiten
(MADD)
48 (4D) 64 (5D) 48 (4D) 128 (1D) 96 (1D)
FLOPs (MADD/ADD) 374 GFLOPs 475 GFLOPs 2x 192 GFLOPs 518 GFLOPs* 346 GFLOPs*
ROPs 16 16 2x 16 24 20
Pixelfüllrate 10400 MPix/s 11872 MPix/s 2x 8000 MPix/s 13800 MPix/s 10000 MPix/s
TMUs 16 16 2x 24 64 48
TAUs 16 32 2x 24 32 24
Texelfüllrate 10400 MTex/s 11872 MTex/s 2x 12000 MTex/s 36800 MTex/s 24000 MTex/s
Vertex-Shader 8 X 2x 8 X X
Unified-Shader
in Hardware
X X
Pixelshader PS 3.0 SM 4 PS 3.0 SM 4 SM 4
Vertexshader VS 3.0 SM 4 VS 3.0 SM 4 SM 4
Geometryshader X X
Speichermenge 512 GDDR4 512 GDDR3 2x 512 GDDR3 768 GDDR3 640 GDDR3
(320 GDDR3)
Speichertakt 1000 MHz 828 MHz 600 MHz 900 MHz 800 MHz
Speicherinterface 256 Bit 512 Bit 256 Bit 384 Bit 320 Bit
Speicherbandbreite 64000 MB/s 105984 MB/s 2x 38400 MB/s 86400 MB/s 64000 MB/s

ATi verbaut auf der im 80-nm-Prozess bei TSMC gefertigten R600-GPU (ca. 700 Millionen Transistoren) 64 5D-Shadereinheiten, die die Kanadier auch gerne als 320 Streamprocessing-Units bezeichnen. Jede ALU kann pro Takt eine MADD-Operation (Multiply-ADD) ausführen, weswegen auf einer Radeon HD 2900 XT insgesamt 320 MADDs pro Takt berechnet werden können. Das für ATi-Karten bis dato typische ADD (Addition) entfällt auf dem R600. Im Gegensatz zum R5x0 deutlich verbessert hat ATi die Flexibilität der Vektoreinheiten, die beinahe schon als Skalareinheiten durchgehen, da sich die 5D-ALUs in 1D+1D+1D+1D+1D aufteilen können. Um auf demselben Level wie „richtige“ Skalareinheiten zu agieren, müsste man die Auslastung der ALUs allerdings weiter verbessern, die das Niveau der Shadereinheiten auf dem G80 nur selten erreichen. Vier der fünf ALUs in einer Shadereinheit sind rein für arithmetische Berechnungen zuständig, während die fünfte zusätzlich die Aufgaben einer Special Function Unit (SFU) übernimmt.

Auf dem R600 sind weiterhin nur 16 Textureinheiten vorhanden, die gegenüber dem Vorgänger aufgebohrt worden sind. So gibt es pro TMU nun zwei Texture Addressing Units (TAU). Außerdem können die Textureinheiten FP16-Texturen in einem Takt filtern, was auf einem G80 zwei Takte benötigt. Dieser besitzt allerdings eine deutlich höhere Texelfüllrate. Auch die Raster Operation Units (ROPs) stagnieren bei 16, wurden allerdings ebenfalls angepasst. Pro Takt sind nun mehr Z-Operationen möglich und die Mechanismen zur Sichtbarkeitsprüfungen wurden verbessert. Als Besonderheit muss man auf dem R600 die Tessellation-Einheit zählen, die eigentlich erst für den Direct3D-11-Standard vorgesehen ist. Durch diese kann man Polygone ohne einen allzu großen Rechenaufwand aufteilen und vervielfältigen. Ob die Tessellation-Einheit zu Lebzeiten des R600 in Spielen eingesetzt wird, ist aber unklar. Alle wichtigen Chipteile takten mit einer Frequenz von 742 MHz.

Einen großen Sprung hat der R600 bei der Speicherbandbreite gemacht. Das Speicherinterface wurde auf eine Breite von 512 Bit verdoppelt, weswegen bei gleicher Taktrate eine doppelt so hohe Speicherbandbreite vorhanden ist. Dazu hat man den (transistorschonenden) Ringbus erweitert, wobei nun aber nicht mehr acht 32-Bit-Kanäle, sondern acht 64 Bit breite Kanäle verwendet werden, was die Effizienz (minimal) negativ beeinflusst. Auf der Radeon HD 2900 XT sind 16 Speicherbausteine mit einer Größe von 32 MB pro Stück verbaut, womit man eine Gesamtkapazität von 512 MB erreicht. ATi kann durch die Nutzung von 64-MB-Modulen also ohne größere Probleme den VRAM auf 1024 MB erweitern. Die Speicherbausteine arbeiten mit einer Frequenz von 828 MHz. Wer mehr über die R600-Architektur erfahren möchte, dem empfehlen wir den Launch-Artikel zur ATi Radeon HD 2900 XT.

*Die von uns angegebenen GFLOP-Zahlen der G80-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.

Auf der nächsten Seite: Bildqualität