ATi Radeon HD 3850 im Test: Ein weiterer Preis-Leistungs-Knüller?

2/29

27.11.2007 19:28 Uhr

Technische Daten

	Radeon HD 3870	Radeon HD 3850	Radeon HD 2600 XT	GeForce 8800 GTS (320MB)	GeForce 8600 GTS
Logo
Chip	RV670	RV670	RV630	G80	G84
Transistoren	ca. 666 Mio.	ca. 666 Mio	ca. 390 Mio.	ca. 681 Mio.	ca. 289 Mio.
Fertigung	55 nm	55 nm	65 nm	90 nm	80 nm
Chiptakt	775 MHz	670 MHz	800 MHz	500 MHz	675 MHz
Shadertakt	775 MHz	670 MHz	800 MHz	1200 MHz	1450 MHz
Pixel-Pipelines	X	X	X	X	X
Shader-Einheiten (MADD)	64 (5D)	64 (5D)	24 (5D)	96 (1D)	32 (1D)
FLOPs (MADD/ADD)	496 GFLOPS	429 GFLOPS	192 GFLOPS	346 GFLOPS*	139 GFLOP/s*
ROPs	16	16	4	20	8
Pixelfüllrate	12400 MPix/s	10720 MPix/s	3200 MPix/s	10000 MPix/s	5400 MPix/s
TMUs	16	16	8	48	16
TAUs	32	32	16	24	16
Texelfüllrate	12400 MTex/s	10720 MPix/s	6400 MTex/s	24000 MTex/s	10800 MTex/s
Vertex-Shader	X	X	X	X	X
Unified-Shader in Hardware	✓	✓	✓	✓	✓
Shader-Model	SM 4.1	SM 4.1	SM 4	SM 4	SM 4
Geometryshader	✓	✓	✓	✓	✓
Speichermenge	512 GDDR4	256 GDDR3	256 GDDR3 (256 GDDR4)	640 GDDR3 (320 GDDR3)	256 GDDR3
Speichertakt	1125 MHz	830 MHz	700 MHz (1100 MHz)	800 MHz	1000 MHz
Speicherinterface	256 Bit	256 Bit	128 Bit	320 Bit	128 Bit
Speicherbandbreite	72000 MB/s	53120 MB/s	22400 MB/s (35200 MB/s)	64000 MB/s	32000 MB/s

Die ATi Radeon HD 3850 basiert auf einer voll aktivierten RV670-GPU, die im modernen 55-nm-Prozess bei TSMC hergestellt wird, 666 Millionen Transistoren umfasst und über 64 5D-Vektorshadereinheiten verfügt. Zwar können sich die 5D-Einheiten theoretisch im Verhältnis 1:1:1:1:1 aufsplitten (wobei sie sich dann wie Skalarshader verhalten), jedoch müssen die Operationen dafür vollkommen unabhängig voneinander sein. Sind sie hingegen voneinander abhängig, warten einige ALUs auf die Ergebnisse der anderen und stehen still. Der Thread-Scheduler versucht dies zu verhindern und die ALUs mit anderweitigen Aufgaben zu belegen, doch ist dazu eine Menge Treiberoptimierung von Nöten. Jede ALU kann auf dem RV670 eine MADD-Operation (Multiply-ADD) pro Takt durchführen. Darüber hinaus setzt die ATi Radeon HD 3850 auf 16 Textureinheiten, die pro Takt 16 Pixel texturieren und 32 Pixel adressieren kann. Dieses gegensätzliche Verhältnis zum G80-Chip von Nvidia soll vor allem in Direct3D-10-Anwendungen von Vorteil sein.

Die Anzahl der ROPs liegt ebenfalls bei 16. Pro Takt können 32 Z-Operationen (Sichtbarkeitsprüfungen von Pixel, die je nach Ergebnis gar nicht erst gerendert werden) ausgeführt werden. Das Multi-Sampling-Shader-Resolve wird auf dem RV670 wie auf dem Vorgänger R600, der auf der Radeon HD 2900 XT verwendet wird, selbst für einfache Anti-Aliasing-Modi mit dem Box-Filter in den Shadereinheiten durchgeführt. Normalerweise ist dies Aufgabe der ROPs, was auf dem RV670 aber nicht funktioniert. Ob dies nun Absicht von ATi, oder ein Fehler im Chipdesign ist, wird wohl auf Ewig ein Geheimnis bleiben. Die GPU taktet auf der Radeon HD 3850 mit 670 MHz. Das Speicherinterface ist auf der Grafikkarte 256 Bit breit und mit 830 MHz an die GPU angebunden. Auf dem Referenzdesign von ATi werden 256 MB verbaut, die sich aus acht 32 Megabyte große Speicherchips zusammensetzen. Auf Wunsch kann der Hersteller den Speicher auf 512 MB verdoppelt, indem 64-Megabyte-Module eingesetzt werden. Der Speichercontroller auf dem RV670 setzt sich aus vier 64-Bit-Kanälen zusammen.

Die Radeon HD 3850 unterstützt den Direct3D-10.1-Standard, der mit dem Service Pack 1 in Windows Vista Einzug halten wird. Die „PowerPlay“ genannte und aus den Notebook-Chips bekannte Technologie sorgt für einen niedrigen Stromverbrauch, indem Taktraten und Spannungen im Idle-Modus unter Last gesenkt und nicht benötigte Chipteile deaktiviert werden. Der Unified Video Decoder (UVD) ist auch auf der HD 3850 an Bord und kümmert sich um die Beschleunigung von HD-Videos. Die Grafikkarte ist PCIe-2.0-kompatibel.

*Die von uns angegebenen GFLOP-Zahlen der G80-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.