ATi Radeon X800 Pro und X800 XT in der Vorschau: Goodbye, Ruby Tuesday

2/5

4.5.2004 15:00 Uhr Carsten Spille

Chip und Karte

Da ist es nun offiziell und zu allererst müssen wir eine Fehleinschätzung unsererseits eingestehen. Hatten wir noch vor knapp zehn Tagen das in Taiwan aufgetauchte Bild der Radeon X800 als unecht gewertet, werden wir heute eines besseren belehrt.

ATi hat es, wie wir schon als Möglichkeit einräumten, tatsächlich geschafft, sowohl die Radeon X800 Pro als auch die X800 XT durch die Umstellung des Herstellungsprozesses auf einen 0,13µ-lowK Prozess der Chipschmiede TSMC und durch die Verwendung von GDDR3-RAM, welches mit deutlich weniger Leistung auskommt, als DDR- oder gar DDR-II RAM, die Leistungsaufnahme des kompletten Boards nicht allzu stark ansteigen zu lassen. Die X800 Pro soll sogar weniger Strom verbrauchen, als die Radeon 9800 XT.

Hier haben wir die beiden Chips und Taktraten nochmal im direkten Vergleich. Der Übersicht halber auch nochmal direkt in unserer bekannten Tabelle und mit den entsprechenden Werten der GeForce.

	Radeon 9800 XT	Radeon X800 Pro	Radeon X800 XT	GeForce FX 5950 Ultra	GeForce 6800 Ultra
Chip	R360	R420	R420	NV38	NV40
Transistoren	ca. 110M	160M	160M	ca. 135M	ca. 222M
Fertigung	0,15µ	0,13 µm lowK copper	0,13 µm lowK copper	0,13 µm	0,13µ
Taktung (MHz)	412	475	520	475	400
Renderpipes	8	12	16	4(8)*	16(32)*
Pixelfüllrate	3296MPix/s	5700MPix/s	8320MPix/s	1900	6400MPix/s
TMUs je Pipe	1	1	1	2	1
Texelfüllrate	3296MTex/s	5700MTex/s	8320MTex/s	3800MTex/s	6400MTex/s
Vertexeinheit	DX9 VS2.0	DX9 VS 2.0	DX9 VS 2.0	DX9 VS2.0+	DX9 VS3.0
Vertexpipes	4	6	6	3 (Array)	6
Dreiecksdurchsatz	ca. 412MV/s	ca. 712MV/s	ca. 780MV/s	ca. 356MV/s	ca. 600MV/s
Texturen pro Pass	8 (16)	8 (16)	8 (16)	8 (16)	8 (16)
Pixelshader	PS2.0	PS 2.0+	PS 2.0+	PS2.0+	PS 3.0
FP-Einheiten	3+1 ALU 3+1 Mini ALU 1TexOp	3+1 ALU 3+1 Mini ALU 1TexOp	3+1 ALU 3+1 Mini ALU 1TexOp	2 (Shadercore + FPU)	2 (Shader-Unit 1 & 2)**
Speicher (MB)	256 DDR	256 GDDR3	256 GDDR3	256 DDR	256+ GDDR3
Anbindung	256-bit DDR	256-bit GDDR3	256Bit GDDR3	256-bit DDR	256-bit GDDR3
Speichertakt (MHz)	365	450	560	475	550
Bandbreite (MB/s)	23360	28800	35840	30400	35200
SinglePass Texturop.	16 D3D / 8 (oGL)	16 (D3D) / 8 (oGL)	16 (D3D) / 8 (oGL)	16 (D3D) / 4 (oGL)	16 (D3D) / 4 (oGL)
RAMDAC	2x400MHz	2x400MHz	2x400MHz	2x400MHz	2x400MHz
TV-Encoder	integriert	integriert	integriert	integriert	integriert
Sonstiges	DVD MC/iDCT	DVD MC/iDCT, MPEG2 En- / Decoder, MPEG4 En- / Decoder	DVD MC/iDCT, MPEG2 En- / Decoder, MPEG4 En- / Decoder	DVD MC/iDCT	DVD MC/iDCT, MPEG2 En- / Decoder, MPEG4 En- / Decoder
Präz. pro Kanal	24Bit (FP24)	24Bit (FP24)	24Bit (FP24	32Bit (FP32)	32Bit (FP32)
* nVidias High-End GPU unterstützen seit dem NV30 ein Verfahren, bei dem in den ROPs am Ende der Pipeline jeweils zwei, anstatt der üblichen einen Z-/Stencilwerte verarbeitet werden können. Solange Pixel also ohne Farbwert auskommen und auch nicht texturiert sind (Stencilschatten und reine Z-Writes) bekommt man zwei Pixel pro Takt durch eine physikalische Pixelpipeline.
** Wenn die vorliegenden Informationen korrekt sind, besitzt der NV40 zwei FP-Einheiten in jeder seiner 16 Pipelines. Allerdings scheint es ebenso vielfältige Möglichkeiten wie Einschränkungen zu geben, um diese gemeinsam zu nutzen. Nur die wenigsten der komplexeren Shader-Instruktionen können auf beiden wirklich parallel und ohne irgendwelche Abhängigkeiten laufen. Für detailliertere Informationen zur CineFX-Architektur der GeForceFX bietet 3DCenter.de einen passenden Artikel an.

Kommen wir nun zum Chip an sich und dessen Interna. Auch beim R420, das sei vorab schonmal gesagt, verläßt sich ATi zum größten Teil noch auf die mittlerweile fast zwei Jahre alte Architektur der Radeon 9700 Pro. Natürlich wurde alles schneller, weiter und höher (bis auf den Kühler).