4/12 Vorschau auf die nVidia GeForce 6800 Ultra : Auf NV30 folgt NV40

, 188 Kommentare

Technische Daten

Der NV40 soll mit einem Rundumschlag nicht nur eine Steigerung gegenüber dem eigenen Vorgänger darstellen, sondern muss auch gegen den Next-Gen Chip von ATi bestehen, dem rund die doppelte Leistung der Radeon 9800 Pro nachgesagt wird.

GeForce4
Ti4800
GeForce FX
5800 Ultra
GeForce FX
5950 Ultra
GeForce
6800 Ultra
Chip NV28 NV30 NV38 NV40
Transistoren ca. 63M ca. 130M ca. 135M ca. 222M
Fertigung 0,15 µm 0,13 µm 0,13 µm 0,13 µm
Taktung (MHz) 300 500 475 400
Renderpipes 4 4 (8)* 4 (8)* 16(32)
Pixelfüllrate 1200MPix/s 2000MPix/s 1900MPix/s 6400MPix/s
TMUs je Pipe 2 2 2 1
Texelfüllrate 2400MTex/s 4000MTex/s 3800MTex/s 6400MTex/s
Vertexeinheit DX8 VS1.1 DX9 VS 2.0+ DX9 VS 2.0+ DX9 VS3.0
Vertexpipes 2 3 (Array) 3 (Array) 6
Dreiecksdurchsatz ca. 136MV/s ca. 375MV/s ca. 356MV/s ca. 600MV/s
Texturen pro Pass 4 8 (16) 8 (16) 8 (16)
Pixelshader PS1.3 PS 2.0+ PS 2.0+ PS 3.0
FP-Einheiten - 1 (Shadercore) 2 (Shadercore + FPU) 2 (Shader-Unit 1 & 2)**
Speicher (MB) 128 DDR 128 DDR-II 256 DDR 256+ GDDR3
Anbindung 128-bit DDR 128-bit DDR 256-bit DDR 256-bit DDR
Speichertakt (MHz) 325 500 475 550
Bandbreite (MB/s) 10400 16000 30400 35200
SinglePass Texturop. 4 16 (D3D) / 4 (oGL) 16 (D3D) / 4 (oGL) 16 (D3D) / ? (oGL)
FSAA/AF-Technik AccuView IntelliSample IntelliSample HCT IntelliSample 3.0 °
RAMDAC 2x400MHz 2x400MHz 2x400MHz 2x400MHz
TV-Encoder extern integriert integriert integriert
Sonstiges DVD MC DVD MC/iDCT DVD MC/iDCT DVD MC/iDCT,
MPEG2 En- / Decoder,
MPEG4 En- / Decoder
Präz. pro Kanal 9Bit (FX9) 32Bit (FP32) 32Bit (FP32) 32Bit (FP32)
* nVidias High-End GPU unterstützen seit dem NV30 ein Verfahren, bei dem in den ROPs am Ende der Pipeline jeweils zwei, anstatt der üblichen einen Z-/Stencilwerte verarbeitet werden können. Solange Pixel also ohne Farbwert auskommen und auch nicht texturiert sind (Stencilschatten und reine Z-Writes) bekommt man zwei Pixel pro Takt durch eine physikalische Pixelpipeline.
° Hierbei handelt es sich um Marketingbezeichnungen für Multisampling-FSAA. Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, 4xAA ist wird bis einschließlich NV38 mit geordnetem und daher ineffizientem Raster durchgeführt, der NV40 verwendet auch bei 4xMSAA ein gedrehtes Raster. Das AF von nVidia ist nur sehr gering winkelabhängig und auch im NV40 wird es einen Schalter für maximale AF-Qualität bis 16xAF geben. HCT steht für verlustarme Komprimierung des gesamten Contents.
** Wenn die vorliegenden Informationen korrekt sind, besitzt der NV40 zwei FP-Einheiten in jeder seiner 16 Pipelines. Allerdings scheint es ebenso vielfältige Möglichkeiten wie Einschränkungen zu geben, um diese gemeinsam zu nutzen. Nur die wenigsten der komplexeren Shader-Instruktionen können auf beiden wirklich parallel und ohne irgendwelche Abhängigkeiten laufen. Für detailliertere Informationen zur CineFX-Architektur der GeForceFX bietet 3DCenter.de einen passenden Artikel an.

nVidia hat mit dem Design des NV40 anscheinend nicht gekleckert, sondern geklotzt. Vielleicht, weil man sich nach dem Rückstand im letzten Jahr in Zugzwang sah, vielleicht aber auch, weil man von ATis Next-Gen Chip, dem nach derzeitigen Informationen für Ende April angesetzten R420, viel erwartete. Es sei an dieser Stelle noch einmal ausdrücklich erwähnt, dass die Taktraten des normalen GeForce 6800 aktuell noch nicht feststehen. Ganz offensichtlich möchte der Grafikriese aus dem sonnigen Kalifornien hier der Konkurrenz aus Kanada den Vortritt lassen, so dass man gegebenfalls auf überraschende Ergebnisse des R420 und dessen Varianten reagieren kann.

Zusammengefasst lässt sich die 3D-Pipeline des NV40 in einer recht simplen Grafik zusammenfassen. Von den sechs Blöcken der ersten Reihe verköpert jeder einzelne eine Vertex Shader Pipeline. In der Mitte finden sich die insgesamt sechzehn Pixelshader und in der letzten Reihe finden wir die Raster Operators Pixel Pipeline.

NV40 - Die Pipeline in der Übersicht
NV40 - Die Pipeline in der Übersicht

Auf den nächsten Seiten wollen wir versuchen einige der durchaus eindrucksvollen Zahlen mit ein wenig Hintergrund zu füllen, wo uns dies ohne Betrachtungen am konkreten Objekt möglich ist.

Auf der nächsten Seite: Renderarchitektur, Teil 1