GeForce FX5900, FX5200 Ultra und Ti4800 im Test: Roundup von nV15 bis nV35

 7/26
Carsten Spille
16 Kommentare

Technische Daten

Und hier, wie üblich, ein paar technische Eckdaten zu den Chips im Testparcours. Wir haben, entgegen aller Übersichtlichkeit, einmal die Chips der alten Garde gegen diejenigen gestellt, auf die man mindestens aufrüsten sollte, um eine akzeptable Leistungssteigerung, bzw. einen anderen Mehrwehrt, sei es in Form von Dual-Monitoring, DX9 oder FSAA zu erhalten.

Deswegen bitten wir schon im Vorfeld, uns die etwas ungewöhnliche Anordnung der Tabellen nachzusehen. Wer übrigens nicht auf nVidia fixiert ist (wozu es auch keinen Grund gibt), der sollte sich eventuell auch einmal unser vier Monate altes Radeon RoundUp zu Gemüte führen. Auch dort tummeln sich interessante Grafikkarten. Bei den einzelnen Benchmarks befindet sich jeweils auch ein Link in diesen Artikel, so daß quasi ein direkter Vergleich bei Interesse möglich ist ohne die Diagramme ins absolut Uferlose auswuchern zu lassen.

GF2 MX FX 5200
Chip nV11 nV34
Taktung (MHz) 175 250
Renderpipelines 2 4 (2/1)*
Pixelfüllrate 350MPix/s 1000MPix/s
TMUs je Pipe 2 1
Texelfüllrate 700MTex/s 1000MTex/s
Vertexeinheit DX7 TnL DX9 VS 2.0+
Vertexpipes 1 1
Dreiecksdurchsatz ~20MT/s ~62MV/s
Texturen pro Pass 2 8 (16)
Pixelshader keine PS 2.0+
Speicher 32MB 128MB
Anbindung 128Bit SDR 128Bit DDR
Speichertakt (MHz) 183 200
Bandbreite 2928 MB/s 6400 MB/s
SinglePass Texturop. 2 16(D3D) / 4(oGL)**
FSAA/AF-Technik Supersampling Accuview°
RAMDAC 1x350MHz 2x350MHz
TV-Encoder extern integriert
Sonstiges TwinView nur mit 2. RAMDAC DVD MC DVD MC/iDCT
Effizienz-Maßnahmen keine Zweikanal Speichercontroller, Fast ZClear, EarlyZ
Präz. pro Kanal°° 8Bit 32Bit (FP32)
FP-Shaderops/s (Textur- + Arithmetik-Ops)°°°
Min. Instr./s entfällt 0+500M
Max. Instr./s entfällt 1000+0M
Peak Instr./s entfällt 500M
* nVidia gibt zwar ein Maximum von vier Pixeln pro Takt an, dies trifft aber nur für Z- und Stenciloperationen und Single-Texturing zu. Sobald Multitexturing genutzt wird, verhält sich der nV34 wie ein Design mit zwei Pipelines à zwei TMUs. Bei Einsatz von MultiTexturing mit mehr als vier Texturen ist beim nV34 ist gar nur eine Pipeline aktiv, die aber alle TMUs simultan nutzen kann. Die genaue Umkehrung des 4x1-Designs für Z-, Stencil- und Single-Texturing.
** Stand: Detonator 53.03
° Hierbei handelt es sich um eine Marketingbezeichnung für Multisampling-FSAA.
Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, 4xAA ist wird mit geordnetem und daher ineffizientem Raster durchgeführt. Das AF von nVidia ist nur sehr gering winkelabhängig; GF2 (MX) und GF4MX bieten hier nur 2xAF als maximalen Grad an.
°° Angegeben ist die maximale interne Genauigkeit. Es gibt bei nVidia noch FP16 (16Bit) und FX12 (erweitertes Integer-Format).
°°° Für genauere Erklärungen mag der sehr technische Artikel von 3DCenter.de über die nV3x-Architektur dienen. Kurz gesagt kann der nV34 bis zu vier Texturanweisungen verarbeiten und dabei je zwei Texturanweisungen gegen eine Arithmetik-Op eintauschen.

Der Nachfolger der GeForce2 MX als abgespeckteste Variante einer Generation ist die FX5200. Mit ihren Shader-Einheiten und sonstiger Ausstattung ermöglicht sie es Computerverkäufern Kunden mit "128MB RAM und DirectX9-fähig" zu ködern.

Schaut man einmal auf die rohen Leistungsdaten, so scheint die FX5200 wirklich ein wenig überdimensioniert für einen reinen Office-/Multimedia-PC zu sein. Ob man eher ihren Features oder ihrer Positionierung trauen sollte - wir werden sehen!

GF2 U GF4 MX440 GF3 Ti200 FX 5200 U FX 5600 FX 5600 U
Chip nV15 nV17 nV20 nV34 nV31 nV36
Taktung (MHz) 250 270 175 325 325 350
Renderpipes 4 2 4 4 (2/1)* 4 (2)*
Pixelfüllrate 1000MPix/s 540MPix/s 700MPix/s 1300MPix/s 1300MPix/s 1400 MPix/s
TMUs je Pipe 2 2 2 1
Texelfüllrate 2000MTex/s 1080MTex/s 1400MTex/s 1300MTex/s 1400 MTex/s
Vertexeinheit DX7 TnL DX8 VS1.1 DX9 VS 2.0+
Vertexpipes 1
Dreiecksdurchsatz ~31MT/s ~34MT/s ~44MV/s ~81MV/s ~87MV/s
Texturen pro Pass 2 4 8 (16)
Pixelshader keine PS1.1 PS 2.0+
Speicher 64MB 128MB
Anbindung 128Bit SDR 128Bit DDR
Speichertakt (MHz) 230 200 325 275 350
Bandbreite 7360MB/s 6400MB/s 10400MB/s 8800MB/s 11200MB/s
SinglePass Texturop. 2 4 16(D3D) / 4(oGL)**
FSAA/AF-Technik Super-Sampling HRAA° AccuView° IntelliSample°
RAMDAC 1x350MHz 2x350MHz 1x350MHz 2x350MHz 2x400MHz
TV-Encoder extern integriert extern integriert
Sonstiges DVD MC DVD MC/iDCT DVD MC DVD MC/iDCT
Effizienz-Maßnahmen keine Zweikanal-LMA, Fast Z-Clear, EarlyZ Vierkanal-LMA, Fast ZClear, EarlyZ, Z-Compression Zweikanal-LMA II(I), Fast Z-Clear, EarlyZ Zweikanal-LMA III, Fast Z-Clear, EarlyZ, Z-Compression, Color-Compression
Präz. pro Kanal°° 8Bit 8Bit 9Bit (FX9) 32Bit (FP32)
FP-Shaderops/s (Textur- + Arithmetik-Ops)°°°
Min. Instr./s entfällt 0+650M 0+700M
Max. Instr./s entfällt 1300M+0 1400M+0
Peak Instr./s entfällt 1300M 1400M
* nVidia gibt zwar ein Maximum von vier Pixeln pro Takt an, dies trifft aber nur für Z- und Stenciloperationen und Single-Texturing zu. Sobald Multitexturing genutzt wird, verhalten sich der nV31/nV34 wie ein Design mit zwei Pipelines à zwei TMUs. Bei Einsatz von MultiTexturing mit mehr als vier Texturen ist beim nV34 ist gar nur eine Pipeline aktiv, die aber alle TMUs simultan nutzen kann. Die genaue Umkehrung des 4x1-Designs für Z-, Stencil- und Single-Texturing.
** Stand: Detonator 53.03
° Hierbei handelt es sich um Marketingbezeichnungen für Multisampling-FSAA. Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, 4xAA ist wird mit geordnetem und daher ineffizientem Raster durchgeführt. Das AF von nVidia ist nur sehr gering winkelabhängig; GF2 (MX) und GF4MX bieten hier nur 2xAF als maximalen Grad an.
°° Angegeben ist die maximale interne Genauigkeit. Es gibt bei nVidia noch FP16 (16Bit) und FX12 (erweitertes Integer-Format).
°°° Für genauere Erklärungen mag der sehr technische Artikel von 3DCenter.de über die nV3x-Architektur dienen. Kurz gesagt können der nV31/nV34 bis zu vier Texturanweisungen verarbeiten und dabei je zwei Texturanweisungen gegen eine Arithmetik-Op eintauschen.

Wer allerhöchstens eine Grafikkarte aus den ersten drei Spalten sein Eigen nennt, für den könnte sich die rechte Hälfte der Tabelle eventuell schon als Upgrade-Option anbieten - sei es, weil er keine allzugroßen Ansprüche stellt (Die GeForce2 Ultra Käufer einmal ausgenommen, aber deren Leistung liegt mittlerweile nunmal im Bereich der GF4 MX440 und bestenfalls in dem der GF3 Ti200) oder sei es, weil schlicht das Budget zu limitiert ist.

Zu beachten ist hier auch noch für unsere Benchmarks mit aktivierten Bildqualitätsoptionen, dass GeForce2 Ultra und GeForce4 MX440 zu höchstens zweifach anisotroper Filterung in der Lage sind.

Ob neben DirectX 9-Features auch die Leistung dieses mögliche Upgrade rechtfertigt? Wir sprechen uns im Fazit wieder!

GF4 Ti4200 GF FX 5800 GF FX 5900 XT
Chip nV25 nV30 nV35
Taktung (MHz) 250 400 390²
Renderpipes 4 4 (8)*
Pixelfüllrate 1000MPix/s 1600MPix/s 1560MPix/s
TMUs je Pipe 2
Texelfüllrate 2000MTex/s 3200MTex/s 3120MTex/s
Vertexeinheit DX8 VS1.1 DX9 VS 2.0+
Vertexpipes 2 3 (Array)
Dreiecksdurchsatz ~113MV/s ~300MV/s ~292MV/s
Texturen pro Pass 4 8 (16)
Pixelshader PS1.3 PS 2.0+
Speicher 64MB 128MB
Anbindung 128Bit DDR 256Bit DDR
Speichertakt (MHz) 253 400 350
Bandbreite 8096MB/s 12800MB/s 22400MB/s
SinglePass Texturop. 4 16(D3D) / 4(oGL)**
FSAA/AF-Technik AccuView° IntelliSample° IntelliSample HCT°
RAMDAC 2x400MHz
TV-Encoder extern integriert
Sonstiges DVD MC DVD MC/iDCT
Effizienz-Maßnahmen Vierkanal-LMA II, Fast ZClear, EarlyZ, Z-Compression Vierkanal-LMA III, Fast Z-Clear, EarlyZ, Z-Compression, Color-Compression
Präz. pro Kanal°° 9Bit (FX9) 32Bit (FP32)
FP-Shaderops/s (Textur- + Arithmetik-Ops)°°°
Min. Instr./s entfällt 0+1600M 0+3120M
Max. Instr./s entfällt 3200M+0 3120M+3120M
Peak Instr./s entfällt 3200M 6240M
²Unser Testsample war mit 400MHz getaktet, wie auch schon die Karte von Albatron und wurde dementsprechend auch so getestet. Überhaupt scheint nicht 100%ige Einigkeit zu herrschen, welches nun der Standard-Takt der 5900Xt ist.
* nVidia gibt zwar ein Maximum von acht Pixeln pro Takt an, dies trifft aber nur für Z- und Stenciloperationen zu. Sobald Multitexturing genutzt wird, verhält sich der nV3o wie ein Design mit vier Pipelines à zwei TMUs.
** Stand: Detonator 53.03
° Hierbei handelt es sich um Marketingbezeichnungen für Multisampling-FSAA. Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, 4xAA ist wird mit geordnetem und daher ineffizientem Raster durchgeführt. Das AF von nVidia ist nur sehr gering winkelabhängig. HCT steht für verlustarme Komprimierung des gesamten Contents.
°° Angegeben ist die maximale interne Genauigkeit. Es gibt bei nVidia noch FP16 (16Bit) und FX12 (erweitertes Integer-Format).
°°° Für genauere Erklärungen mag der sehr technische Artikel von 3DCenter.de über die nV3x-Architektur dienen. Kurz gesagt kann der nV30 bis zu acht Texturanweisungen verarbeiten und dabei je zwei Texturanweisungen gegen eine Arithmetik-Op eintauschen. Der nV35 kann ebenfalls acht Textur-Ops, allerdings zusätzlich noch bis zu acht Arithmetik-Ops pro Takt und Pipeline ausführen.

Der upper-Mid-Range Kunde, der typischerweise versucht, die Karten mit dem besten Preis-Leistungs-Verhältnis zu kaufen, könnte angesichts von mehr als 18 Monaten Lebenszeit und mehr noch, auf 64MB (in unserem Beispiel) begrenztem Grafikspeicher schon der Sinn nach mehr stehen. Eine kleine Vorauswahl haben wir schon getroffen - Upgrades auf kleinere Karten als in dieser Tabelle lohnen nur bedingt.

GF4 Ti4800 GF FX 5800 U GF FX 5900 GF FX 5900 U
Chip nV28 nV30 nV35 nV35
Taktung (MHz) 300 500 400 450
Renderpipes 4 4 (8)*
Pixelfüllrate 1200MPix/s 2000MPix/s 1600MPix/s 1800MPix/s
TMUs je Pipe 2
Texelfüllrate 2400MTex/s 4000MTex/s 3200MTex/s 3600MTex/s
Vertexeinheit DX8 VS1.1 DX9 VS 2.0+
Vertexpipes 2 3 (Array)
Dreiecksdurchsatz ~136MV/s ~375MV/s ~300MV/s ~337MV/s
Texturen pro Pass 4 8 (16)
Pixelshader PS1.3 PS 2.0+
Speicher 128MB 256MB
Anbindung 128Bit DDR 256Bit DDR
Speichertakt (MHz) 325 500 425
Bandbreite 10400MB/s 16000MB/s 25600MB/s
SinglePass Texturop. 4 16(D3D) / 4(oGL)**
FSAA/AF-Technik AccuView° IntelliSample° IntelliSample HCT°
RAMDAC 2x400MHz
TV-Encoder extern integriert
Sonstiges DVD MC DVD MC/iDCT
Effizienz-Maßnahmen Vierkanal-LMA II, Fast ZClear, EarlyZ, Z-Compression Vierkanal-LMA III, Fast Z-Clear, EarlyZ, Z-Compression, Color-Compression Vierkanal-LMA III, Fast Z-Clear, EarlyZ, Z-Compression, Color-Compression, Ultra Shadow, HCT
Präz. pro Kanal°° 9Bit (FX9) 32Bit (FP32)
FP-Shaderops/s (Textur- + Arithmetik-Ops)°°°
Min. Instr./s entfällt 0+2000M 0+3200M 0+3600M
Max. Instr./s entfällt 4000M+0 3200M+3200M 3600M+3600M
Peak Instr./s entfällt 4000M 6400M 7200M
* nVidia gibt zwar ein Maximum von acht Pixeln pro Takt an, dies trifft aber nur für Z- und Stenciloperationen zu. Sobald Multitexturing genutzt wird, verhält sich der nV3o wie ein Design mit vier Pipelines à zwei TMUs.
** Stand: Detonator 53.03
° Hierbei handelt es sich um Marketingbezeichnungen für Multisampling-FSAA. Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, 4xAA ist wird mit geordnetem und daher ineffizientem Raster durchgeführt. Das AF von nVidia ist nur sehr gering winkelabhängig. HCT steht für verlustarme Komprimierung des gesamten Contents.
°° Angegeben ist die maximale interne Genauigkeit. Es gibt bei nVidia noch FP16 (16Bit) und FX12 (erweitertes Integer-Format).
°°° Für genauere Erklärungen mag der sehr technische Artikel von 3DCenter.de über die nV3x-Architektur dienen. Kurz gesagt kann der nV30 bis zu acht Texturanweisungen verarbeiten und dabei je zwei Texturanweisungen gegen eine Arithmetik-Op eintauschen. Der nV35 kann ebenfalls acht Textur-Ops, allerdings zusätzlich noch bis zu acht Arithmetik-Ops pro Takt und Pipeline ausführen.

Entweder man nutzt seine Karten bis zum bitteren Ende und hat wirklich lange mit dem Upgrade gewartet oder will prinzipiell nur High-End Modelle in seinem Rechner sehen. In beiden Fällen sollte man, eventuell mit Ausnahme der FX 5900 XT, unterhalb der Modelle in unserer letzten Tabelle nicht anfangen. Hier tummelt sich die vergangene und aktuelle High-End Garde von nVidia.

[b]UPDATE 27.02.2004: Die Tabellen enthielten Fehler sowohl bezüglich der Rechengenauigkeit, die pro Kanal natürlich nur 32Bit beträgt, als auch bezüglich der Leistungsfähigkeit der CineFX II Chips. Diese können unter Umständen bis zu acht zusätzliche FP-Operationen verglichen mit CineFX I ausführen.

Danke an Demirug, den Autor des CineFX-Artikels für den Hinweis! [/b]

25 Jahre ComputerBase!
Im Podcast erinnern sich Frank, Steffen und Jan daran, wie im Jahr 1999 alles begann.