ComputerBase

Vorschau: nVidia GeForce FX5950 Ultra

von Carsten Spille

Einleitung

Der im Vorfeld sagenumwobene und nach endlosen Verzögerungen erst nach der diesjährigen CeBit erhältliche GeForce FX5800 Ultra, Codename nV30, erwies sich schon nach kurzer Zeit im Praxistest als ein der Radeon 9700 Pro kaum gewachsener Gegner, so dass man sich bei nVidia gezwungen sah, mittels der auf 256Bit Speicherinterface aufgebohrten GeForce FX5900 Ultra nachzulegen.

In den damals aktuellen Spielen, die im Höchstfall Gebrauch von DirectX8-Effekten machten, schlug sich das neue Flaggschiff auch recht wacker und konnte in vielen Fällen dem von Erzkonkurrent ATi ebenfalls neu eingeführten Radeon 9800 Pro das Wasser abgraben. Dank seiner höheren Taktraten und dem nun ebenso breit angebundenen Speicher, sogar unter Einsatz von Anti-Aliasing, wo bislang die Radeon-Serie ab der Radeon 9500 dominierend war. Nur leider blieben die Abtastmuster für das Anti-Aliasing seit nunmehr über zwei Jahren unverändert und oberhalb von 2xFSAA, wo man zumindest ebenfalls ein gedrehtes Raster anbot, lag ATis Radeon unangefochten an der Qualitätsspitze.

Logo Groß
Logo Groß

Die GeForce FX5950 Ultra, mit 475MHz GPU- und Speichertakt ausgestattet, soll es nun richten und mit der kürzlich vorgestellten Radeon 9800 XT gleichziehen.

Wie sie dies anstellen will und ob es ihr eventuell gelingt - Wir sind gespannt es herauszufinden.

Leider muss dieses kleine Preview ohne wirkliche Radeon 9800 XT auskommen und auch die GeForce FX5900 Ultra wird erst morgen aus unserer Lübecker Außenstelle hier eintreffen, aber für den Anfang sollten ein paar Benchmarks im direkten Vergleich zur FX5800 Ultra und FX5900 den Mund wässrig machen. Mehr war in einem Tag Testzeit nicht mehr zu bewerkstelligen.

Update:

[p][/p]

Die FX5950 Ultra

Wie schon in der Einleitung erwähnt, taktet der Chip der Karte im Vergleich zum nV35 auf der FX5900 Ultra mit 475MHz wieder etwas höher und kommt damit schon sehr nah an die Bestmarken von FX5800 Ultra und Radeon 9600 XT, die jeweils 500MHz bieten, heran.

GeForce FX 5950
GeForce FX 5950
GeForce FX5950 RAM-Kühler
GeForce FX5950 RAM-Kühler
GeForce FX5950 Rückseite
GeForce FX5950 Rückseite

Wie auf den Bildern zu sehen, kommt hierzu wieder eine Kühlung zum Einsatz, die an das vielgescholtene FX-Flow der FX5800 Ultra, auch bekannt als 'Der Fön', erinnert. Hier hat man bei nVidia aber seine Lektion gelernt und obwohl nicht völlig geräuschlos, dreht der Lüfter von Delta Electronics [1], der mit maximal 2900 Umrehungen pro Minute bei 38dB(A) spezifiziert ist, doch verhältnismäßig gesittet seine Runden und ging während unseres Tests nie auf volle Laufstärke, soweit das mittels Hörprobe zu sagen ist. Auf jeden Fall kein Vergleich zum lärmenden FX-Flow der FX5800 Ultra, sogar die recht leisen Lüfter einiger FX5900-Modelle wirken lauter.

nV38 vs nV30 II
nV38 vs nV30 II
nV38 vs nV30 Slotblenden
nV38 vs nV30 Slotblenden
nV38-Lüfter
nV38-Lüfter
GeForce FX5950 Kühlsystem
GeForce FX5950 Kühlsystem
GeForce FX5950 GPU-Kühler
GeForce FX5950 GPU-Kühler

Die Luft wird, wie beim FX-Flow, von ausserhalb des Gehäuses mittels des geregelten Radiallüfters angesogen, durch das Führungsteil aus transparentem Plastik über den an die sog. skived fin-CPU Kühler erinnernden Kühlkörper geführt und in das Gehäuse verteilt. Leider wird für diese Bauweise noch immer der Platz des ersten PCI-Slot benötigt, so dass man die FX5950 Ultra in beengten Barebone-Gehäusen oftmals nicht unterbringen kann, obwohl das Kühlprinzip optimal dafür geeignet wäre.

nV38 vs nV30 Vogelperspektive
nV38 vs nV30 Vogelperspektive
GeForce FX5950 Rückseite II
GeForce FX5950 Rückseite II

nV38 Vorderseite ohne Aufbau
nV38 Vorderseite ohne Aufbau
Hynix 2ns-BGA-RAM
Hynix 2ns-BGA-RAM

Auch die 256MB verbauten RAMs werden gekühlt, allerdings mittlerweile durch entkoppelte Kühlbausteine. Auf der Rückseite kommt der schwarze, schon von der FX5900 Ultra bekannte, RAM-Kühler zum Einsatz, der einen großen Teil der Fläche einnimmt.

Vorderseits ist ein nVidia-grünes Kühlblech verschraubt, welches nach oben hin noch einmal um 90° abgewinkelt ist und damit quasi ein Dach für die restliche Kühlkonstruktion bildet. Inwieweit dies nur der Optik dient oder ob realer Nutzen dahinter steckt, wird die Adaption der Boardhersteller zeigen.

Da der Kühler verschraubt war (und leider dem Vorbenutzer unseres Testsamples eine der Schrauben abhanden gekommen zu sein scheint), war es relativ einfach und risikolos, die gesamte Konstruktion bis auf den eigentlichen Kühlkörper zu demontieren.

Zum Vorschein kam Hynix-BGA-RAM mit einer spezifizierten Zugriffszeit von 2,0ns, was 500MHz entspricht. Getaktet auf 475MHz (DDR) ergibt sich bei einem Speicherinterface von 256Bit Breite eine nominelle Transferrate von 30,4GB/s - neuer Rekord!

BIOS vom nV35?
BIOS vom nV35?
BIOS vom nV30!
BIOS vom nV30!
Boot-Screen mit nV35-BIOS
Boot-Screen mit nV35-BIOS

Ein Aufkleber auf der Karte, der die BIOS-Revision zu bezeichnen schien, machte uns indes etwas stutzig. Die Nummer 04.35.20.32.16 kam uns zunächst wie ein Fehler vor, da sie stark auf ein nV35-BIOS, zu erkennen an der zweiten Zweiergruppe, hindeutet. Zum Vergleich noch ein Foto des BIOS-Aufklebers auf der FX5800 Ultra. Ein Shot des Boot-Screens brachte jedoch Gewissheit: Das BIOS scheint wirklich keine große Anpassung seit dem nV35 benötigt zu haben oder nVidia bricht seit kurzem ihre eigene Nomenklatur.

TV-In-Chip von Phillips
TV-In-Chip von Phillips
nV38 vs nV30 II
nV38 vs nV30 II
nV38 Vorderseite ohne Aufbau
nV38 Vorderseite ohne Aufbau

Zum Abschluß der Foto-Session noch ein kurzer Blick auf den, wie üblich durch einen Phillips-Chip (SAA7108AE) realisierten, TV-In, mit dem - ebenfalls üblich - das Referenzmodell ausgestattet war. Der TV-Out wird seit der FX-Serie bei nVidia durch einen internen Encoder übernommen, der in ähnlicher Form auch schon in der GeForce4 MX-Reihe zu finden war und der qualitativ gegenüber den externen Chips enorm zugelegt hat.

Treiber

Zusammen mit der heutigen Vorstellung der GeForce FX5700 (nV36) und der GeForce FX5950 (nV38) sind auch neue Treiber unabdingbar, da die bisherigen offiziellen Treiber maximal Chips bis zum nV35 auf der FX5900 unterstützen.

52.16 Frontpanel
52.16 Frontpanel

Wie wir schon in unserer Meldung [2] zum geleakten, inoffiziellen Detonator 51.75 berichteten, verfügt auch der nun offizielle Detonator mit der Revisionsnummer 52.16 [3] über alle erweiterten Möglichkeiten des Control Panel und verbessert, vom gewöhnungsbedürftigen Format einmal abgesehen, die Nutzbarkeit und Nützlichkeit des Treibers. So kann man beispielsweise selbsterstellte Auflösungen frei hinzufügen. Auch wenn dieses in den Beta-Treibern noch nicht ganz reibungslos funktionierte, kann nunmehr im laufenden Betrieb unter Windows eine neue Auflösung hinzugefügt und auch gleich benutzt werden.

52.16 Frontpanel
52.16 Frontpanel
52.16 Bildschirmanpassung
52.16 Bildschirmanpassung

52.16 Anzeigetiming
52.16 Anzeigetiming
52.16 Farbkorrektur
52.16 Farbkorrektur

Von Links nach rechts noch einmal das Start-Panel, die Bildlagenkorrektur, das Anzeige-Timing und die Digital Vibrance genannte Farbkorrektur.

52.16 Leistungs- und Qualitätseinstellungen
52.16 Leistungs- und Qualitätseinstellungen
52.16 D3D Optionen
52.16 D3D Optionen

52.16 D3D Weitere Optionen
52.16 D3D Weitere Optionen
52.16 OpenGL Optionen
52.16 OpenGL Optionen

Die für die meisten User interessanten Leistungs- und Qualitätseinstellungen für Anti-Aliasing und anisotrope Filterung, das Direct3D-Panel, dessen erweiterte Eigenschaften und selbiges für OpenGL, unter anderem zum Abschalten der vertikalen Synchronisation für maximale Leistung.

52.16 Overlay Farbkorrektur
52.16 Overlay Farbkorrektur
52.16 Taktfrequenzen 2D
52.16 Taktfrequenzen 2D

52.16 Fehlersuche
52.16 Fehlersuche
52.16 Rotationssteuerung
52.16 Rotationssteuerung

Overlay-Farbkorrektur zur Anpassung von Video-Darstellung, das im Treiber integriert und per CoolBits [1] freischaltbare Übertaktungsmenü, hier mit den 2D-Taktraten von 300/475MHz, das Tab zur Aktivierung des Taskleisten-Icons, sowie die Bildschirmrotation zur Ansteuerung von Hochformat-Displays.

52.16 AGP-Einstellungen
52.16 AGP-Einstellungen
52.16 zusätzliche Informationen
52.16 zusätzliche Informationen

52.16 Temperatureinstellungen
52.16 Temperatureinstellungen
52.16 Refreshraten
52.16 Refreshraten

"AGP-" und "Zusätzliche Informationen" gibt es nur, wenn man den CoolBits-Registry-Hack einsetzt, die Temperaturüberwachung ist, wieder mit auf 120°C gesenkter Drosseltemperatur, standardmäßig aktiv und der Refreshfix ist mittlerweile schon beinahe ein alter Hut.

52.16 Auflösung ändern
52.16 Auflösung ändern
52.16 nView Verwaltung
52.16 nView Verwaltung
52.16 Bildschirmmenüs
52.16 Bildschirmmenüs

Zu guter Letzt noch das Menü zur Anpassung und Erstellung neuer Auflösungen, Refreshraten und Farbtiefen, sowie die nView-Profilverwaltung und das Tab, in das man nicht benötigte andere Tabs schieben kann, um die Übersichtlichkeit zu erhöhen.

Bildqualität

Die Bildqualität und deren schrittweises Zurückschrauben, um in teilweise aberwitzigen Settings, in denen unter anderem auch wir als Hardware-Publikation testen, noch höhere Frameraten als die Konkurrenz zu erzielen, war und ist ein sehr kontroverses Thema der letzten Wochen und Monate.

Während vor ein bis zwei Jahren gelegentlich der Verdacht geäußert wurde, Firma X oder Hersteller Y habe in Test Z etwas gemogelt, wurden derlei Geschichten spätestens seit dem diesjährigen Erscheinen des 3DMark03 und den endlosen Querelen um dessen Gültigkeit zum Dauerbrenner.

Fakt ist, dass nachdem sich ATi und nVidia zu Zeiten der DirectX8-Generation noch weitestgehend einig darin waren, was man wie programmieren sollte, um möglichst hohe Leistung zu erzielen, hat sich dieses nun komplett gewandelt.

Unter DirectX9 und den entsprechenden Chips ist die Situation mit angepassten Renderpfaden mittlerweile derart aus dem Ruder gelaufen, dass man sich zu den besten SysMark-Streitigkeiten zwischen AMD und Intel zurückversetzt fühlt.

Da der DirectX9-Renderpfad, so wie er bei Erscheinen der Multimedia-Schnittstelle war, sehr gut mit den wenigen Einschränkungen, die man für die ATi-Chips beachten muss, zurechtkam und im Gegensatz dazu auf die als Mimose bekannten Shader der FX-Serie keine besondere Rücksicht nahm, sah man sich sogar bei Microsoft gezwungen, einen zweiten Renderpfad einzubauen, mit dem Spieleentwickler ihre Shader für bessere Leistung auf der GeForce FX kompilieren sollten. In dem sogenannten 2.a-Pfad ist neben der Unterstützung für die variable Genauigkeit der FX-Serie, bei der der Entwickler bestimmt, welche Präzision er für welchen Effekt sehen möchte, auch die Unterstützung für die erweiterten Fähigkeiten der FX enthalten.

Der neue offizielle Detonator 52.16 enthält nun erstmals selbst einen Compiler, der unpassende Shader zur Laufzeit so umstricken kann, dass die FX-Reihe weniger Probleme damit hat. Inwieweit er dabei auf das fragwürdige Zurückschrauben der Rendergenauigkeit auf FP16 oder gar FX12 zurückgreift, müssen erst gründlichere Tests zeigen.

Nach dieser eigentlich als kurz geplanten Vorrede wollen wir nun zu der tatsächlich sicht- und meßbaren Optimierung der Bildqualität kommen, die im Vorfeld von vielen schon als 'Cheat' gebrandmarkt wurde.

So haben sich in der Tat einige ältere, insbesondere Beta-Versionen der Treiber-Releases, die z.T. auf abenteuerlichem Wege ins WorldWideWeb gelangt sein dürften, nicht besonders rühmlich hervorgetan, was die Bildqualität angeht. Erstmals beobachtet wurde eine derartige Optimierung von den Kollegen des 3D-Center, die in diesem Artikel [4] zumindest eine fragwürdige Optimierung des trilinearen Filters ausschließlich im Spiel Unreal Tournament 2003 konstatierten, die das sogenannte TriBand, also der Bereich in dem Informationen aus zwei verschiedenen Mip-Levels in das gerenderte Bild einfliessen, deutlich verschmälert hat, so daß der Sinn und Zweck trilinearer Texturfilterung, das Verhindern harter Übergänge von einem Mip-Level in den nächsten, in einigen Situationen beinahe ausgehebelt wurde.

Später kamen die ersten Versionen der 50er-Detonator-Serie an die Öffentlichkeit, die schon Bestandteil der viel diskutierten und von nVidia-Karten-Besitzern heiß ersehnten neuen Treibergeneration waren.

Die Version 51.75 tat sich dabei noch am wenigsten rühmlich hervor, denn hier wurde die UT2003-Optimierung Mandat und ließ sich unter Direct3D nicht mehr umgehen. OpenGL blieb von den Optimierungen, wohl auch dank klarer formulierter Richtlinien, bislang verschont.

Die Detonatoren der Serie 52.xx sollten eine weitere Evolution der IntelliSample-Technologie enthalten, mit der Texturen je nach Bedarf unterschiedlich stark anisotrop gefiltert würden, jedoch schien dies bei den bisher geleakten Versionen nicht der Fall zu sein, denn die gängigen Testapplikationen, die nun auch durch die verschiedenen Textur-Stages schalten können, zeigten weiterhin unter OpenGL einwandfreie Qualität, unter Direct3D jedoch die Optimierung des TriBands und, wenn man AF über den Treiber erzwingt, auch noch eine Beschränkung der Textur-Stages 1-7 (also im Allgemeinen alle Texturschichten ausser der Basis-Textur) auf maximal 2xAF, egal was man auswählte.

So wie es momentan scheint(!), war die IntelliSample-Texturoptimierung hier aber ein wenig schlauer, als die Testapplikationen, so dass bei den dort verwendeten Texturen zwar wirklich das TriBand stark optimiert wurde, aber angesichts des Ausgangsmaterials ist das in dem Falle wohl zu verschmerzen. Zwei Vergleichs-Screenshots mit UT2003 zeigten aber ein durchaus akzeptables TriBand, wie unten zu sehen ist.

UT2003 Det44.65.PNG
UT2003 Det44.65.PNG
UT2003 Det52.16 8xAPP-AF.PNG
UT2003 Det52.16 8xAPP-AF.PNG

UT2003 Det52.16 8xCP-AF.PNG
UT2003 Det52.16 8xCP-AF.PNG
UT2003 ATi 8xAPP-AF
UT2003 ATi 8xAPP-AF

Die Screenshots stammen aus der UT2003-Cheat-Demo [5] vom 3DCenter und sind in 1024x768x32, 4xFSAA, 8xAF und mit höchsten Details angefertigt worden. Zumindest auf Texture-Stage 0, dort wo im Regelfall die Basistextur liegt, ist von der Beschneidung des TriBandes nicht mehr so viel zu sehen, auch im Vergleich zum Screenshot mit der Radeon 9700 Pro und Catalyst 3.8 ganz rechts. Wenn nun diese 'Optimierung' gänzlich aus der Voreinstellung verschwindet und man sie als Option vorgesetzt bekommt, kann eigentlich auch der hartgesottenste Bildqualitäts-Fetischist sich erst einmal nicht mehr beklagen.

FSAA und AF

In Sachen FSAA hat sich im Vergleich zu älteren Karten seit der GeForce3 nichts geändert. Deswegen die mittlerweile etwas dürftigen FSAA-Optionen, die nVidia bietet, hier im Kurzüberblick:

2-Sample AA
2-Sample AA
2Q-Sample AA
2Q-Sample AA

Ausser, dass Quincunx aufgrund des Unschärfefilters wohl nach wie vor nur für Special Interests sinnvoll sein dürfte, hat sich in der 2xFSAA-Reihe rein gar nichts geändert.

4-Sample AA
4-Sample AA

Hier ein dummer faux-pas des 52.16er Detonators: Der aufgrund seines Supersampling Anteils für ältere oder CPU-limitierte Games durchaus nützliche 4xS-Modus ist leider mit diesem Treiber nicht mehr vorhanden. Allerdings sollten externe Tweaker wie der RivaTuner [6] oder der aTuner [7] dieses Problem relativ einfach umgehen können. Am 4-Sample Modus an sich hat sich leider nichts geändert, er arbeitet nach wie vor mit dem schon seit seiner Einführung als Supersampling-Modus in der GeForce2, überholten Ordered-Grid Verfahren und bietet so nur wenig mehr Qualität als der 2xFSAA-Modus. Dank der enormen Bandbreite der GeForce FX5950 Ultra kostet er allerdings auch nur wenig mehr an Leistung...

6xS-Sample AA
6xS-Sample AA
8-Sample AA
8-Sample AA

Hier nun die absoluten Verschwender-Modi, da sie beide durch ihren hohen Supersampling-Anteil extrem viel Füllrate verbrauchen. Zudem ist der 6xS-Modus in der Form nur unter Direct3D verfügbar.

Alles in allem läßt sich also zusammenfassen, dass nVidia seit nunmehr beinahe 30 Monaten ausser der reinen Geschwindigkeit keinen Fortschritt in der Anti-Aliasing Technologie erzielen konnte. Hoffentlich ändert sich dies mit der nV4x-Serie, denn so kann man Fans glatter Kanten eigentlich nur die Produkte vom Konkurrent ATi empfehlen.

Kommen wir nun zum anisotropen Filter, kurz AF genannt.

Hierum drehten sich, wie im Abschnitt Bildqualität angesprochen, die meisten der Querelen vergangener Tage und Wochen. Mit dem 52.16er Detonator hat nVidia, ähnlich wie Konkurrenz ATi seit dem Catalyst v3.2 ein etwas differenzierteres Verhalten für die AF-Einstellungen festgelegt.

Unter OpenGL ist alles in Butter, welchen AF-Level eine Applikation anfordert, sie bekommt ihn, egal ob man das AF vorher schon im Treiber auf eine bestimmte (Mindest-) Stufe festgelegt hat oder nicht, auf jeder Textur-Stage, von denen der OpenGL-1.4 ICD weiterhin nur vier unterstützt.

AF 0x TS0-3 oGL App
AF 0x TS0-3 oGL App
AF 2x TS0-3 oGL App
AF 2x TS0-3 oGL App

AF 4x TS0-3 oGL App
AF 4x TS0-3 oGL App
AF 8x TS0-3 oGL App
AF 8x TS0-3 oGL App

Etwas komplizierter und auch kritikwürdiger wird es unter Direct3D. Hatte man es bisher mit diversen möglichen und unmöglichen Optimierungen zu tun, die sich von Beta zu Beta auch noch änderten, gibt es nun ein Schema: Getrennt nach Auswahl des AF-Levels entweder über das im Treiber integrierte Panel oder über die Anforderung der Anwendung.

Demnach bekommt eine Anwendung, wenn sie selber AF anfordert, auf jeder Textur-Stage von 0-7 den AF-Level, den sie möchte, bis hinauf zu achtfachem AF. Auf den folgenden Bildern sieht man deutlich, daß der Treiber in diesem Falle das TriBand stark einschränkt und so Rechenzeit sparen will.

AF 0x TS0 D3D
AF 0x TS0 D3D
AF 2x TS0 D3D App
AF 2x TS0 D3D App

AF 4x TS0 D3D App
AF 4x TS0 D3D App
AF 8x TS0 D3D App
AF 8x TS0 D3D App

Wenn man jedoch das AF per Treiber erzwingt, was leider in einer großen Zahl der Spiele nötig ist, da es keine in-Game Einstellung gibt, die DirectX aber eigentlich fordert, kann der Treiber quasi tun und lassen, was er will. Bei ATi hatte man sich für das Beschränken der Texturstages 1-7 auf bilineares AF entschieden, wodurch in manchen Games z.B. Detailtexturen Mip-Banding aufweisen konnten. nVidia ging einen anderen Weg mit dem 52.16er Detonator und behielt die Filterqualität an sich bei, beschränkte jedoch den maximalen AF-Level für die Texturstages 1-7 auf zweifaches AF.

AF 0x TS0 D3D
AF 0x TS0 D3D
AF 2x TS0 D3D CP
AF 2x TS0 D3D CP

AF 4x TS0 D3D CP
AF 4x TS0 D3D CP
AF 8x TS0 D3D CP
AF 8x TS0 D3D CP

Auf den linken Seiten ist die Texturstage 0 dargestellt, die den eingestellten AF-Level erhält, rechts sind die Texturstages 1-7 (die alle gleich aussehen, deswegen hier zusammengefasst), die unabhängig von der Voreinstellung auf maximal zweifaches AF begrenzt sind.

An dieser Stelle nochmals ein deutlich Aufruf an die Adressen von beiden, ATi und nVidia!

Das Senken der Bildqualität, nur um in Benchmarks ein kleines bisschen besser dazustehen, ist der falsche Weg!

Als Option würden diese Optimierungen sicherlich von den meisten Kunden begrüßt werden, aber als Zwang voreingestellt und nicht oder kaum umgehbar, sieht man sich als Kunde nur zu gern nach Alternativen um, die man sonst vielleicht nicht in Betracht gezogen hätte! (XGI Volari, PowerVR Series5, S3 Delta-Chrome).

[p]Kehrt zur ursprünglichen, hohen Filterqualität zurück und überlasst es dem User, sich optional für niedrigere Bildqualität bei besserer Performance zu entscheiden!
[/p]

Technische Daten

Hier ein kurzer Überblick über ein paar technische Merkmale des nV38 und seiner Konkurrenten.

FX5950 Ultra FX5900 Ultra FX5800 Ultra R9800 Pro
Chip nV38 nV35 nV30 R350
Taktung (MHz) 475 450 500 380
Renderpipelines* 4(8) 4(8) 4(8) 8
Pixelfüllrate 1900MPix/s 1800MPix/s 2000 MPix/s 3040 MPix/s
TMUs je Pipe 2 2 2 1
Texelfüllrate 3800 MTex/s 3600 MTex/s 4000 MTex/s 3040 MTex/s
Vertexshader DX9 VS2.0+ DX9 VS 2.0+ DX9 VS 2.0+ DX9 VS 2.0
Vertexpipes (3) (3) (3) 4
Dreiecksdurchsatz ~356MT/s ~337MT/s ~375MT/s ~380MT/s
Texturen pro Pass 8 (16) 8 (16) 8 (16) 8 (16)
Pixelshader PS 2.0+ PS 2.0+ PS 2.0+ PS 2.0
Speicher 256MB 256MB 128MB 128MB
Anbindung 256Bit DDR 256Bit DDR 128Bit DDR-II 256Bit DDR
Speichertakt (MHz) 475 425 500 340
Bandbreite 30400 MB/s 27200 MB/s 16000 MB/s 21760 MB/s
Single-Pass Texturop.** 16(D3D) / 4(oGL) 16(D3D) / 4(oGL) 16(D3D) / 4(oGL) 16(D3D) / 8(oGL)
FSAA/AF-Technik° IntelliSample HCT IntelliSample HCT IntelliSample Smoothvision 2.1
RAMDAC 2x400MHz 2x400MHz 2x400MHz 2x400MHz
TV-Encoder integriert integriert integriert integriert
Genauigkeit pro Kanal°° 128Bit (FP32) 128Bit (FP32) 128Bit (FP32) 96Bit (FP24)
FP-Shaderops/s (Textur- + Arithmetik-Ops)°°°
Min. Instr./s 0+3800M 0+3600M 0+2000M 3040+3040M
Max. Instr./s 3800+1900M 3600+1800M 4000+0M 3040+3040M
Peak Instr./s 5700M 5400M 4000 6080M
* nVidia gibt zwar ein Maxium von 8 Pixeln pro Takt an, dies trifft aber nur für Z- und
Stenciloperationen zu. Ansonsten verhalten sich nV30, nV35 und auch der nV38 wie ein Design mit vier
Pipelines à zwei TMUs
** Stand: Detonator 52.16
° Hierbei handelt es sich um Marketingbezeichnungen für Multisampling-FSAA und optimiertes AF.
Bei nVidia kommt beim FSAA bis 2x ein gedrehtes Raster zum Einsatz, ATi
verwendet für 2x und 4x-FSAA ebenfalls ein solches, für 6x FSAA ein sparsely sampled Raster,
bei dem pro Achse sechs Samples erzeugt werden, die aber niemals Achsenkongruent sind. Das AF
von nVidia ist nur sehr gering winkelabhängig, ATi verwendet hier eine stärkere Optimierung, die bei
geringem Verzicht auf Bildqualität der Leistung zugute kommt. Zusätzlich bewirbt nVidia beim nV35
und nV38 eine Kompressionstechnologie für hohe Auflösungen (HCT), die verlustbehaftet,
aber laut nVidia, nicht sichtbar, den gesamten Content komprimiert.
°° Angegeben ist die maximale interne Genauigkeit. Während bei ATi alle Rechen-Operationen mit
dieser Genauigkeit durchgeführt werden, gibt es bei nVidia noch FP16 (64Bit) und FX12 (altes Integer-Format).
°°° Für genauere Erklärungen mag der sehr technische Artikel von 3DCenter.de über die nV3x-Architektur [8] dienen.
Kurz gesagt können die R3xx-Chips eine Textur plus eine Arithmetikanweisungen pro Takt und Pipeline
verarbeiten, der nV30 kann bis zu acht Texturanweisungen verarbeiten und dabei je zwei Texturanweisungen
gegen eine Arithmetik-Op eintauschen und nV35 und nV38 können ebenfalls acht Textur-Ops plus vier Arithmetik-
Ops pro Takt und Pipeline ausführen und sind zu demselben Tauschgeschäft, wie der nV30 in der Lage.

Die technischen Daten allein geben noch keinerlei Anhaltspunkte, ob der nV38 tatsächlich eine große Verbesserung gegenüber seinem Vorgänger darstellen kann. Allein 25MHz mehr Chiptakt und 50MHz höherer Speichertakt scheinen noch keine großen Sprünge zu ermöglichen, insbesondere, wenn die Shader-Hardware, das Hauptproblem der FX-Serie gegenüber der ATi-Konkurrenz ebenfalls unverändert übernommen wurde.

Testsystem

Beinahe schon als alter Bekannter kommt unser aktuelles Testsystem auf Pentium4-Basis mit HT-Support für das Preview zum Einsatz.

* Die Karte wurde ohne das automatische Übertakten per Overdrive bzw. SmartDoctor2 getestet.

Benchmarks

3DMark2001 SE

Futuremark 3DMark2001SE v330

 1280x1024x32:
Radeon 9800 XT
15.943
GeForce FX5950 Ultra
14.760
GeForce FX5900 Ultra
14.395
Radeon 9700 Pro
14.104
GeForce FX5800 Ultra
14.067
Radeon 9800 XT 4xAA 8xAF
10.046
GeForce FX5950 Ultra 4xAA 8xAF
9.991
GeForce FX5900 Ultra 4xAA 8xAF
9.583
Radeon 9700 Pro 4xAA 8xAF
8.234
GeForce FX5800 Ultra 4xAA 8xAF
7.764
 1600x1200x32:
Radeon 9800 XT
13.603
GeForce FX5950 Ultra
12.782
GeForce FX5900 Ultra
12.521
GeForce FX5800 Ultra
11.723
Radeon 9700 Pro
11.623
GeForce FX5950 Ultra 4xAA 8xAF
7.767
Radeon 9800 XT 4xAA 8xAF
7.670
GeForce FX5900 Ultra 4xAA 8xAF
7.437
Radeon 9700 Pro 4xAA 8xAF
6.512
GeForce FX5800 Ultra 4xAA 8xAF
5.233
Angaben in Punkten

Im 3DMark2001, der in diesen Leistungsregionen schon ziemlich CPU-limitiert ist, zeigen sich keinerlei Auffälligkeiten. Die FX5950 leistet entsprechend ihrer höheren Taktraten ein kleines bißchen mehr, aber von einem 'Absetzen' kann man beileibe nicht sprechen.

3DMark03

Futuremark 3DMark03 v330

 1280x1024x32:
GeForce FX5950 Ultra
4.603
Radeon 9800 XT
4.585
GeForce FX5900 Ultra
4.405
GeForce FX5800 Ultra
4.131
Radeon 9700 Pro
3.723
Radeon 9800 XT 4xAA 8xAF
2.211
GeForce FX5950 Ultra 4xAA 8xAF
2.063
GeForce FX5900 Ultra 4xAA 8xAF
1.960
GeForce FX5800 Ultra 4xAA 8xAF
1.714
Radeon 9700 Pro 4xAA 8xAF
1.677
 1600x1200x32:
GeForce FX5950 Ultra
3.575
Radeon 9800 XT
3.463
GeForce FX5900 Ultra
3.419
GeForce FX5800 Ultra
3.165
Radeon 9700 Pro
2.750
Radeon 9800 XT 4xAA 8xAF
1.638
GeForce FX5950 Ultra 4xAA 8xAF
1.552
GeForce FX5900 Ultra 4xAA 8xAF
1.471
Radeon 9700 Pro 4xAA 8xAF
1.259
GeForce FX5800 Ultra 4xAA 8xAF
1.035
Angaben in Punkten

Auch hier sind ~5% Performance-Vorsprung nicht gerade das, was einen zum Wechsel bewegen würde. So wie es bisher aussieht, hätte man sich bei nVidia den sicherlich teueren 2ns-RAM sparen können und stattdessen vielleicht eher versuchen sollen, die GPU auf 500MHz oder mehr zu beschleunigen.

Aquanox 2 Revelation

Aquanox 2 v2.159

 1280x1024x32:
GeForce FX5950 Ultra
100,90
GeForce FX5900 Ultra
97,00
GeForce FX5800 Ultra
88,80
Radeon 9800 XT
84,40
Hinweis: 1st Run: 93,5
Radeon 9700 Pro
71,10
Hinweis: 1st Run: 79,3
Radeon 9800 XT 4xAA 8xAF
64,00
Hinweis: 1st Run: 69,3
Radeon 9700 Pro 4xAA 8xAF
51,80
Hinweis: 1st Run: 56,1
GeForce FX5950 Ultra 4xAA 8xAF
46,30
GeForce FX5900 Ultra 4xAA 8xAF
44,20
GeForce FX5800 Ultra 4xAA 8xAF
42,50
 1600x1200x32:
GeForce FX5950 Ultra
75,70
GeForce FX5900 Ultra
72,30
Radeon 9800 XT
67,90
Hinweis: 1st Run: 74,0
GeForce FX5800 Ultra
65,20
Radeon 9700 Pro
55,90
Hinweis: 1st Run: 61,6
Radeon 9800 XT 4xAA 8xAF
47,60
Hinweis: 1st Run: 50,6
Radeon 9700 Pro 4xAA 8xAF
38,30
Hinweis: 1st Run: 40,6
GeForce FX5950 Ultra 4xAA 8xAF
33,40
GeForce FX5900 Ultra 4xAA 8xAF
32,10
GeForce FX5800 Ultra 4xAA 8xAF
29,20

Nichts neues im Staate Dänemark.

Unreal Tournament 2003

Unreal Tournament 2003 - Pyramid

 1280x1024x32:
GeForce FX5950 Ultra
60,24
Radeon 9800 XT
59,82
GeForce FX5900 Ultra
58,85
GeForce FX5800 Ultra
57,36
Radeon 9700 Pro
53,65
Radeon 9800 XT 4xAA 8xAF
36,71
GeForce FX5950 Ultra 4xAA 8xAF
31,31
GeForce FX5900 Ultra 4xAA 8xAF
30,12
Radeon 9700 Pro 4xAA 8xAF
25,84
GeForce FX5800 Ultra 4xAA 8xAF
22,65
 1600x1200x32:
Radeon 9800 XT
51,07
GeForce FX5950 Ultra
50,29
GeForce FX5900 Ultra
48,40
GeForce FX5800 Ultra
46,28
Radeon 9700 Pro
43,62
Radeon 9800 XT 4xAA 8xAF
29,51
GeForce FX5950 Ultra 4xAA 8xAF
24,30
GeForce FX5900 Ultra 4xAA 8xAF
23,30
Radeon 9700 Pro 4xAA 8xAF
20,42
GeForce FX5800 Ultra 4xAA 8xAF
17,68

RtCW Enemy Territory


Enemy Territory v1.02

 1280x1024x32:
GeForce FX5950 Ultra
70,3
GeForce FX5900 Ultra
68,8
Radeon 9800 XT
68,1
GeForce FX5800 Ultra
66,3
Radeon 9700 Pro
65,0
Radeon 9800 XT 4xAA 8xAF
49,8
GeForce FX5950 Ultra 4xAA 8xAF
45,7
GeForce FX5900 Ultra 4xAA 8xAF
43,9
GeForce FX5800 Ultra 4xAA 8xAF
42,0
Radeon 9700 Pro 4xAA 8xAF
41,7
 1600x1200x32:
Radeon 9800 XT
61,7
Radeon 9700 Pro
58,5
GeForce FX5950 Ultra
57,6
GeForce FX5900 Ultra
55,8
GeForce FX5800 Ultra
51,9
GeForce FX5950 Ultra 4xAA 8xAF
29,7
GeForce FX5900 Ultra 4xAA 8xAF
29,3
GeForce FX5800 Ultra 4xAA 8xAF
24,6
Radeon 9700 Pro 4xAA 8xAF
0,0
Hinweis: kein AA aktiv
Radeon 9800 XT 4xAA 8xAF
0,0
Hinweis: kein AA aktiv

Bis auf die kaum vorhandenen Leistungsunterschiede ist einzig bemerkenswert, daß während des Demo-Ablaufes an zwei Stellen Grafikfehler auftraten, die es mit dem 45.23er Detonator noch nicht gab.

Leistungsaufnahme

In Anlehnung an unseren älteren Stromverbrauchs-Artikel [25] wollen wir die Leistungsaufnahme auch weiterhin als Bestandteil unserer Tests pflegen.

Im Gegensatz zu dem verlinkten Artikel hat sich das Testsystem allerdings geändert, so dass die aktuellen Werte nicht vergleichbar mit den alten sind.

Kurz zur Methodik (für eine ausführlichere Beschreibung sei ein Blick in den älteren Artikel empfohlen):

Mit einem ELV EM600 Energiemonitor haben wir vor dem Netzteil die gesamte Leistungsaufnahme des Testrechners gemessen. Die angegebenen Werte sind also nur in Relation zu sehen und stellen keinesfalls die Leistungsaufnahme der Grafikkarte allein dar.

Zunächst der ruhende WindowsXP Professional Destkop in 1280x960x32 mit 100Hz:

Windows XP Desktop

GeForce FX5950 Ultra
92,5
Radeon 9700 Pro
100,3
GeForce FX5900 Ultra
102,8
GeForce FX5800 Ultra
104,3
Radeon 9800 XT
118,6
Angaben in Watt (W)

Hier überrascht die FX5900 Ultra negativ. Mit einem älteren Treiber befand sich die Leistungsaufnahme auf ähnlich niedrigem Niveau (92,8W), wie die der FX5950. Aber das sogenannte "Blinky"-Problem, einem Flimmern in der Darstellung unabhängig von der Refreshrate, machte es nötig, dass die 2D-Kernspannung leicht erhöht wurde und so kommt dieser ungewöhnlich hohe Wert der FX5900 Ultra zustande.

UT2003 FlyBy 1024x768x32 2xAA 4xAF

Radeon 9700 Pro
183,3
Radeon 9800 XT
196,8
GeForce FX5900 Ultra
198,0
GeForce FX5950 Ultra
213,1
GeForce FX5800 Ultra
214,4
Angaben in Watt (W)

Und abschließend noch einmal unter Volllast mit dem Antalus-Fly-By der UT2003-Demo, in dem wir 2xFSAA und 4xAF hinzuschalteten. Hier läuft so ziemlich das gesamte System unter Volllast, inklusive CPU, Mainboard und natürlich der Grafikkarte. Trotzdem scheint der nV38 unter absoluten Extrembedingungen noch ein ziemlicher Schluckspecht zu sein.

Fazit

Der Doppelpack aus neuer Hardware und neuem Treiber (angeblich dem ersten, der von Grund auf neu für die FX-Serie geschrieben wurde) kann überzeugen.

Zwar ist es sehr bedauerlich, dass man bei nVidia dem User vorschreiben möchte, wie die verschiedenen Texturfilter auszusehen haben, aber de facto fällt diese Optimierung im alltäglichen Spielegebrauch nicht so stark auf, wie man aufgrund der synthetischen Test-Applikationen meinen könnte. Trotzdem an dieser Stelle noch einmal der Aufruf an alle Grafikchiphersteller:
Gebt uns zahlenden Kunden endlich die Möglichkeit, wieder die volle, technisch mögliche Bildqualität zu erhalten!
Darüber hinaus ist der nV38 ein Schritt in die richtige Richtung der Evolution: Er wird trotz hoher maximaler Leistungsaufnahme und höherem Takt mit dieser Kühlvorrichtung weniger warm, als seine Vorgänger - insbesondere als der nV30 - und kann somit relativ geräuscharm gekühlt werden.

Er bietet, wie seine Vorgänger, in Verbindung mit dem neuen Treiberpaket, eine Fülle von Optionen, sowohl was den 2D- als auch den 3D-Betrieb angeht und nur der (hoffentlich temporäre) Verlust von 4xS-FSAA im Treiber gibt Grund zur Klage.

Wenn nun auch der Preis kämpferisch gestaltet wird, so kann man als Kunde wahrlich nichts gegen die Produktflut haben, mit der uns die Hersteller dieses Jahr überschwemmen. Bekommt der Kunde doch für vergleichsweise wenig Geld absolute Top-Hardware.

Einzig die Eignung für kommende Generationen an 2.0-Shaderlastigen Spielen darf noch bei allen derzeit verfügbaren Produkten bezweifelt werden. Am besten schaut es momentan, trotz der neuen 52.16er-Detonatoren, noch bei ATi aus, auch wenn man annehmen darf, dass das exzessive Zuschalten von FSAA und AF mit der nächsten Spielegeneration erst einmal eine Pause erleben dürfte.

Da wir am Montag, den 20.10.2003, von der Möglichkeit einer kurzzeitigen Teststellung dieses Referenzmodells erfuhren und dieses am Mittwoch, den 22.10.2003, gegen Mittag bei uns eintraf, bitten wir um Entschuldigung, dass der Test ein wenig kürzer und mit weniger Vergleichskarten als üblich ausgefallen ist.

Wir sind noch dabei, zusätzliche Karten zu testen und werden diese Schritt für Schritt in diesem Test integrieren, später noch einmal vorbeizuschauen könnte sich also lohnen!

URL-Liste:

  1. http://www.delta.com.tw/products/dcfans/pdf/BFBseries.pdf
  2. http://www.computerbase.de/news/hardware/chipsaetze/nvidia/2003/september/detonator_5175_klappe/
  3. http://www.computerbase.de/downloads/treiber/grafikkarten/nvidia//detonator_forceware/
  4. http://www.3dcenter.org/artikel/ati_nvidia_treiberoptimierungen/
  5. http://www.3dcenter.org/images/ati_nvidia_treiberoptimierungen/ut2003-cheat.zip
  6. http://www.nvworld.ru/downloads/rivatuner.zip
  7. http://www.3dcenter.org/atuner/
  8. http://www.3dcenter.org/artikel/cinefx/
  9. http://www.computerbase.de/artikel/hardware/prozessoren/pentium_4_30_ghz_800_mhz_frontsidebus/
  10. http://www.computerbase.de/artikel/hardware/mainboards/der_canterwood_pruefstand/
  11. http://www.computerbase.de/artikel/hardware/arbeitsspeicher_chips/ddr333_400_speicherroundup/5/#corsair_xms3000c2
  12. http://www.futuremark.com/products/3dmark2001/
  13. http://www.computerbase.de/downloads/software/benchmarks//3dmark2001_se/
  14. http://www.futuremark.com/products/3dmark03/
  15. http://www.computerbase.de/downloads//
  16. http://www.3dcenter.de/userbench/
  17. http://www.pcgames.de/index.cfm?menu=0300
  18. http://www.aquanox-revelation.com/
  19. http://www.aquanox-revelation.com/e/download_demo.htm
  20. http://www.3dcenter.de/
  21. http://www.unrealtournament2003.com/
  22. http://www.unrealtournament2003.com/?downloads
  23. http://www.enemy-territory.com/
  24. http://enemy-territory.4players.de:1041/modules.php?name=Downloads&d_op=getit&lid=68
  25. http://www.computerbase.de/artikel/hardware/grafikkarten/stromverbrauch_grafikkarten/
Copyright © 1999–2012 ComputerBase GmbH