Einleitung
Seit Anfang Februar die GeForce4-Karten vorgestellt wurden, wartet man hierzulande auf das Eintreffen der richtigen Karten, nämlich diejenigen mit dem nV25-Chip.
GeForce4MX-Karten, zumindest die MX440, gibt es mittlerweile in Hülle und Fülle an jeder Straßenecke zu kaufen, aber die Ti-Serie ist doch bislang ein wenig spärlicher gesät. Zwischenzeitlich gab es auch die Meldung, die Auslieferung würde sich generell verzögern, was aber durch die zwar schleppende, aber doch vorhandene Auslieferung derselben ad absurdum geführt wurde.
Wir haben freundlicherweise zwei Karten von Asus zum testen bekommen und wollen hier zeigen, was in Ihnen steckt und vor allem was nicht. Unsere beiden Kandidaten sind die Asus V8460 Ultra und die Asus V8440, jeweils entsprechend der GeForce4 Ti 4600 und der Ti 4400.



Die Karten
Hiermit kommen wir zu einer detailierten Vorstellung der beiden Karten.


Gemeinsam ist beiden in großen Teilen das Layout, welches sich, bis auf den Kühler, an das Referenzdesign von nVidia anlehnt. Die TV-Ausgabe besorgt ein Chip von Conexant der auf der Rückseite angebracht ist. Weiterhin gibt es zusätzlich zu dem normalen D-Sub VGA-Ausgang auch einen DVI-Anschluß und einen TV-out. Dank des in der GeForce4-Serie verbesserten TwinView, nun unter dem Namen "nView", sind zwei dieser Ausgänge quasi unabhängig voneinander zu gebrauchen. Weiterhin gibt es natürlich auch hier einen adäquaten Kühler, der nicht unerhebliche Abwärme des nV25-Chips ohne ungewöhnliche Geräuschentwicklung im Gehäuse verteilt. Auf der Verpackung zumindest der V8460 spricht Asus selbst von einem "Copper Fan Sink for superior stability and performance". Das Gewicht dieses Kühlers deutet auch sehr stark auf einen deutlich schwereren Werkstoff als Aluminium hin, äußerlich ist er jedoch offenbar vernickelt.
Nachdem wir die exzessive Nutzung von RAM-Kühlern auf den letzten beiden Generationen von nVidia-Karten miterlebt haben, stellt man erstaunt fest, dass bei diesen, bisher am höchsten getakteten RAM-Chips im Consumersegment, vollkommen auf passive Kühlung verzichtet wurde. Dies ist vor allem dem neuen Packaging im µBGA zu verdanken, mit dessen Hilfe die Chips direkt auf das Mainboard gesetzt werden können und durch eine größere Anzahl von Kontakten auch einen Teil ihrer Wärme direkt ins PCB, dem Board an sich, leiten können. Trotzdem wurden diese im Testbetrieb unter Volllast teils mehr als nur handwarm, woraus jedoch keinerlei Instabilitäten (auch im übertakteten Betrieb) resultierten.
Asus V8440



Im Detail zunächst das "kleinere" Modell die Asus V8440:
Entsprechend der nVidia-Vorgabe ist der Chip hier mit 275MHz getaktet und der RAM wird ebenfalls mit 275MHz angesprochen, welcher durch die Double-Data-Rate Technologie eine Transferrate wie mit 550MHz erreicht. Auf Vorder- und Rückseite sind jeweils 4 Chips im modernen µBGA-Format aufgelötet, die zusammen eine Gesamtgröße von 128MB bereitstellen. Es handelt sich hierbei um Samsung-Chips mit einer Zugriffszeit von 3,6ns die mit den 275MHz schon am Rande ihrer Spezifikation betrieben werden.
Asus V8460 Ultra
Und hier nun das Topmodell, die Asus V8460 Ultra:



Zunächst ein Wort zur Taktung: Entgegen einiger Gerüchte im Vorfeld wird zumindest die aktuelle Revision der V8460 mit den Referenztakten von 300MHz für den Chip und 325MHz für den RAM ausgeliefert, wobei gerade letzterer durch seine spezifizierte Zugriffszeit von rekordverdächtigen 2,8ns noch eine Menge Luft nach oben hat. Rein rechnerisch sollte es möglich sein, ihn mit 357MHz zu betreiben.
Natürlich sind auch hier 128MB Grafikram mit am Start, ebenso in µBGA-Ausführung wie beim kleineren Bruder. Die einzigen Unterschiede der Karten liegen im verwendeten RAM, beim Chip und bei der Farbe des Boards.
Lieferumfang
Als nächstes ein kleiner Blick auf die Hard- und Softwaredreingaben, die bei solchen High-End Karten auch aufgrund des höheren Preisniveaus meist deutlich reichhaltiger ausfallen, als es im Low-Cost Bereich der Fall ist.


Auch hinsichtlich der Software gibt es keinen Unterschied zu vermelden. Beiden Kandidaten liegen sowohl dasselbe Softwarepaket, als auch die gleichen Adapter bei. Eine Kabelpeitsche für den Anschluß des TV-out an entweder einen S-VHS oder Composite-Empfänger und ein DVI-2-VGA-Adapter, mit dem auch ein handelsüblicher CRT-Monitor zusätzlich angeschlossen werden kann.
Auf den fünf beiliegenden CDs finden sich neben dem obligatorischen, aber nichtsdestotrotz sehr nützlichem Soft-DVD-Player von Asus (basierend auf der PowerDVD-Engine) die beiden DirectX-7 Rennspiele Rage Midnight GT und Rage Rally. Nicht mehr der allerletzte Schrei, sind die beiden Action-Racer für ein kurzweiliges Spielchen zwischendurch durchaus noch zu gebrauchen.


Weiterhin liegt noch das relativ neue Unterwasser-Actionspiel Aquanox der deutschen Entwickler von Massive Development beiden Karten bei. Es zeichnet sich vor allem durch eine der ersten Implementationen von Pixelshader und Vertexshadereffekten aus und eignet sich von daher gut als Beilage zu einer entsprechenden Grafikkarte. Dazu gibt es noch eine CD mit Demos aktueller Spiele, als da wären Rally Championship Extreme, Comanche 4, Delta Force Landwarrior, Colin McRae Rally 2, Operation Flashpoint und dem Ballerspiel Incoming Forces von Rage.




Treiber und Tools
Asus läßt es sich bekanntermaßen nicht nehmen, die zugegebenermaßen sehr guten Referenztreiber von nVidia noch ein wenig weiter zu veredeln.
Auf der CD sind neben den Treibern für Windows98/ME, Windows2000/XP und WindowsNT jeweils in der Version 27.42 auch das Asus Tweak Utility 3.51 [1] und der SmartDoctor v1.77 [2] enthalten.




Der Smartdoctor funktioniert leider nicht in Verbindung mit der aktuellen V84xx-Serie, da der hierfür erforderliche Monitoring-Chip nicht verbaut wurde.
Darüberhinaus gibt es noch das Asus Video Security [3], leider in einem mit westeuropäischem Standard nicht darstellbaren Zeichensatz und das mangels Video-Eingangs ebenfalls nicht nutzbare Asus DVCR2 [4]. Verlinkt sind hier die jeweils aktuellen bzw. nutzbaren Versionen. Auch an eine Unterstützung für 3D-Shutterbrillen wurde gedacht und ein paar Bilder für stereoskopische Darstellung sind ebenfalls mit an Board. Die Shutterbrille an sich fehlt im Gegensatz zu den früheren DeLuxe-Modellen jedoch.
Technische Details
Viel ist schon im Vorfeld spekuliert worden, viel ist auch schon durch das eine oder andere (P)Review angesprochen worden, unter anderem auch in unserem kleinen Preview [5]. Ein paar wichtige Details wollen wir hier aber nochmal wiederholen.
Features der GeForce4 Ti Serie
- nFiniteFX Engine II - Programmierbare Pixel- und Vertexshader
- Accuview Anti-Aliasing - Multisampling AntiAliasing Hardware
- Lightspeed Memory Architecture II - Bandbreitenschonende Maßnahmen
- nView Display Technology - Unabhängige Ansteuerung von mehreren Displays
- Shadow Buffer und Echzeitschatten in Hardware
- Bump und Environment Mapping in Hardware
- DirectX und S3TC Texturenkompression
- High Performance 2D Rendering Engine
- High Quality HDTV/DVD playback
- High Definition Video Processor
- DirectX 8.1 Support
- OpenGL 1.3 Support
Zunächst einmal eine tabellarische Übersicht mit den verschiedenene Modellen:
| GeForce 3 | GeForce4 Ti4200 64MB | GeForce4 Ti4200 128MB | GeForce4 Ti4400 128MB | GeForce4 Ti4600 128MB | |
|---|---|---|---|---|---|
| Chip | nV20 | nV25 | nV25 | nV25 | nV25 ultra |
| Taktung | 200MHz | 250MHz | 250MHz | 275MHz | 300MHz |
| RAM | 64 MB | 64 MB | 128 MB | 128 MB | 128 MB |
| Taktung | 230MHz DDR | 250MHz DDR | 222MHZ DDR | 275MHz DDR | 325MHz DDR |
| Speicherbandbreite | 7,36 GB/sec. | 8,0 GB/sec. | 7,1 GB/sec. | 8,8 GB/sec. | 10,4 GB/sec. |
| Anbindung | 128Bit DDR | ||||
| max. TnL-Leistung | 50MTri/sec. | 113MTri/sec. | 113MTri/sec. | 125MTri/sec. | 136MTri/sec. |
| TnL-Engine | nFinite FX Engine | nFinite FX Engine II | nFinite FX Engine II | nFinite FX Engine II | nFinite FX Engine II |
| Rendering Pipelines | 4 | ||||
| max. theo. Füllrate | 800 MPix/sec. | 1000 MPix/sec. | 1000 MPix/sec. | 1100 MPix/sec. | 1200 MPix/sec. |
| 1600 MTex/sec. | 2000 MTex/sec. | 2000 MTex/sec. | 2200 MTex/sec. | 2400 MTex/sec. | |
| AGP-Interface | 4 | ||||
| Transistoren | 57 Mio. | 63 Mio. | 63 Mio. | 63 Mio. | 63 Mio. |
| FSAA-Technik | Multisampling | Multisampling (Accuview) | Multisampling (Accuview) | Multisampling (Accuview) | Multisampling (Accuview) |
| Multi Monitor Support | ./. | nView | nView | nView | nView |
| Effizienz-Maßnahmen | LMA | LMA-II | LMA-II | LMA-II | LMA-II |
Wie hier schon zu erahnen ist, sollten die Unterschiede zwischen Ti 4200 und der Ti4400 sich einigermaßen in Grenzen halten. Nur Karten, die wie die Asus V8460 ultra auf der GeForce4 Ti4600 basieren können sich von den Spezifikationen etwas deutlicher absetzen.
nFiniteFX Engine
Im Prinzip handelt es sich hierbei um genau den Pixel- und Vertexshader, der vor beinahe 12 Monaten im GeForce3 programmierbare Transform und Lighting Effekte in den Consumermarkt brachte. Hier noch einmal eine kurze Erläuterung zur originalen nFiniteFX-Engine. Im Wesentlichen besteht diese aus den sogenannten Pixel- und Vertexshadern, welche für Manipulationen an den einzelnen Bildpunkten und den zugehörigen Texturoperationen bzw. an den grundlegenden Geometriedaten zuständig sind. Ähnlich wie die Hardware T&L-Einheit der alten GeForce2-Serie.
Der große und entscheidende Unterschied zwischen der sogenannten DirectX-7-T&L (GeForce2) und DirectX-8-T&L (GeForce3) liegt darin, dass man mit der alten Hardware nur einige wenige Effekte bzw. Operationen möglich waren, die von nVidia (und DirectX) fest vorgegeben waren. Mit den neuen Shadern war es nun erstmals möglich, dass jeder Spieleentwickler die für ihn wichtigen Operationen innerhalb gewisser Grenzen frei programmieren konnte und das nicht nur für die Geometrie, also das Dreiecksgerüst einer Szene, sondern auch für jeden einzelnen Bildpunkt. Das bedeutet im Endeffekt, dass, wie der Name schon dezent andeutet, rein rechnerisch nahezu beliebige Effekte mit den verwendeten Texturen und Polygonen möglich sind. Dass es doch etwas besser geht, bewies ein halbes Jahr später ATi mit ihrer Radeon8500, der die Anzahl der möglichen (abhängigen) Texturoperationen und Farbwerte noch etwas flexibler handhabte.
Im Unterschied zum GeForce3 ist beim GeForce4 nun ein zweiter Vertex-Shader vorhanden, der sicherlich einen Großteil der zusätzlichen 6 Millionen Transistoren ausmachen dürfte und für einen ordentlichen Schub bei der Geometrieverarbeitung sorgen sollte. "Sollte" deswegen, weil wir aufgrund der vom GeForce3 bekannten Daten (ca. 50M Vertices/s per Vertex-Shader oder 25M Dreiecke/s nach DirectX-7) von einer etwas höheren Geometrieleistung als den offiziell angegebenen 136M Vertices/s ausgegangen waren. Rein rechnerisch sollten ca. 150M Vertices/s möglich sein, wenn man bedenkt, das der Vertexshader nun sowohl doppelt vorhanden als auch um 50% höher getaktet ist. Offiziell wird von nVidia auch eine bis zu dreimal höhere Vertexshaderleistung angegeben, die Daten, um dies zu verifzieren, also entsprechende Angaben zum GeForce3, sind leider nicht zu erhalten.
Der nächste Punkt betrifft den nun ebenfalls leistungsfähiger ausfallenden Pixelshader. Nvidia spricht hier von "Advanced Pixelshader Pipelines", die gegenüber einem GeForce3 um bis zu 50% schneller arbeiten sollen. Das entspricht zufällig wiederum genau der Taktsteigerung von 100MHz bzw. 50% und deutet auf eine unveränderte Übernahme hin. Besonders hervorzuheben ist hierbei jedoch, dass sich die Geschwindigkeit bei mehrfachen Texturoperationen, genauer bei den sogenannten Texture-Lookups und Dependent Texture Reads, deutlich gesteigert haben soll. Unter anderem durch diese Verbesserungen ist es möglich, dass man bei nVidia nun von einer Unterstützung von Pixelshadern in der Version 1.3 spricht, wohingegen man es bei der GeForce3 (Ti) noch mit Version 1.1 bewenden lassen musste.
Pixelshader 1.4 bleiben weiterhin eine Domäne der Radeon8500 von ATi.
LMA-II
Die LMA-II besteht aus sechs Einzelkomponenten, von denen jede für sich dazu beitragen kann, exzessive Bandbreitennutzung durch Texturoperationen zu minimieren. Zu Zeiten des GeForce3 waren es demgegenüber nur vier Elemente, die sich in „verbesserter“ Form auch in der LMA-II wiederfinden. Im Einzelnen wären dies der Cross-Bar Memory Controller, Z-Occlusion Culling und Lossless Z-Compression. Neu hinzugekommen sind eine QuadCache genannte Cache-Ansammlung, ein Auto PreCharge für das lokale GrafikRAM sowie ein Fast Z-Clear. Nachfolgend ein paar Worte zu jeder Komponente.
Cross-Bar Memory Controller (CBCM):
Bei nahezu jeder herkömmlichen Grafikkarte (sogar inklusive der Radeon8500) arbeitet ein Memory-Controller, der die diversen notwendigen Speicherzugriffe, üblicherweise mit 128Bit (DDR), durchführt. An und für sich ist das eine gute Sache aber es gibt hier einen Haken. Jedesmal, wenn ein Zugriff durchgeführt wird, beim dem weniger als 128Bit (DDR) übertragen werden müssen, wird die überschüssige Kapazität des Controllers einfach verschenkt.
Beim nV25 (und auch beim nV20) kommt dagegen ein vierfacher Speichercontroller zum Einsatz, der jeweils unabhängig mit 32Bit (DDR) arbeitet. Diese, bei Bedarf auch zusammenschaltbaren Einheiten mit dann ebenfalls 128Bit (DDR), ermöglichen eine wesentlich effizientere Nutzung der zur Verfügung stehenden Speicherbandbreite, da oftmals nicht die vollen 128Bit (DDR) während eines Zugriffes benötigt werden. Im Idealfall (Zugriffe mit weniger als 33Bit (DDR) können so bis zu 75% Bandbreite eingespart werden, die dann für andere Aufgaben zu Verfügung stehen.
QuadCache:
Für Primitive (grundlegende geometrische Elemente), Vertex-Daten, Texturen und bereits in Bearbeitung befindliche Pixel kommt jeweils ein eigener in Größe und Aufbau optimierter Cache zum Einsatz. Dieser hält häufig benötigte Daten vor, die ansonsten umständlich aus dem Grafikspeicher geladen werden müssten. Der Effekt ist vergleichbar den First- und Second-Level Caches, ohne die sich selbst ein moderner Prozessor jenseits der 1,5GHz auf das Leistungsniveau eines Pentium133 ausbremsen ließe.
Laut nVidia sind diese Caches optimal an das jeweilige Anforderungsprofil angepasst, was auch nötig ist, da sie ja im Chip integriert sind und dort jeder unnötige Transistor bares Geld wert ist.
Z-Occlusion Culling:
Wie kann man im Vorfeld erkennen, dass bestimmte Bildpunkte, oder idealerweise ganze Bereiche, später nicht zu sehen sind? Die Lösung hierfür ist eigentlich recht naheliegend. Da man auf dem Bildschirm kein heilloses Durcheinander von sich gegenseitig überlagernden Objekten zu sehen bekommt, muss es ja schon irgendeinen Wert geben, der bestimmt, wie weit ein bestimmtes Objekt im Sichtfeld vom Betrachter entfernt ist. Diesen Wert, die Tiefeninformation, nennt man Z-Wert und er wird, naheliegenderweise, im Z-Buffer aufbewahrt. Wenn man nun vor dem Rendering prüft, ob ein bestimmtes Pixel evtl. schon von einem anderen verdeckt wird, kann man sich natürlich die weitere Berechnung sparen, was wiederum der verfügbaren Bandbreite stark zugute kommt.
Ein Unterpunkt ist die Anwendung dieses Verfahrens auf eine komplette Region des Bildschirminhaltes, die sogenannnte Occlusion Query. Dies muss aber zur Zeit noch per Software-Anforderung erfolgen, d.h. Das jeweilige Programm muss den Grafikchip dazu auffordern, eine Region zu prüfen. Prinzipiell ist diese Methode natürlich noch deutlich effizienter, erfordert jedoch den Einsatz hierfür ausgelegter Software.
Lossless Z-Compression:
Hierunter versteht nVidia eine Komprimierung für die zu schreibenden Tiefeninformationen (Z-Buffer), wobei die Kompressionsrate bei 4:1 liegen soll, wie schon beim GeForce3. Nähere Informationen zu diesem Feature liegen uns leider noch nicht vor, so dass man erst einmal kritisch nVidias Behauptung, der Datenverkehr vom und zum Z-Buffer könne hierdurch um den Faktor 4 reduziert werden, im Hinterkopf behalten sollte.
Auto PreCharge:
Dieses Feature dient dazu, das RAM nach einem Zugriff auf einen Bereich des RAM und vor den Zugriff auf einen anderen Bereich möglichst schnell wieder bereit zum Aufnehmen neuer Daten zu machen. Auch der im PC verbaute Hauptspeicher muss z.B. eine gewisse Zahl an Taktzyklen warten, bis neue Daten gesendet werden können. Je höher die Taktfrequenz des RAM, desto höher fällt im Allgemeinen auch die Anzahl dieser Zyklen aus. nVidia spricht hier von bis zu 10 Taktzyklen, die nötig sein können, bis ein Speicherbereich geschlossen und der nächste geöffnet und bereit zur Datenübertragung ist. Auto PreCharge soll nun per im Chip berechneter Vorhersage Bereiche aktivieren, die in nächster Zeit (im Microsekundenbereich) möglicherweise zum Ziel eines Datentransfers werden. Diese werden dann auf Verdacht "pre charged" und so kann die Wartezeit auf die "normale" Latenz von 2-3 Zyklen reduziert werden.
Fast Z-Clear:
Den Z-Buffer haben wir ja vorhin bereits angesprochen. Damit kein Chaos auf dem Bildschirm entsteht, müssen die Werte darin natürlich exakt sein. Restbestände von einem Pixel aus dem letzten fertig gerenderten Frame können das Ergebnis verfälschen und Pixelfehler wären die Folge. Deswegen muss vor jedem neuen zu berechnenden Bild jeder wert im Z-Buffer auf Null gesetzt werden. Das kostet im Prinzip genausoviel Bandbreite, wie jeder andere Zugriff. Für ein einziges Bild in 1024x768 in 32Bit würden alleine für diesen Z-Buffer Reset 3,1MB an Bandbreite verloren gehen (multipliziert mit der Anzahl der Bildrate, bei angenommenen 30 Bildern/s also schon 95MB/s) , die man genausogut sinnvoll verwenden könnte.
Nun werden hier die Z-Buffer nicht einzeln mit Null überschrieben, sondern in einem Rutsch auf den Ursprungswert gesetzt, prinzipiell einem Druck auf den Reset-Knopf nicht unähnlich, nur das ausschließlich der Bereich des Grafikspeichers gelöscht wird, in dem sich der Z-Buffer befindet.
Interessant ist in diesem Zusammenhang noch die Tatsache, dass es bei der GeForce3 noch ein weiteres Features gegeben hat, welches ebenfalls zur Reduzierung der Bandbreite diente, allerdings in diesem Falle zur Reduzierung der Geometriedaten.

Die Rede ist von den sogenannten Higher Order Surfaces. Vielen mögen sie schon einmal in Form von ATIs TruForm über den Weg gelaufen sein. Im wesentlichen ging es bei nVidias Weg der HOS darum, komplexe gewölbte Flächen nicht mehr mittels einer Unmenge von Dreiecken über den AGP-Bus zu jagen, sondern nur noch durch eine komplizierte mathematische Formel zu beschreiben. Nötige Veränderungen wurden dann per Variablenänderung an der Formel durchgeführt. Diese Feature ist leider zeitlebens ein Phantom geblieben. In der offiziellen Produktbeschreibung zur GeForce3 taucht es zwar auf, aber seit den Detonator-Treiber in Version 20.80 ist es nicht mehr verfügbar und nun scheint nVidia dies ganz aus der Feature Liste gestrichen zu haben obwohl es mittels gepatchter Treiber noch immer in Hardware verfügbar ist.
Accuview FSAA
Accuview widmet sich der Entferung der sogenannten Anti-Aliasing Artefakte. Diese Artefakte entstehen vornehmlich an den Kanten von Objekten und Polygonen dadurch, dass z.B. eine schräge Kante nur durch eine feine Treppenabstufung mit Hilfe der Pixel dargestellt werden kann. Wenn man die Anzahl der Pixel nun deutlich erhöht, wird unter normalen Umständen dieser Treppcheneffekt gemildert. Das wirklich störende Element dieser Artefakte entsteht vor allem durch Bewegung. Dabei kann es nämlich passieren, dass sich die Reihenfolge dieser Treppenstufen sehr häufig ändert, quasi ständig umspringt, ein Flimmereffekt ist die Folge, der auch bei sehr hohem Auflösungen wie z.B. 1600x1200 durch die Bewegung noch deutlich sichtbar bleibt.
Es gibt nun verschiedene Methoden, diese Aliasing-Effekte zu bekämpfen, zusammengefasst unter dem Begriff Anti-Aliasing.
Die einfachste Art des AA ist, einfach jedes einzelne Bild in einen höher aufgelösten Framebuffer zu rendern, als die aktuell eingestellte Auflösung und das Ergebnis am Ende wieder auf die ursprüngliche Auflösung herunterzurechnen. So würde bei einer Auflösung von 800x600 virtuell bsw. ein 1600x1200 Pixel großer Framebuffer eingerichtet und hinterher wieder auf 800x600 herunterskaliert. Die Artefaktbildung würde sich so auf dem Niveau einer weitaus höheren Auflösung bewegen. Da jedoch mit dieser Supersampling genannten Methode quasi der gesamte Renderingvorgang in einer höheren Auflösung durchgeführt wird, inklusive aller Texturzugriffe etc. stellt sich ein extremer Leistungsverlust ein.
Da dieses Feature also de facto nicht nutzbar war, versuchte man bei nVidia mit Einführung eines im Consumerbereich neuen Verfahrens, bei noch ausreichender Leistung Anti-Aliasing nutzbar und auf breiter Front als Must-Have Feature durchzusetzen. Dieses wurde unter dem Namen „Quincunx“-Anti-Aliasing vermarktet und basierte auf dem Multisampling-Verfahren und einem nachgeschalteten Filter. Multisampling bedeutet, dass die Kanten mindestens genausogut geglättet werden, wie beim Supersampling, jedoch werden die Texturen bei diesem Verfahren nicht behandelt, so dass im direkten Vergleich zu Supersampling-“Texturen“ diejenigen des Multisampling-Bildes nicht ganz so scharf aussehen und ausserdem der Flimmereffekt bei entfernten Texturen nicht bereinigt wird.
Die GeForce3 bot bereits dedizierte Hardware zu diesem Zwecke, so dass die zusätzlichen „Samples“ bei voller (GPU-)Leistung berechnet werden konnten. Augenscheinlich zu diesem Zwecke wird seit der GeForce3 die Füllrate der Chips nicht mehr in Gigatexeln/s angegeben, sondern in Anti-Aliased-Samples pro Sekunde.
Accuview basiert ebenfalls auf dieser Technik, beinhaltet aber zusätzliche Möglichkeiten, die gleichzeitig eine gesteigerte Bildqualität und höhere Leistung versprechen.
Das Quincunx-Muster, benannt nach der Anordnung der fünf Augen auf einem Würfel, bleibt erhalten, wird allerdings mitsamt der zusätzlich berechneten Samples um einen „halben“ Bildpunkt schräg versetzt. Diese Verschrägung kommt der Kantenglättung zugute, da die zusätzlich erzeugten Pixel nun in y- wie in x-Richtung um 50% näher an einer imaginären Schräge und damit der realen Position des Pixels wären und die Anti-Aliasing Wirkung durch die exaktere Näherung steigt. Besonders fällt dies an leicht geneigten, beinahe horizontalen Linien auf.
Desweiteren wurde bei der Ausführung des Accuview-Anti-Aliasing ein kompletter Zugriff auf den Framebuffer eingespart. Dies geschieht jedoch nicht, wie in der Gerüchteküche und unserem Preview spekuliert wurde, durch das Zusammenfügen der Multisamplebuffer zu einem Framebuffer erst im RAMDAC.
Sicher hingegen ist jedoch, daß es einen neuen FSAA-Modus geben wird, der "4xS" bezeichnet ist. Das "S" steht für staggered und soll für eine gesteigerte Wiedergabetreue in Texturen sorgen, indem 50% mehr Texturwerte ausgelesen werden und in die endgültige Berechnung miteinfließen. Wie mittlerweile zu erkennen war, wird hierbei 2x2 Multisampling mit 1x2 Supersampling kombiniert, so dass sich auch der begehrte Texturenglättungseffekt einstellt.
Weiterhin will man dieses Mal wohl auch die positive Wirkung von Anisotropischer Filterung betonen, sprich vermarkten. Darunter versteht man eine Filterung, die entgegen den herkömmlichen bilinearen und trilinearen Filtern nicht in alle Richtungen gleich stark wirkt, sondern analog des Blickwinkels, also z.B. bei 3D-Spielen meist in die Tiefe des Monitors hinein, abhängig vom eingestellten Grad der Filterung, deutlich mehr als nur die benachbarten 4 Pixel zur Filterung heranzieht.
Testsystem
Zum Test kam wiederum ein System basierend aus einem Gespann von SiS745 Chipsatz und AthlonXP 1700+ mit 256MB DDR-RAM zum Einsatz. Wir testeten unter Windows2000, da es die Basis für das Home-OS der Zukunft im Portfolio von Microsoft darstellt und sich demzufolge gut abschätzen läßt, wie zuverlässig und performant sich die jeweiligen Treiber auch unter diesem Betriebssystem verhalten.
Das Service Pack 2 und das aktuelle Application Update von Microsoft wurden ebenso aufgespielt, wie Chipsatztreiber der Version 1.09 von SiS. Das neueste DirectX 8.1 versteht sich von selbst. Die GeForce4MX-Karten wurden mit dem empfohlenen Treiber v27.30 getestet, die GeForce3 und GeForce4 Ti-Karten mit dem aktuellen Referenztreiber 28.32 von nVidia. Zur Geräuschuntermalung wurde zur Abwechslung der subjektiv befriedigende Onboard-Sound des SiS-Chipsatzes mit den Treibern 7012.1.03c verwandt.
Uns ist bewußt, dass man mit einem schnelleren Basissystem die Unterschiede sowohl zwischen GeForce3 und GeForce4 Ti als auch zwischen den einzelnen GeForce4 Ti-Modellen deutlicher machen könnte. Was hier gezeigt wird, ist also als eine Art Worst-Case Szenario zu verstehen. Die Leistung insgesamt und insbesondere die Leistung der GeForce4 Ti kann also mitunter noch deutlich zulegen.
- CPU:
- AMD AthlonXP 1700+ (1466MHz)
- Motherboard:
- Elitegroup K7S6A mit SiS745 Chipsatz
- Arbeitsspeicher:
- 1*256MB KingMax BGA PC2700 DDR-RAM CL2,5
- Grafikkarte:
- Asus V8440 GeForce 4 Ti 4400
- Asus V8460 ultra GeForce 4 Ti 4600
- GeForce4 Ti 4200 128MB (250/222MHz)
- GeForce4 Ti 4200 128MB (225/250MHz)
- Asus V8200 pure (GeForce3)
- Asus V8200 T2 pure (GeForce3 Ti200)
- Prolink Pixelview GeForce4 MX440 [6]
- Peripherie
- IBM DTLA 307015
- Pioneer DVD A03
- Realtek RTL8139c Netzwerkkarte (deaktiviert)
- Castlewood ORB Wechsellaufwerk
- Sonstiges
- A4 Tech Double Wheel Mouse
- Software
- Windows2000 Professional
- Service Pack 2
- Application Update
- DirectX 8.1
Unsere GeForce3 Ti200 wurde wie zuvor schon, durch heruntertakten der V8200 simuliert. Da es sich um dieselbe Hardware handelt, sollte diese Simulation recht realitätsnah sein. Weiterhin haben wir schon vor der offiziellen Ankündigung versucht, die Ti4200 zu simulieren und sind prompt auf die im Vorfeld falsch kolportierten Taktraten hereingefallen. Deswegen gibt es bei uns eine Ti4200 mit der offiziellen Taktung von 250/222MHz und eine mit der vormals gemunkelten 225/250MHz Taktung. Diese "inoffizielle" Version wollten wir weiterhin in den Benchmarks mitverwenden, weil man so sehr gut sehen kann, wo die Limitierung durch den Chip, und wo sie durch den Speicher begründet ist. Dies ist sehr hilfreich, wenn man z.B. durch Übertakten eine höhere Ausgewogenheit herstellen möchte.
Die Ti4200 mit 64MB und 250/250MHz-Taktung haben wir leider noch nicht erhalten und da sie zudem ein anderes Design aufweisen wird (kein µBGA-RAM), würden die Unterschiede zu unserer Simulation dann doch zu groß werden. Wir reichen dies in einem späteren Test nach.
Benchmarks
Als Tests haben wir uns wiederum für eine etwas breiter gefächerte Palette entschieden. Einerseits, um einen repräsentativeren Überblick über das Leistungsspektrum der Karten zu bekommen und andererseits, um den in letzter Zeit immer häufiger angenommenen speziellen Treiberoptimierungen der Chiphersteller auf die beiden beliebtesten Benchmarks, Quake3 und 3DMark2001, entgegenzuwirken. Gerade in diesem Hochpreissegment für Enthusiasten wäre es doch sehr enttäuschend, wenn wirkliche Verbesserungen nur in den zwei oder drei Standard-Benchmarks bemerkbar wären.
- thetische Benchmarks
- 3DMark 2000 v1.1
- 3DMark 2001 SE
- Templemark D3D v1.06
- Villagemark D3D v1.19
- GL Excess v1.1a
- VulpineGL v1.1p
- elebenchmarks
- Comanche 4
- Aquamark v2.3
- Aquanox v1.17
- DronezMark
- Giants v1.4
- Unreal Tournament v4.36
- Quake III Arena v1.30
- Serious Sam v1.02
- Max Payne v1.02
- chmarks mit FSAA und aniso. Filter
- Quake III Arena v1.30
- 3DMark 2001 SE
- Giants v1.4
Sofern nicht anders angemerkt, liefen sämtliche Benchmarks in 32Bit Farbtiefe und wenn möglich auch 32Bit Texturen. Generell wurden die höchstmöglichen Detaileinstellungen verwandt um die Probanden so richtig zu fordern.
Synthetische Benchmarks
3DMark 2000
Der 3DMark 2000 von MadOnion [7] ist ein beliebter aber rein synthetischer DirectX 7.0 Benchmark und sagt nur relativ wenig über die tatsächliche Spielperformance aus. Er hat inzwischen zwar einen Nachfolger im 3DMark2001 gefunden, ist aber nach wie vor noch ein Maßstab in puncto Performance für Grafikkarten. Mittlerweile der Klassiker unter den synthetischen Benchmarks, zeigt der 3DMark2000 langsam aber sicher sein Alter. Während man zur ungefähren Zeit seines Erscheinens sich in Bereichen von 3000 bis 5000 Punkten bewegte, sind nun auch preislich akzeptable Grafikkarten in der Lage, die 10.000er Hürde zumindest in niedrigeren Auflösungen oder unter 16Bit Farbtiefe zu überwinden.
3DMark 2000 v1.1
Angaben in Punkten
|
In den oberen Punkte-Regionen ist dieser Benchmark deutlich CPU-Limitiert und das nicht nur auf unserem Testsystem, wie sich recht deutlich beim Vergleich der Detailergebnisse des High-Detail Adventure-Tests zeigt. Hier liegen zwischen der Asus V8460 ultra (73,1fps) und einer GeForce3 Ti200 (67,8fps), die nur etwas mehr als halb so hoch getaktet ist nur magere 5 Frames. Nur in hohen und höchsten Auflösungen zeigen sich deutlichere Unterschiede. Nichtsdestotrotz können die Asus V84xx-Karten hier einen Doppelsieg auf ganzer Linie verbuchen.
3DMark 2001 SE
Da der 3DMark 2001 wie der 3DMark 2000 ein rein synthetischer Benchmark ist, sagt dieser ebenfalls relativ wenig über die zu erwartende Spielperformance aus, ist jedoch ein guter Anhalstpunkt für zukünftige Spiele, da dieser voll auf DirectX 8 aufbaut. Unter anderem aufgrund des Nature-Tests, der intensiven Gebrauch von Pixelshader-Effekten macht, ist der 3DMark2001 SE nicht nur von CPU und Grafikkarten-RAM, sondern auch sehr vom Chiptakt der Grafikkarte abhängig. Zu berücksichtigen gilt hier, dass der GeForce4 MX440-Vertreter ohne die Punkte aus dem Nature-Test sein Fortkommen bestreiten muss.
3DMark 2001 SE
Angaben in Punkten
|
Auch hier wieder der zu erwartende Doppelsieg für die Asus-Karten. Interessant ist hier jedoch das Abschneiden der beiden Ti4200-Varianten. In 1024x768 spielt der höhere Chiptakt noch eine größere Rolle als die größere Speicherbandbreite, so dass man davon ausgehen kann, dass die zukünftige 64MB-Version mit 250/250MHz-Taktung doch ein wenig schneller sein wird, als die langsamer getaktete 128MB-Variante.
Templemark D3D
Der Templemark ist, genau wie der folgende Villagemark, ursprünglich ein Demonstrationsprogramm von PowerVR gewesen. Da er jedoch eine Menge aktuelle Features, wie Hardware-TnL, Bump Mapping und bis zu 6 Texturlagen in einem Durchgang unterstützt, eignet er sich auch gut als unabhängiger Benchmark, der garantiert nicht auf nVidia-Chips optimiert ist.
TempleMark D3D v1.06
Angaben in Bildern pro Sekunde (FPS)
|
Der Benchmark läuft leider nicht in anderen Auflösungen, also muss in diesem Falle ein einziger Wert ausreichen. Ohne großartige Polygonmengen wirken hier hauptsächlich die Speichercontroller und die generell zur Verfügung stehende Bandbreite, sowie das Entfernen nicht sichtbarer Flächen (HSR Hidden Surface Removal) auf die erreichte Framerate. Diese hängt allerdings vom Chiptakt ab, und so ist auch zu erklären, das auf den hinteren Plätzen, die Ti4200 mit dem niedrigeren Speichertakt, also das 128MB-Modell, unsere "Prototypen"-Version der Ti4200 mit niedrigem Chip- und hohem Speichertakt die rote Laterne zuweisen kann.
Extra für diesen Test, der offenbar sehr gut geeignet ist, um die Effizienz des Speichersubsystems und des HSR zu beurteilen, haben wir einmal die GeForce4 auf dem Taktniveau der GeForce3 laufen lassen, um die Verbesserungen der LMA-II netto zu erfassen.
TempleMark D3D v1.06
Angaben in Bildern pro Sekunde (FPS)
|
7 Bilder pro Sekunde gewinnt man also in einem Texturintensiven Szenario nur durch die Optimierungen in der LMA-II gegenüber dem Vorgänger im GeForce3 hinzu. Dazu kommt natürlich noch der üblicherweise deutlich höhere Takt der GeForce4 Ti-Karten. Insgesamt also ein recht positives Bild, wird der höhere Takt doch sehr gut in höhere Leistung umgesetzt.
Villagemark D3D
Dieser Benchmark wurde von PowerVR entwickelt und dient ihnen dazu, die Vorzüge des Kyro2 zu verdeutlichen, da im VillageMark der Overdraw mit einem Faktor von bis zu 10 besonders groß ist. Die meisten Grafikkarten berechnen hier auch die Gegenstände, die durch andere verdeckt sind und daher eigentliche nur verschwendete Bandbreite bedeuten.
Villagemark D3D v1.19
Angaben in Bildern pro Sekunde (FPS)
|
Zunächst sieht alles nach einem eindeutigen Sieg für die beiden Asus-Karten aus, aber diese Resultate sind interessanter, als es zunächst den Anschein hat. Erst einmal zum Treiber. Die mit den Karten ausgelieferten Treiber der 27.42er Serie erzielten bis zu 20fps höhere Werte für die GeForce4 Ti-Karten, die sich mit den verwendeten offiziellen 28.32er Treibern auf die in dem Diagramm angegebenen Werte absenkten. Seltsamerweise war dies nur unter D3D der Fall, unter OpenGL, für das es ebenfalls diesen Villagemark gibt, blieben sie konstant bei 118fps für die V8460 in 1024x768 und 32Bit. Die neueren inoffiziellen Treiber der 28.90er-Reihe bringen ebenfalls wieder die Werte der 27.xx.
Weiterhin ist sehr interessant, dass wiederum die GeForce4 Ti nicht allzusehr von der Speichergeschwindigkeit abzuhängen scheint, wenn ein hoher Overdraw ins Spiel kommt. Hier liegt der Flaschenhals eindeutig im Chip und seiner Fähigkeit, HSR ausreichend schnell durchführen zu können. Also läge man auch in diesem Szenario mit einer Ti4200 mit 128MB niedriger getakteten RAMs nicht falsch.
GL Excess
GL Excess ist ein OpenGL-Benchmark, der eigentlich sehr geringe Anforderungen an die Grafik-Hardware stellt. Szenen mit über 400 oder gar 800 Bildern pro Sekunde sind hier keine Seltenheit. Er bietet aber einige sehenswerte Effekte. Aufgrund seiner geringen Ansprüche an die Grafikkarte kann er die Unterschiede zwischen den Karten nur innerhalb des Systemlimits verdeutlichen, da hier auch schon andere Komponenten als Bremse auftreten können.
GL Excess v1.1a 32Bit
Angaben in Punkten
|
Ein sehr linearer Leistungsgewinn, von der DirectX-7 Karte GeForce4 MX440 bis hin zum Topmodell von Asus, der V8460 ultra. Unter solchen Umständen liessen sich die rund €500, die man auf den Tisch legen müsste für so ein edles Teil kaum rechfertigen. Während in den unteren Regionen der Rest des Systems noch mithalten kann, werden an der Spitze die Abstände im Verhältnis zur Taktrate der Grafikkarte immer knapper.
In diesem Test kommt es eher auf die Speicherbandbreite an, als auf die eigentlich Chipgeschwindigkeit.
Vulpine GL Mark
Der GLMark ist von der deutschen Softwareschmiede Vulpine entwickelt worden und ist ebenso wie 3DMark2000 und 3DMark2001 für DirectX ein rein synthetischer Benchmark für OpenGL. Der Benchmark ist, vor allem, was die Polygonmengen angeht, hochkomplex und kann wahlweise schon einige der neuen GeForce3 bzw. GeForce4 Ti-Features nutzen. Damit ist der Vergleich aller Karten auch wirklich fair und da in diesem Falle nur nVidia-Karten am Test teilnehmen, wurden auch die speziellen OpenGL-Funktionen der neueren Chips genutzt.
Vulpine GL v1.1p 32Bit
Angaben in Bildern pro Sekunde (FPS)
|
Die neuen Pixelshader-Funktionen (auch wenn diese in OpenGL über Extensions realisiert werden) verhinderten, dass wir die GeForce4 MX440 hier mitvergleichen konnten.
Die beiden Asus-Karten können sich hier doch deutlich vom Rest des Feldes absetzen und bilden ein einsame Spitzenduo in diesem hauptsächlich die T&L-Einheit fordernden Test.
Spielebenchmarks
Comanche 4
Comanche 4 verwendet bereits Pixel- und Vertexshadereffekte um in extrem polygonreichen Szenarien eine sehr detaillierte Spielwelt zu präsentieren. Das Spiel scheint eines der ersten eine neuen Generation zu sein, die anders als Aquanox, nicht nur extrem hungrig nach Grafikpower sondern zusätzlich auch eine sehr hohe Prozessorleistung benötigen.
Comanche 4
Angaben in Bildern pro Sekunde (FPS)
|
Wie unschwer zu erkennen ist, begrenzt hier die CPU die Leistungsfähigkeit sehr stark, so dass auf schwächer bestückten Systemen ohne Probleme und ohne grossartigen Leistungsverlust eine höhere Auflösung gewählt werden kann. Die beiden Asus-Karten können sich vom Rest des Feldes erst bei 1280x1024 (und höher) wirklich ein wenig absetzen, auch wenn sie schon darunter eindeutig in Front liegen.
In der Maximalauflösung (des Monitors) scheint zumindest den GeForce3-Karten ein wenig das RAM knapp zu werden, so dass ein ähnliches Schicksal auch den später erscheinenden GeForce4 Ti4200-Karten mit 64MB blühen könnte.
Aquamark
Aquamark ist ein DirectX 8.0 Benchmark aus dem Hause Massive und basiert ebenso wie Aquanox auf der Krass-Engine, weswegen er quasi ein Hybrid zwischen synthetischem Test und einem Realworld-Benchmark ist. Dargestellt wird eine detailreiche Unterwasserwelt. AquaNox nutzt die nFiniteFX Engine der GeForce3 bzw. GeForce4 Ti. Mit mehr als 160 Vertex Shaders werden Spezialeffekte wie Layered Fog, Caustics, fotorealistische Materialien, Radiosity Lighting und Shadows in Echtzeit erzeugt. Pixel Shader werden für Bump Mapping und maßgeschneiderte Lighting Effekte verwendet. Die Frameraten aus dem Aquamark liegen jedoch deutlich unterhalb der aus Aquanox. Getestet wurden alle Karten mit der Einstellung von 40MB Texturengröße und aktivierten Pixelshader-Effekten.
Aquamark v2.3 32Bit
Angaben in Bildern pro Sekunde (FPS)
|
Hier scheinen Chip-Takt und Speicherbandbreite gleichermaßen essentiell zu sein, wie man an dem kaum vorhandenen Unterschied der beiden Ti4200-Varianten sieht. In niedrigeren Auflösungen können sich die Geforce4 Ti-Karten noch recht deutlich absetzen, verlieren aber in den Königsdisziplinen an Boden. Relativ gesehen liegt aber die Asus V8460 ultra noch immer mehr als 50% vor der GeForce3 und bleibt mit durchschnittlichen 32,3fps noch knapp über der magischen Grenze von 30 Bildern pro Sekunde.
Aquanox
Auch in diesem Test wollten wir wissen, wie sich nun die Verkaufsversion von Aquanox, die zunehmend als Bundle aktuellen Grafikkarten beiliegt, auf eben diesen spielen lässt. Wie zu erwarten war, sind die durchschnittlichen fps deutlich höher als beim stark Pixel- und Vertexshaderlastigen Aquamark.
Getestet wurde die Magellan-Zwischensequenz nach den Einstellungen der Benchmark-Vorgabe des 3D-Center, d.h. mit vollen Details, die jeder Grafikkarte das Äußerste abverlangen.
Aquanox v1.17 32Bit
Angaben in Bildern pro Sekunde (FPS)
|
Füllrate und Speicherbandbreite scheinen hier gefragt, beides bieten GeForce4 Ti Karten in rauhen Mengen und so ist es kein Wunder, dass der Rest des Feldes selbst von den relativ niedrig getakteten Ti4200 Karten abgehängt wird. In hohen Auflösungen scheint auch erstmal deutlich durch, dass die V8440 und die V8460 ultra nicht nur purer Luxus sind, sondern in modernen Games auch den Unterschied zwischen Geruckel und guter Spielbarkeit ausmachen können.
Dronez Mark
Der Dronezmark ist im Demo sowie in der Vollversion von Dronez enthalten und ist ein OpenGL Spiel, welches einigen GeForce3/4 Karten als Bundle beiliegt. Im Demo werden sehr sehenswerte Effekte gezeigt, jedoch ist durch die Verwendung von OpenGL-Extensions arg nVidia-optimiert, was in unserem Testfeld aber keinen größeren Einfluß hat.
DroneZ Mark 32Bit
Angaben in Bildern pro Sekunde (FPS)
|
Hier macht sich die Unterteilung der Marktsegmente abermals mehr als deutlich bemerkbar. Die High-End Produkte von Asus kaufen sowohl den simulierten Ti4200 als auch den GeForce3 Modellen in jeder Hinsicht den Schneid ab. Mehr als 40% Vorsprung in der höchsten Auflösung sprechen für sich, auch die knappen 50% auf die Ti4200 in der 128MB-Version sind nicht zu verachten in diesem besonders die Speicherbandbreite fordernden Benchmark.
Giants
Aus dem Hause Planetmoon kommt das DirextX-7 Spiel Giants. Als Launch-Demo zur GeForce2 präsentiert, ist es eigentlich schon eher alt, zeigt jedoch eine recht ansprechende Optik und sehenswerte Effekte. Getestet wurde der integrierte "Gamegauge"-Benchmark in den maximalen Qualitätseinstellungen.
Giants v1.4
Angaben in Bildern pro Sekunde (FPS)
|
Giants ist ein Paradebeispiel für ein CPU-limitiertes Spiel, liegen die Frameraten doch kaum soweit auseinander um den teils riesigen Preisunterschied der einzelnen Karten zu rechtfertigen. Sogar in höchsten Auflösungen ist das Spiel auf jeder Karte noch einigermaßen spielbar. Hierdurch qualifiziert es sich eindeutig als Opfer für Experimente mit qualitätssteigernden Maßnahmen, wie FSAA oder das zuschalten von anisotroper Filterung um die brachliegende Leistung des Grafiksubsystems auszunutzen.
Unreal Tournament
Unreal Tournament beansprucht stark die CPU und bietet sehr viele Effekte. Das Spiel profitiert von einer hohen Speicherbandbreite des Grafikkarten- und Systemspeichers, nutzt jedoch kein T&L. Obwohl Unreal Tournament verschiedene Schnittstellen wie OpenGL, S3TC, Glide und Direct3D unterstützt, verwenden wir ausschließlich Direct3D. Der Unreal Tournament Benchmark ist weniger CPU limitiert als der UTbench und ermöglicht daher brauchbare Aussagen über die durchschnittliche Performance, indem er ein 4 gegen 4 Capture the Flag Game zeigt.
Getestet wurde in High Quality Einstellungen, die Minimum Desired Framerate wurde auf 0 gesetzt, um zu verhindern, dass UT sich während hoher Last dynamisch anpasst. Weiterhin setzten wir die Detail-Texturen auf "True", darüberhinaus wurde auch die Texturpalette auf 32Bit angepasst, ebenso der Z-Buffer.
Unreal Tournament v4.36 32Bit
Angaben in Bildern pro Sekunde (FPS)
|
Während in 1024x768 das Feld noch dicht beisammen liegt und sogar die GeForce4 MX440 noch halbwegs mithalten kann, trennt sich später die Spreu vom Weizen und die beiden Asus-Karten liegen mit deutlichem 10%-Vorsprung vor den simulierten Ti4200ern in Front. Fairerweise muss man sagen, dass selbst mit unseren verschärften Settings Unreal Tournament selbst in 1600x1200 mit einer GeForce3 Ti200 noch gut spielbar bleibt.
Quake III Arena
Quake 3 Arena verwendet ausschließlich OpenGL zur Grafikdarstellung. Der Ego-Shooter zeichnet sich durch eine verhältnismäßig hohe Anzahl an Polygonen und extrem schnellen Spielablauf aus. Ab einer Auflösung von 1024x768x32 ist die Anforderung an die Speicherbandbreite der Grafikkarte besonders hoch. Getestet wurde mit dem Point Release 1.30 und der darin enthaltenen "Four"-Demo exklusiv unter maximal im Menü einstellbarer Qualität.
Quake III Arena v1.30 32Bit
Angaben in Bildern pro Sekunde (FPS)
|
"Bang!" dachten wir uns, was haben wir falsch gemacht, dass die Karten gerade beim sehr frameratenfreudigen Quake III Arena dermaßen dicht beieinander liegen? Die Antwort ist einigermaßen simpel: Im Gegensatz zu in paar anderen bekannten Websites testen wir (bis auf vSync) so, wie wir auch spielen. Das bedeutet, der Sound bleibt eingeschaltet, auch wenn er, wie hier, 25% an Leistung kostet. "Schuld" an diesem Ergebnis ist nämlich zu einem Gutteil der onboard Sound, der, durch die CPU berechnet, auf diese Weise doppelte Bandbreite kostet und dass auch noch in mehrfachem Anteil, den er bei normalem Spielbetrieb verbrauchen würde. In Quake III Arena läuft das Timedemo, wie viele sicher wissen, so schnell ab, wie der Computer es darstellen kann. Dabei werden keine Soundeffekt ausgelassen, so dass bei angenommener fünffacher Abspielgeschwindigkeit auch die fünffache Belastung durch den Sound entsteht.
So kommt es, dass sich die GeForce4 Ti-Karten erst vergleichsweise spät absetzen können.
Serious Sam
Serious Sam ist ebenfalls ein beliebter OpenGL Ego Shooter mit eigener 3D-Engine. Getestet wurde hier mit dem Benchmarking Script 32 Bit HQ++ von 3DCenter [8] (alles 32 Bit Max,32 Bit Texturen, etc.). Das Demo war eine „Friedliche Nacht in Karnak“.
Serious Sam v1.02 32Bit
Angaben in Bildern pro Sekunde (FPS)
|
Auch in dem, verglichen mit Quake III Arena, deutlich anspruchsvolleren Szenario, welches Serious Sam selbst in der ersten Version bietet, tragen die V8460 ultra und die V8440 von Asus einen ungefährdeten Start-Ziel-Sieg davon, diesmal jedoch schon mit deutlichem Abstand von der niedrigsten getesteten Auflösung an. Wie in Quake III Arena dürstet es auch den ernsten Samuel mehr nach Speicherbandbreite als nach allem anderen und die zu liefern sind die GeForce4 Ti Produkte im Stande.
Max Payne
Max Payne nutzt die Max-FX Engine, wie sie auch schon im 3DMark2001 verwendet wurde. Es werden hohe Anforderungen an die Hardware gestellt, da sehr komplexe und aufwendige 3D Effekte verwendet werden. Trotz einiger verwendeter DirectX 8.0 Funktionen, wird jedoch noch statisches T&L gemäß DirectX 7.0 verwendet. Zum Einsatz kam der PCGH-Benchmark Mod mit dem VGA Demo als Timedemo, gebencht wurde ausschliesslich in 32 Bit Farbtiefe, mit 32 Bit Texturen. Dem Einen oder Anderen mögen die erzielten Frameraten etwas niedrig erscheinen - der Bench ist wirklich so knallhart!
Max Payne v1.02 32Bit
Angaben in Bildern pro Sekunde (FPS)
|
Max Payne ist wiederum ein Beispiel für eine Limitierung ausserhalb des Grafiksystems, auch wenn die Fronten von Anfang an klar abgesteckt sind, können sich die teuereren Neuerscheinungen nur relativ spät und relativ unspektakulär von der alten Garde absetzen, sogar die GeForce4 MX440 hält noch einigermaßen das Tempo.
FSAA Performance
Kommen wir nun zum Thema Full Screen Anti Aliasing. Seit Einführung der GeForce3 beherrschen Chips von nVidia nicht mehr nur das klassische Supersamplingverfahren, welches das Bild intern komplett in einer höheren Auflösung berechnet und es dann herrunterskaliert und über den Framebuffer an den RAMDAC ausgibt. Qualitativ ist das Verfahren recht hochwertig, benötigt nur leider eine Menge an Leistung, was nicht weiter verwundert, bewirkt das Verfahren sogar noch mehr Aufwand, als tatsächlich in einer höheren Auflösung zu spielen. GeForce3 und GeForce4 (MX und Ti) verwenden aus Performance-Gründen ein Verfahren namens Multisampling, das nur an den Kanten der Objekte einer Szene wirkt. Der Vorteil daran ist, dass die störenden Treppchen-Artefakte nun mit deutlich erhöhter Performance geglättet werden. Der Nachteil daran ist, dass die Texturen komplett unbehandelt bleiben.



Von links nach rechts sieht man denselben Ausschnitt aus einem Bild ohne FSAA, mit 4x Multisampling und mit 4x Supersampling. Der beschriebene Effekt ist an der Textur des Daches besonders gut zu erkennen, aber auch die Bodentextur unterhalb des schwarzen Balkens (einer Deichsel) ist deutlich geschärft aus dem Supersampling-Prozess hervorgegangen.
Das Pixelflimmern und die erhöhte Texturschärfe bei klassischem Supersampling muss man bei GeForce3/4 also mit anderen Mitteln erreichen. Eines dieser Mittel ist Anisotropische Filterung, deren Hinzuschaltung nur leider wieder Leistung kostet und beim GeForce4MX auch nur in einer einzigen Stufe verfügbar ist, während GeForce3 und GeForce4 Ti vier Stufen anbieten.
Ferner haben die Chips der GeForce4-Serie den Vorteil, dass sie bei 2xMSAA und beim Quincunx-AA einen Schreibzugriff auf den Framebuffer sparen, dabei aber laut nVidia nicht, wie vormals behauptet, das Bild erst im RAMDAC zusammenmischen. Auf Screenshots, die mittels der "Druck"-Taste erstellt wurden und somit den Framebufferinhalt kopieren, ist der Antialiasing-Effekt nichtsdestotrotz leider nicht zu sehen. Dieses nur als Vorbemerkung, bevor wir zur reinen Leistungsschau kommen.
3DMark 2001 SE + FSAA
Für die Benchmarks zum FSAA haben wir uns ein paar ganz spezielle Kandidaten herausgepickt und diese vermessen. Aufgrund der extremen Vielzahl der erforderlichen Meßwerte waren die ursprünglich erstellten Diagramme leider aufgrund ihrer Verteilung über mehrere Bildschirmseiten kaum zu gebrauchen. Deswegen sind wir auf die tabellarische Darstellung ausgewichen.
Zuerst der 3DMark2001 SE, bei dem die GeForce4 MX440 wie immer ohne die Nature-Test Punkte auskommen muss, weil ihr die Pixelshader- und die hier nicht relevante Vertexshaderfunktionalität fehlen.
| Kein FSAA | 2x FSAA | Quinc.-FSAA | 4xFSAA | 4xS-FSAA | |
|---|---|---|---|---|---|
| Asus V8460 ultra | 9541 | 8295 | 8227 | 5726 | 5427 |
| Asus V8440 | 9090 | 7720 | 7796 | 5068 | 4800 |
| GF4 Ti4200 (250/222) | 8667 | 6465 | 6440 | 4025 | 3830 |
| GF4 Ti4200 (225/250) | 8548 | 7140 | 7139 | 4541 | 4251 |
| GeForce3 | 7215 | 5358 | 4816 | 3401 | 3232 |
| GeForce3 Ti200 | 6644 | 4753 | 4273 | 2977 | 2812 |
| GeForce4 MX440 | 5434 | 3537 | 3542 | 1907 | 1925 |
Die Abstufungen zwischen den Geforce4 Modellen sind nahezu linear, auch wenn sich das Topmodell jeweils deutlich absetzen kann. Interessant zu sehen ist, dass auf der Asus V8460 ultra 4xS-FSAA quasi "for free" zu haben ist, wenn man den Wert der gut ein Viertel so teuren MX440 ohne FSAA zugrunde legt. Auch kann in dieser Auflösung ohne FSAA noch der höhere Chiptakt den entscheidenden Unterschied zugunsten der Geforce4 Ti4200 (250/222MHz) ausmachen, mit zugeschaltetem FSAA jedoch ändert sich das Blatt drastisch und auch in der nächsthöheren Auflösung ist Speicherbandbreite durch nichts zu ersetzen.
| Kein FSAA | 2x FSAA | Quinc.-FSAA | 4xFSAA | 4xS-FSAA | |
|---|---|---|---|---|---|
| Asus V8460 ultra | 8896 | 7473 | 7577 | 4463 | 4219 |
| Asus V8440 | 8555 | 6901 | 6906 | 3876 | 3670 |
| GF4 Ti4200 (250/222) | 7716 | 5348 | 5339 | 2976 | 2842 |
| GF4 Ti4200 (225/250) | 7821 | 6225 | 6204 | 3453 | 3237 |
| GeForce3 | 6625 | 4550 | 4040 | 2678 | 2548 |
| GeForce3 Ti200 | 6064 | 3988 | 3549 | 2342 | 2222 |
| GeForce4 MX440 | 4938 | 2896 | 2893 | 1523 | 1531 |
Deutlich zu sehen wird bereits hier der deutlich höhere Anspruch, den die 1152er Auflösung sowohl an das Speicherinterface und Bandbreite stellt, als auch, im Falle der mit Pixelshadern versehenen GeForce3 und GeForce4 TI, an den Chiptakt, nimmt doch der Unterschied zur shaderlosen MX440, die ohne FSAA nur 500 Punkte verliert und mit 4xS-FSAA weniger als 400 Punkte, bereits ab.
| Kein FSAA | 2x FSAA | Quinc.-FSAA | 4xFSAA | 4xS-FSAA | |
|---|---|---|---|---|---|
| Asus V8460 ultra | 8132 | 6433 | 6512 | 3402 | 3215 |
| Asus V8440 | 7639 | 5743 | 5727 | 2930 | 2783 |
| GF4 Ti4200 (250/222) | 6677 | 4219 | 4220 | 2208 | 2110 |
| GF4 Ti4200 (225/250) | 6901 | 5071 | 5068 | 2593 | 2445 |
| GeForce3 | 5686 | 3587 | 3174 | 2047 | 1942 |
| GeForce3 Ti200 | 5303 | 3140 | 2769 | 1788 | 1694 |
Spätestens hier wird deutlich, dass die GeForce4 Ti4200 mit 128MB, also der 250/222MHz-Taktung in hohen FSAA-Modi (4x/4xS) nicht wirklich bedeutend schneller ist, als eine GeForce3 geschweigedenn eine GeForce3 Ti500. Die GeForce4 MX440 wurde an dieser Stelle aus dem Wettbewerb gestrichen, da auch beim besten Willen bei dieser Beanspruchung durch hohe Auflösung und FSAA im 3DMark2001 SE keine akzeptable Peformance, besonders in den qualitativ höherwertigen 4x-FSAA-Modi zu erreichen war.
| Kein FSAA | 2x FSAA | Quinc.-FSAA | 4xFSAA | 4xS-FSAA | |
|---|---|---|---|---|---|
| Asus V8460 ultra | 6777 | 4167 | 3845 | 2184 | 2062 |
| Asus V8440 | 6166 | 3586 | 3336 | 1849 | 1759 |
| GF4 Ti4200 (250/222) | 5159 | 2752 | 2569 | 1374 | 1315 |
| GF4 Ti4200 (225/250) | 5462 | 3157 | 2895 | 1631 | 1537 |
| GeForce3 | 4659 | 2418 | 2135 | ---- | ---- |
| GeForce3 Ti200 | 4140 | 2114 | 1866 | ---- | ---- |
4xFSAA in 1600x1200x32Bit bleiben aufgrund des reinen Framebufferumfanges eine Domäne der mit 128MB ausgestatteten Karten. Die mit 64MB ausgestatteten Karten verweigerten hier den Dienst. Durch die Bank bis hin in die 1280er Auflösung war zu sehen, dass das von nVidia gegebene Versprechen, Quincunx-FSAA würde im Vergleich zu 2xFSAA nun keine zusätzliche Leistung mehr kosten, eingehalten worden. Nur in der Königsauflösung tritt zunehmend auch die verfügbare Füllrate (zu sehen daran, dass auch die V8460 ultra mit 50MHz höherem Speichertakt dieselben 300 Punkte verliert, wie die anderen GeForce4-Karten) als limitierendes Element auf und verursacht einen zusätzlichen Leistungsverlust.
Quake III Arena + FSAA
Und hier die OpenGL-Variante unter Quake III Arena. In OpenGL ist der, zumindest für GeForce3-Karten inoffizielle 4xS-Modus nicht verfügbar, die Tabellen werden also ein kleines bißchen übersichtlicher.
| Kein FSAA | 2x FSAA | Quinc.-FSAA | 4xFSAA | |
|---|---|---|---|---|
| Asus V8460 ultra | 152,2 | 152,0 | 151,6 | 115,0 |
| Asus V8440 | 152,0 | 150,6 | 150,6 | 98,4 |
| GF4 Ti4200 (250/222) | 151,6 | 128,0 | 127,9 | 74,9 |
| GF4 Ti4200 (225/250) | 151,8 | 146,8 | 146,5 | 88,0 |
| GeForce3 | 151,1 | 94,6 | 77,7 | 65,7 |
| GeForce3 Ti200 | 143,8 | 85,2 | 69,5 | 59,1 |
| GeForce4 MX440 | 132,9 | 82,8 | 82,8 | 41,9 |
Hier sieht man zweierlei recht deutlich: Erstens wird die GeForce4 (und wohl auch die GeForce3) durch unser Testsystem deutlich ausgebremst (aber das war auch vorher schon klar) und zweitens interessiert bei Quake III Arena nichts anderes als die Speicherbandbreite. Die Ti4200 hat keine Chance gegen ihre mit höherem RAM-Takt versehene Schwester. Eindrucksvoll, was die Asus-Karten zu leisten im Stande sind. 150fps mit Quincunx Anti-Aliasing sind sicher auch für Profi-Quake ausreichend.
| Kein FSAA | 2x FSAA | Quinc.-FSAA | 4xFSAA | |
|---|---|---|---|---|
| Asus V8460 ultra | 151,7 | 148,6 | 148,6 | 86,6 |
| Asus V8440 | 151,1 | 140,4 | 140,3 | 73,9 |
| GF4 Ti4200 (250/222) | 148,4 | 103,1 | 103,0 | 55,1 |
| GF4 Ti4200 (225/250) | 150,1 | 119,5 | 119,5 | 65,9 |
| GeForce3 | 142,0 | 75,5 | 62,1 | 48,3 |
| GeForce3 Ti200 | 127,9 | 68,4 | 55,7 | 44,1 |
| GeForce4 MX440 | 114,6 | 66,8 | 66,9 | 32,8 |
Auch hier gilt das oben Erwähnte, allerdings wird die Luft für die GeForce3 und GeForce4 MX langsam aber sicher dünner bei Nutzung von 4xFSAA.
| Kein FSAA | 2x FSAA | Quinc.-FSAA | 4xFSAA | |
|---|---|---|---|---|
| Asus V8460 ultra | 149,8 | 131,8 | 131,7 | 65,1 |
| Asus V8440 | 146,6 | 113,8 | 113,5 | 55,2 |
| GF4 Ti4200 (250/222) | 127,8 | 79,6 | 79,6 | 41,1 |
| GF4 Ti4200 (225/250) | 139,0 | 90,4 | 90,4 | 49,2 |
| GeForce3 | 119,8 | 57,9 | 47,6 | 35,2 |
| GeForce3 Ti200 | 105,3 | 50,1 | 41,3 | 30,7 |
Auch für Hartgesottene reicht die Leistung der älteren GeForce3-Karten bei 4xFSAA nun kaum noch aus, um ein erträgliches Spielerlebnis zu ermöglichen, einzig das Topmodell von Asus, die V8460 ultra schafft es, oberhalb der 60fps-Grenze zu bleiben.
| Kein FSAA | 2x FSAA | Quinc.-FSAA | 4xFSAA | |
|---|---|---|---|---|
| Asus V8460 ultra | 134,7 | 73,1 | 63,1 | 43,1 |
| Asus V8440 | 120,8 | 62,0 | 54,8 | 36,3 |
| GF4 Ti4200 (250/222) | 95,3 | 46,2 | 42,5 | 26,8 |
| GF4 Ti4200 (225/250) | 106,0 | 54,8 | 47,3 | 32,2 |
| GeForce3 | 88,3 | 35,8 | 29,9 | - |
| GeForce3 Ti200 | 76,4 | 31,4 | 26,3 | - |
Auch das 550€-Ungetüm kann hier keine wirklich ruckelfreien Frameraten mehr liefern, sofern man die maximal einstellbare Qualität zugrunde legt. Für ein gepflegtes Spiel mit 2xFSAA reichte auch die V8440 noch knapp aus.
Über die gesamte Quake III Arena Palette sticht eines heraus: Die LMA-II Optimierungen der GeForce4 Ti scheinen zu greifen. Selbst die mit 222MHz langsamer getaktete Variante der Ti4200 kann sich nicht nur in den 2x und Quincunx-Modi, wo sie aufgrund ihres verbesserten Accuview einen Schreibzugriff auf das RAM einsparen kann, sondern auch in dem gleichartig ausgeführten 4x-Modus mit mindestens 6fps von der GeForce3 distanzieren.
Giants + FSAA
Giants in seiner Eigenschaft als Low-FPS Game, welches darüberhinaus noch CPU-limitiert ist, eignet sich natürlich geradezu hervorragend, um die nicht umsetzbare Mehrleistung moderner Grafikkarten in eine erhöhte Bildqualität umzumünzen.
| Kein FSAA | 2x FSAA | Quinc.-FSAA | 4xFSAA | 4xS-FSAA | |
|---|---|---|---|---|---|
| Asus V8460 ultra | 63,87 | 56,79 | 56,71 | 43,16 | 42,75 |
| Asus V8440 | 62,00 | 54,00 | 53,89 | 39,37 | 39,02 |
| GF4 Ti4200 (250/222) | 57,80 | 47,09 | 47,11 | 32,78 | 32,49 |
| GF4 Ti4200 (225/250) | 59,25 | 50,99 | 50,96 | 36,16 | 35,85 |
| GeForce3 | 56,14 | 42,14 | 39,78 | 29,55 | 28,83 |
| GeForce3 Ti200 | 52,35 | 39,01 | 36,31 | 27,38 | 25,71 |
| GeForce4 MX440 | 52,11 | 39,62 | 39,63 | 26,64 | 26,60 |
| Kein FSAA | 2x FSAA | Quinc.-FSAA | 4xFSAA | 4xS-FSAA | |
|---|---|---|---|---|---|
| Asus V8460 ultra | 60,72 | 52,42 | 52,22 | 35,77 | 35,56 |
| Asus V8440 | 58,59 | 48,89 | 48,86 | 32,12 | 31,96 |
| GF4 Ti4200 (250/222) | 54,30 | 41,31 | 41,27 | 25,65 | 25,43 |
| GF4 Ti4200 (225/250) | 55,60 | 45,70 | 45,64 | 29,12 | 28,89 |
| GeForce3 | 52,98 | 36,98 | 33,97 | 24,29 | 24,11 |
| GeForce3 Ti200 | 48,95 | 34,03 | 30,87 | 22,30 | 21,21 |
| GeForce4 MX440 | 48,47 | 35,52 | 35,52 | 22,68 | 22,65 |
| Kein FSAA | 2x FSAA | Quinc.-FSAA | 4xFSAA | 4xS-FSAA | |
|---|---|---|---|---|---|
| Asus V8460 ultra | 56,43 | 45,16 | 45,16 | 28,79 | 28,64 |
| Asus V8440 | 53,92 | 41,17 | 41,07 | 25,17 | 25,13 |
| GF4 Ti4200 (250/222) | 49,40 | 32,87 | 32,90 | 19,91 | 19,82 |
| GF4 Ti4200 (225/250) | 50,87 | 37,78 | 37,77 | 22,65 | 22,25 |
| GeForce3 | 48,66 | 31,39 | 28,20 | 19,24 | 19,23 |
| GeForce3 Ti200 | 44,35 | 27,85 | 24,97 | 16,78 | 16,80 |
| Kein FSAA | 2x FSAA | Quinc.-FSAA | 4xFSAA | 4xS-FSAA | |
|---|---|---|---|---|---|
| Asus V8460 ultra | 49,85 | 34,05 | 32,02 | 19,93 | 19,89 |
| Asus V8440 | 46,69 | 29,95 | 28,05 | 17,06 | 17,01 |
| GF4 Ti4200 (250/222) | 41,60 | 23,79 | 22,52 | 13,27 | 13,25 |
| GF4 Ti4200 (225/250) | 43,90 | 26,91 | 25,00 | 15,10 | 15,06 |
| GeForce3 | 41,48 | 23,91 | 18,59 | - | - |
| GeForce3 Ti200 | 37,41 | 20,98 | 18,59 | - | - |
Bei aller Liebe, aber in 1600x1200 ist 4xFSAA selbst auf den modernsten GeForce4-Karten keine Option. Zu stark brechen die Frames auf unter 20 Bilder pro Sekunde ein. Von Quincunx ist von der Leistung her nicht unbedingt abzusehen, allerdings tritt bei Giants besonders stark der Blurring-Effekt dieses FSAA-Modus' auf, so dass Texturen schon im nahen Sichtbereich sehr stark an Detailzeichnung verlieren. Bleibt als Alternative noch 2xFSAA, das zumindest auf den beiden Karten von Asus noch einigermaßen spielbare Bildwiederholraten erreicht. Mit einer GeForce4 Ti4200 egal welcher Ausprägung kann es dagegen schon einmal eng und damit ruckelig werden.
Anisotropes Filtern
Die zuvor erwähnten Nachteile (oder besser: nicht vorhandenen Vorteile), die Multisampling bei der Behandlung der Texturen während des FSAA innewohnen, lassen die Bildqualität von Multisampling nicht mit der des klassischen Supersampling vergleichbar erscheinen. Seit dem GeForce3 jedoch besitzen die DirectX-8 Chips von nVidia die Fähigkeit, echtes anisotropes Filtern durchzuführen. Auch der GeForce2-Kern und mit ihm die GeForce4 MX-Serie war in begrenztem Umfang dazu in der Lage.
Was bedeutet es nun anisotrop zu filtern? Wörtlich bedeutet es, in verschieden Richtungen der Messung mit unterschiedlichen Eigenschaften zu filtern. Üblicherweise werden für jedes bilinear gefilterte Pixel die unmittelbar benachbarten Pixel zur Mittelung des Farbwertes herangezogen. Bei trilinearem Filter werden an den MipMap-Übergängen darüberhinaus Farbwerte aus den verschiedenen MipMap-Stufen genutzt.
Anisotropes Filtering nutzt nun im Gegensatz zu den beiden beschriebenen Methoden nicht nur die in unmittelbarer Nachbarschaft liegenden Pixel zur Bildung eines Farbmittelwertes, sondern meist in die "tiefe" des Bildes hineingehend, zusätzliche Farbwerte und vermeidet so weitgehend die bekannte Unschärfe bei weit entfernten Texturen und störendes Pixelflimmern, welches durch Multisampling allein (im Gegensatz zu Supersampling) nicht verhindert wird.





Besonders gut zu erkennen ist die Wirkung von anisotropem Filter auf den Bodenkacheln in der hinteren Region.
Es gibt verschieden Ansätze, anisotrope Filterung zu realisieren. nVidia verwendet das rechnerisch aufwendigere Verfahren, welches echtes anisotropes Filtern in Verbindung mit trilinearem Filter ermöglicht. ATi hingegen setzt auf einen adaptiven Algorithmus, der nur in den Bildteilen anisotrop filtert, in denen es auch wirklich Vorteile bei der Bildqualität bringt. Offensichtlich wirkt sich äußerst positiv auf die Gesamtleistung in Verbindung mit anisotropem Filtern aus. Leider geschieht dies nur in Verbindung mit bilinearem Filter, so dass unter gewissen Umständen die Bildqulität darunter leiden kann.
Eine kleine Anmerkung sei hier noch gemacht: In den Treibern sowohl von nVidia selbst als auch von Asus ist bislang keine Möglichkeit vorgesehen, den Level des AF unter Direct3D einzustellen. Man muss hierfür entweder selbst Hand an die Registry anlegen oder einen der üblichen Tweaker (Rivatuner, nVMax oder GTU) verwenden.
3DMark 2001 SE + AF
Zuerst, wie üblich der Standard-Benchmark diesen und letzten Jahres, der 3DMark2001 SE.
3DMark2001 SE +AF
Angaben in Punkten
|
Bedenkt man die geringen Verluste, die ATis Radeon8500 beim Einsatz von anisotropem Filter erleidet, schneidet die GeForce4 hier nicht gerade berauschend ab. Einer der Gründe ist, das das "echte" anisotrope filtern, wie es der GeForce durchführt, der andere wird aus folgender Grafik ersichtlich.
3DMark 2001 Füllrate
Angaben in Punkten
|
Ganz offensichtlich nutzt der GeForce4-Chip aus irgendeinem Grunde seine zweite TMU (Texture Mapping Unit) bei gleichzeitiger Durchführung von anisotropem Filtern nicht. Dies ist keine Fehlfunktion unseres Testsamples und tritt mit den verwendeten offiziellen Treibern und auch dem neuen, inoffiziellen Detonator 28.90 auf.
Quake III Arena + AF
Quake III Arena kann dank der ohnehin schon hohen Frameraten auch ruhig als Opfer für bildqualitätssteigernde Maßnahmen herhalten. Auch beim Einsatz von anisotropem Filter bleibt der Shooter durchgehend flüssig zu spielen. Ob man die deutlich gesteigerte Texturqualität in der Hitze des Gefechtes auch wahrnehmen kann, steht auf einem anderen Blatt.
Quake III Arena +AF
Angaben in Bildern pro Sekunde (FPS)
|
Am extrem bandbreitenhungrigen Quake III Arena lässt sich ziemlich deutlich zeigen, dass die Leistung der Karten mit zugeschaltetem anisotropen Filter durch den Grafikchip, bzw. dessen Taktfrequenz bestimmt wird. So überholt die TI4200 mit nur 222MHz Speichertakt ihre in Quake III Arena eigentlich schnellere Schwester dank ihres höher getakteten Chips.
Nach Abschluss der Tests (als sich immer deutlicher der Bug bezgl. AF und Multitexturing abzeichnete wegen dem wir auch mit nVidia Rücksprache hielten) leakte "zufällig" ein neuer Referenztreiber von nVidia mit der Versionsnummer 28.90. Den haben wir noch schnell mit GL_Extreme nachgetestet und hier ist das Ergebnis.
GL_Extreme Füllrate mit "Det.28.90"
Angaben in Punkten
|
Das Problem ist unter OpenGL also mittlerweile aus der Welt geschafft, und im Gegenteil scheint sogar das Multitexturing in Verbindung mit anisotropem Filter ausgesprochen gut zu funktionieren. In Kürze werden wir für Quake III Arena + AF noch einen kurzen Nachtrag nachreichen.
Giants + AF
Giants +AF
Angaben in Bildern pro Sekunde (FPS)
|
Nur die Asus V8460 ultra schafft es, den niedriger getakteten TI4200-Karten quasi eine ganze Qualitätsstufe abzunehmen und kann teilweise gefährlich nah an ihre kleine Schwester aus gleichem Hause bei höherer Qualität heranrücken. Der Rest der Ergebnisse bietet keine Überraschungen.
FSAA und AF kombiniert
Für die einen mag es wie Overkill erscheinen, aber gerade das Folgende ist der Grund, sich alle Jahre wieder auf die Suche nach einer neuen Grafikkarte zu machen: Die bestmögliche Bildqualität. Und wie wäre die wohl zu erreichen, wenn man nicht Full-Screen Anti-Aliasing mit anisotroper Filterung kombinierte?
| 2xFSAA | Asus V8460 ultra | Asus V8440 | GF4 Ti4200 (250/222) | GF4 Ti4200 (225/250) |
|---|---|---|---|---|
| + 0xAF | 8295 | 7720 | 6465 | 7140 |
| + 2xAF | 7093 | 6374 | 5620 | 5575 |
| + 4xAF | 6111 | 5556 | 4768 | 4832 |
| + 8xAF | 5484 | 4959 | 4216 | 4315 |
Auch wenn 2xFSAA alleine nur relativ wenig Leistung bei den neuen GeForce4-Karten kosten mag, zusammen mit anisotropem Filter sieht die Sache schon ein wenig anders aus. Allerdings muss man auch das sehr hohe Niveau sehen, von dem ausgehend der Leistungsverlust zustande kommt. Im Endeffekt ist das Resultat eine hohe Bildqualität auf immer noch hohem Leistungsniveau.
| QC-FSAA | Asus V8460 ultra | Asus V8440 | GF4 Ti4200 (250/222) | GF4 Ti4200 (225/250) |
|---|---|---|---|---|
| + 0xAF | 8227 | 7796 | 6440 | 7139 |
| + 2xAF | 6957 | 6360 | 5629 | 5584 |
| + 4xAF | 6076 | 5535 | 4763 | 4835 |
| + 8xAF | 5475 | 4953 | 4213 | 4304 |
Das Werbeversprechen von nVidia ist erfüllt. Quincunx-Anti Aliasing kostet gegenüber 2xFSAA nur verschwindend wenig Leistung. Ob jedoch das mehr an Kantenglättung das Weniger an Texturenschärfe aufwiegt, muss jeder selber entscheiden.
| 4xFSAA | Asus V8460 ultra | Asus V8440 | GF4 Ti4200 (250/222) | GF4 Ti4200 (225/250) |
|---|---|---|---|---|
| + 0xAF | 5726 | 5068 | 4025 | 4541 |
| + 2xAF | 5193 | 4569 | 4009 | 3787 |
| + 4xAF | 4657 | 4109 | 3567 | 3474 |
| + 8xAF | 4248 | 3748 | 3219 | 3169 |
4xFSAA bietet in Kombination mit AF schon eine sehr gute Bildqualität, auch wenn nur die V8440 und die V8460 ultra noch dazu in der Lage sind, wirklich überzeugende Leistung abzuliefern. Mit einer GeForce4 Ti4200 stößt man hier langsam aber sicher an die Grenzen des Sinnvollen.
| 4xS-FSAA | Asus V8460 ultra | Asus V8440 | GF4 Ti4200 (250/222) | GF4 Ti4200 (225/250) |
|---|---|---|---|---|
| + 0xAF | 5427 | 4800 | 3830 | 4251 |
| + 2xAF | 3977 | 3533 | 3019 | 3035 |
| + 4xAF | 3215 | 2874 | 2417 | 2487 |
| + 8xAF | 2848 | 2545 | 2133 | 2212 |
Auch wenn die Bildqualität hier absolut beeindruckend ist, so sind gerade in Verbindung mit 4xS-Anti Aliasing die zusätzlichen Verluste mit zugeschaltetem AF nur noch schlecht zu verschmerzen. Das liegt zum einen daran, dass in allen anderen FSAA-Modi ausschließlich Multisampling benutzt wird, welches im Gegensatz zu AF fast nur die Speicherbandbreite belastet und die beiden Optionen sich quasi von zwei gegenüberliegenden Enden aus durch die zur Verfügung stehende Leistung fressen. Beim 4xS-FSAA wird allerdings z.T. das deutlich speicherintensivere Supersampling genutzt, so dass hier ein negativer Synergieeffekt entsteht, indem bereits anisotrop gefilterte Pixel durch SSAA (Supersampling Anti-Aliasing) erneut bearbeitet werden.
Bildqualität
Eines der meistdiskutierten Themen der letzten Wochen und Monate war und ist die Bildqualität. Natürlich erwartet man bei einer solch hochwertigen Grafikkarte, wie es die GeForce4 Ti (unter anderem) von Asus ist, nicht nur eine hohe Leistung, sondern auch eine einwandfreie Bildqualität. Und dies nicht nur im 3D-Bereich, für den ausschließlich die Implementation der Funktionen im Chip und deren Umsetzung im Treiber verantwortlich ist, sondern auch und besonders auf dem Desktop. Hierfür muss der jeweilige Hersteller der Grafikkarte in die Pflicht genommen werden, da dieses von den auf der Karte verwandten Bauteilen abhängt.
Ohne teures Meßequipment zur Verfügung zu haben um die Signalreinheit zu erfassen, muss hier ein subjektiver Eindrck genügen. Auf dem Testsystem mit einem IIyama Vision Master 451 war die Bildqualität nicht von der der als Referenz geltenden Matrox G400 zu unterscheiden, bis hin zu Auflösungen von 1280x1024 in 100Hz zeichnete sich das kontrastreiche Bild durch eine sehr gute Schärfe und gute Lesbarkeit der Zeichen am Bildschirm aus.
Kommen wir nun zur Bildqualität im 3D-Modus, für den Chip und Treiber verantwortlich zeichnen. Zuerst eine Vergleichsreihe für den anisotropen Filter.




Sehr schön ist hier zu sehen, wie die Detailzeichnung der Texturen mit höheren Leveln der Anisotropie in die Tiefe zunimmt, wobei das Zuschalten des Filters selbst auf der niedrigsten Stufe die deutlichste Verbesserung bringt. Höhere Level kosten zwar sehr viel Leistung, bringen aber im Gegenzug relativ wenig Bildqualität. Nun eine kleine Reihe zum Anti-Aliasing.





Auffällig hier ist, dass es offenbar zwischen dem 2xFSAA und 3xFSAA (Quincunx-Modus) so gut wie keinen sichtbaren Unterschied zu geben scheint. Das würde natürlich erklären, warum der Quincunx-Modus "for free" ist. Erst im 4xS-Modus (6xFSAA) werden die Texturen mitbehandelt, so dass sich bei Verwendung dieses Modus' nicht nur eine Verbesserung der Kantenglättung erzielen läßt, sondern eine insgesamt höhere Bildqualität. Und nun zur Krönung des Ganzen: 4xFSAA plus anisotropem Filter




Aber es geht noch hübscher: 6xFSAA bzw. der 4xS-Modus plus AF.




Da insbesondere zwischen den 4x und 8x AF-Einstellungen im 4xS-Modus kaum Unterschiede zu sehen sind, hier noch zwei letzte Screenshots, Ausschnitte aus dem IQ-Test bei 1920x1440x32 mit 4xS-FSAA und AF:


Die Unterschiede haben wir zum besseren Entdecken ein wenig markiert.
Sämtliche Screenshots auf dieser Seite stammen aus dem Bildqualitätstest (IQ= Image Quality) des 3DMark2001 SE in einer Auflösung von 800x600x32Bit. Die jeweiligen FSAA- und AF-Optionen wurden nicht im 3DMark sondern mit dem Rivatuner eingestellt, deswegen steht oben auch überall NoFSAA, was aber definitv nicht stimmt.
Fazit
Das erste Fazit aus diesem Test ist einfach zu ziehen: Beim nächsten Grafikkartentest brauchen wir ein neues Testsystem, das alte bremst mittlerweile zu stark aus.
Das Zweite und wichtigere fällt ein wenig schwerer. Einerseits wäre da die absolut beeindruckende Geschwindigkeit sowohl der V8440 und besonders der V8460 ultra. Andererseits ist da ein doch recht hoher Preis, der für diese Leistungsreserven zu entrichten ist.
Wer gerade letztes Jahr in den sauren Apfel gebissen hat und sich eine GeForce3 (Ti) oder eine Radeon8500 geleistet hat, wird sich fragen, ob denn die Spirale nie aufhört, sich zu drehen. Jedes Jahr um die 500€ in eine neue Grafikkarte anzulegen können sich wohl nur die Wenigsten auf Dauer leisten.
Davon unabhängig haben wir hier zwei absolute Spitzenprodukte getestet, die den potentiellen Käufer sicherlich nicht enttäuschen dürften und auch in absehbarer Zukunft noch für den einen oder anderen vergnüglichen Spieleabend zu gebrauchen sein werden.
Für Fragen ist wie immer unser Forum [9] zuständig.
- äußerst schnell
- hohe Bildqualität
- hochwertige Kühlung
- hochwertige Verarbeitung
- reichhaltiges Softwarebundle
- gute Hardwarebeigaben
- AF-Performance
- Preis
- AF-Optionen nicht frei zugänglich
- keine TV-out Verlängerung
- extrem schnell
- hohe Bildqualität
- hochwertige Kühlung
- hochwertige Verarbeitung
- reichhaltiges Softwarebundle
- gute Hardwarebeigaben
- AF-Performance
- Preis
- AF-Optionen nicht frei zugänglich
- keine tV-out Verlängerung




