Einleitung
Nach einigen Verzögerungen und Aufschüben präsentieren auch wir endlich unseren Artikel zu ATis und nVidias neuesten Pixelbeschleunigern. Mit Namen heißen diese „Radeon X800 Pro“ und „Radeon X800 XT Platinum Edition“ bei ATi sowie „GeForce 6800 GT“ und „GeForce 6800 Ultra“ bei nVidia. Während wir auf die technischen Daten der X800 [1] und der GeForce 6800 [2] bereits vor einigen Wochen eingegangen sind, wollen wir nun die entsprechenden Benchmarkwerte nachliefern. Zur kurzen Zusammenfassung: Die X800 Pro basiert, ebenso wie die X800 XT, auf dem neu entwickelten R420-Chip. Allerdings besitzt die Pro-Variante nur zwölf Pipelines, das XT-Modell hingegen deren 16, was gleichbedeutend mit der Vollausstattung des Chips ist. Das Kürzel „Platinum Edition“ steht derweil für erhöhte Taktraten, die gegenüber der normalen Radeon X800 XT [3] - diese kommt mit 500/500 MHz zum Kunden - nochmals angehoben wurden. Die GeForce 6800 GT ist mit der Ultra nahezu baugleich und besitzt ebenfalls 16 Pipelines. Sie ist aber niedriger getaktet und belegt keinen PCI-Slot aufgrund eines weniger ausladenden Kühlerdesigns.

An dieser Stelle sei uns nochmals für die Verspätung dieses Artikels vergeben, hat doch das Aufklären diverser Optimierungen an Texturfiltern und LOD-Bestimmung seitens ATi (siehe unsere Artikel: Versteckspiele bei ATis Texturfilter [4], Radeon X800 und die Texturen [5] und Volle Filterung für ATi und nVidia! [6]) in den letzten Tagen und Wochen unsere volle Aufmerksamkeit an sich gerissen. Nun sind wir allerdings in der Lage, unseren Lesern aussagekräftige Werte zu liefern, da wir nun sicherstellen konnten, bei beiden Konkurrenten die volle trilineare Filterung aktivieren zu können und somit denjenigen mit der höheren Leistung zu ermitteln und nicht denjenigen, der stärker optimiert.
Radeon X800-Serie
Die Karte & technische Daten
Nun sind die Karten offiziell und zu allererst müssen wir eine Fehleinschätzung unsererseits eingestehen. Hatten wir noch vor einigen Wochen das in Taiwan aufgetauchte Bild der Radeon X800 [7] als unecht gewertet, werden wir heute eines Besseren belehrt. Nun aber wieder zurück in das Hier und Jetzt und dort gibt es doch wirklich schon Karten des Typs „Radeon X800 Pro“ zu kaufen. Mit folgenden technischen Details, die sich von denen der Radeon X800 XT nur wenig unterscheiden.
ATi hat es, wie wir schon als Möglichkeit einräumten, tatsächlich geschafft, sowohl die Radeon X800 Pro als auch die X800 XT durch die Umstellung des Herstellungsprozesses auf einen 0,13µ-lowK-Prozess der Chipschmiede TSMC und durch die Verwendung von GDDR3-RAM, welches mit deutlich weniger Leistung auskommt, als DDR- oder gar DDR-II RAM, die Leistungsaufnahme des kompletten Boards nicht allzu stark ansteigen zu lassen. Die X800 Pro soll sogar weniger Strom verbrauchen als die Radeon 9800 XT.
Hier haben wir die beiden Chips und Taktraten nochmals im direkten Vergleich. Der Übersicht halber auch noch mal direkt in unserer bekannten Tabelle.
| Radeon 9800 XT |
Radeon X800 Pro |
Radeon X800 XT |
Radeon X800 XT „PE“ |
|
|---|---|---|---|---|
| Chip | R360 | R420 | R420 | R420 |
| Transistoren | ca. 110M | 160M | 160M | ca. 160M |
| Fertigung | 0,15 µm | 0,13 µm lowK copper |
0,13 µm lowK copper |
0,13 µm lowK copper |
| Taktung (MHz) | 412 | 475 | 500 | 520 |
| Renderpipes | 8 | 12 | 16 | 16 |
| Pixelfüllrate | 3296MPix/s | 5700MPix/s | 8000MPix/s | 8320MPix/s |
| TMUs je Pipe | 1 | 1 | 1 | 1 |
| Texelfüllrate | 3296MTex/s | 5700MTex/s | 8000MTex/s | 8320MTex/s |
| Vertexeinheit | DX9 VS 2.0 | DX9 VS 2.0 | DX9 VS 2.0 | DX9 VS 2.0 |
| Vertexpipes | 4 | 6 | 6 | 6 |
| Dreiecksdurchsatz | ca. 412MV/s | ca. 712MV/s | 750MV/s | 780MV/s |
| Texturen pro Pass | 8 (16) | 8 (16) | 8 (16) | 8 (16) |
| Pixelshader | PS 2.0 | PS 2.b | PS 2.b | PS 2.b |
| FP-Einheiten | 3+1 ALU 3+1 Mini ALU 1 TexOp |
3+1 ALU 3+1 Mini ALU 1 TexOp |
3+1 ALU 3+1 Mini ALU 1 TexOp |
3+1 ALU 3+1 Mini ALU 1 TexOpt |
| Speicher (MB) | 256 DDR | 256 GDDR3 | 256 GDDR3 | 256 GDDR3 |
| Anbindung | 256-bit DDR | 256-bit GDDR3 | 256-bit GDDR3 | 256-bit GDDR3 |
| Speichertakt (MHz) | 365 | 450 | 500 | 560 |
| Bandbreite (MB/s) | 23360 | 28800 | 32000 | 35840 |
| SinglePass Texturop. | 16 D3D / 8 (oGL) | 16 (D3D) / 8 (oGL) | 16 (D3D) / 8 (oGL) | 16 (D3D) / 8 (oGL) |
| RAMDAC | 2x400MHz | 2x400MHz | 2x400MHz | 2x400MHz |
| TV-Encoder | integriert | integriert | integriert | integriert |
| Sonstiges | DVD MC/iDCT | DVD MC/iDCT, MPEG2 En- / Decoder, MPEG4 En- / Decoder |
DVD MC/iDCT, MPEG2 En- / Decoder, MPEG4 En- / Decoder |
DVD MC/iDCT, MPEG2 En- / Decoder, MPEG4 En- / Decoder |
| Präz. pro Kanal | 24Bit (FP24) | 24Bit (FP24) | 24Bit (FP24) | 24Bit (FP24) |

Rein äußerlich unterscheiden sich die Radeon X800 Pro und die XT kaum. Beide Modelle besitzen keine passive Ramkühlung und einen sehr leisen, temperaturgeregelten Lüfter, der stark an das Design der Radeon 9800 XT erinnert. Der wirklich wichtigen Unterschiede zwischen den beiden Karten liegen also ausschließlich in den unterschiedlichen Taktfrequenzen und in den aktivierten Quads der Architektur. Während beide Modelle der XT-Serie volle 16 Pipelines besitzen, hat die Pro nur deren zwölf. Die Radeon X800 XT „Platinum Edition“ hebt sich von der regulären XT nur durch die nochmals höheren Taktraten ab.
Weitere Details zur neuen Radeon X800-Serie gibt es in unserem ausführlichen Launchartikel [8] zu dieser Grafikkartengenration.
GeForce 6800-Serie
Die Karte & technische Daten
Der Kühlkörper in doppelter Bauhöhe ließ zunächst ungeahnte Gewichtsdimensionen vermuten, entpuppte sich nach beherztem Zupacken allerdings als ausgesprochenes Leichtgewicht - kein Vergleich zur vorher verbauten FX 5800 Ultra-Lösung. Auch in Sachen Lautstärke zum Glück kaum Parallelen, obwohl uns nach dem ersten Einschalten ein kleiner Schrecken durchfuhr. Auf voller Drehzahl pfiff der Radiallüfter munter vor sich hin, so dass die ansonsten im Zimmer pfeifenden Wellensittiche erstaunt schwiegen. Im Gegensatz zu FX 5800 (Ultra) und FX 5950 Ultra war dieses unangenehme Geräusch jedoch nicht nach wenigen Sekunden beendet. Da zunächst ein Start im VGA-Modus durch den zuvor nicht auf dem Festplatte-Image installierten Treiber nötig war, zog sich dieses Geräusch schier endlos hin.
Nach der Installation des Treiber und dem Laden von Windows XP allerdings regelte der Lüfter, an dessen Stromanschluss noch händisch nachgelötet worden war, auf ein erträgliches, aber durch das weiterhin bestehende, nur leisere Pfeifen nicht eben angenehmes, Geräuschniveau herunter. Für einen Game-Rechner mit leistungsstarkem Netzteil, ebensolchem CPU-Lüfter und eventuell hoch drehenden Festplatten kein Beinbruch. Für ein Allround-System, an dem man auch konzentriert arbeiten möchte, bleibt hingegen auf alternative Kühllösungen seitens der Boardpartner zu hoffen.
Ansonsten zeigte sich das Board unproblematisch. Abstürze waren - trotz eindeutigem Engineering-Sample-Hinweise im BIOS - nicht zu verzeichnen, die Signalqualität an einem der beiden (per Adapter angeschlossenen) DVI-Ausgänge überzeugte ebenfalls an unserem Eizo T965 auch in höchsten Auflösungen durch ein einwandfreies Bild.
Angenehm war, dass sich die Karte trotz furchteinflößender Kühlung kaum erhitzte - hier hat man beim Design auf jeden Fall etwas richtig gemacht. Abschließend noch kurz ein Satz zum Thema Netzteilanschlüsse: Zwingend erforderlich für den Betrieb ist die Bestückung beider vierpoliger Anschlüsse, nicht als unbedingt notwendig herausgestellt hat sich hingegen die Aufteilung dieser auf zwei getrennte und ausschließlich hierfür zur Verfügung stehender Kabelstränge vom Netzteil. Ebenso hatte ein knapp fünf Jahre altes 300W ATX-Netzteil von Fortron keine Probleme, die Karte über mehrere Stunden im 3D-Betrieb zu versorgen.
Der NV40 soll mit einem Rundumschlag nicht nur eine Steigerung gegenüber dem eigenen Vorgänger darstellen, er muss auch gegen den Next-Gen-Chip von ATi bestehen, dem rund die doppelte Leistung der Radeon 9800 Pro nachgesagt wird.
Wie es zu diesem Gerücht kam, wird spätestens klar, wenn man sich die Architektur des NV40 einmal genauer anschaut. Hatten Grafikkarten der letzten Generation noch maximal acht Pipelines, bringt es die GeForce 6800 Ultra auf satte 16. Die maximale Pixelfüllrate spricht eine eindeutige Sprache, manifestiert sich allerdings in der Rekordzahl von mehr als 220 Mio. Transistoren. Zum Vergleich: Ein Intel Pentium 4 „Prescott“-Prozessor bringt es gerade einmal auf 125 Mio., ein Athlon 64 auf 68 bis 106 Mio. Ebenfalls beeindruckend ist die Leistung des verbauten GDDR3-Speichers, der bei der Ultra mit 550 MHz taktet und somit für eine maximale Speicherbandbreite von knapp 35 GB/s sorgt.
| GeForce 4 Ti 4800 |
GeForce FX 5800 Ultra |
GeForce FX 5950 Ultra |
GeForce 6800 GT |
GeForce 6800 Ultra |
|
|---|---|---|---|---|---|
| Chip | NV28 | NV30 | NV38 | NV40 | NV40 |
| Transistoren | ca. 63M | ca. 130M | ca. 135M | ca. 222M | ca. 222M |
| Fertigung | 0,15 µm | 0,13 µm | 0,13 µm | 0,13 µm | 0,13 µm |
| Taktung (MHz) | 300 | 500 | 475 | 350 | 400 |
| Renderpipes | 4 | 4 (8)* | 4 (8)* | 16 (32)* | 16 (32)* |
| Pixelfüllrate | 1200MPix/s | 2000MPix/s | 1900MPix/s | 5600MPixe/s | 6400MPix/s |
| TMUs je Pipe | 2 | 2 | 2 | 1 | 1 |
| Texelfüllrate | 2400MTex/s | 4000MTex/s | 3800MTex/s | 5600MTex/s | 6400MTex/s |
| Vertexeinheit | DX8 VS 1.1 | DX9 VS 2.0+ | DX9 VS 2.0+ | DX9 VS 3.0 | DX9 VS 3.0 |
| Vertexpipes | 2 | 3 (Array) | 3 (Array) | 6 | 6 |
| Dreiecksdurchsatz | ca. 136MV/s | ca. 375MV/s | ca. 356MV/s | ca. 525MV/s | ca. 600MV/s |
| Texturen pro Pass | 4 | 8 (16) | 8 (16) | 8 (16) | 8 (16) |
| Pixelshader | PS 1.3 | PS 2.0+ | PS 2.0+ | PS 3.0 | PS 3.0 |
| FP-Einheiten | - | 1 (Shadercore) | 2 (Shadercore + FPU) | 2 (Shader-Unit 1 & 2)** | 2 (Shader-Unit 1 & 2)** |
| Speicher (MB) | 128 DDR | 128 DDR-II | 256 DDR | 256+ GDDR3 | 256+ GDDR3 |
| Anbindung | 128-bit DDR | 128-bit DDR-II | 256-bit DDR | 256-bit GDDR3 | 256-bit GDDR3 |
| Speichertakt (MHz) | 325 | 500 | 475 | 500 | 550 |
| Bandbreite (MB/s) | 10400 | 16000 | 30400 | 32000 | 35200 |
| SinglePass Texturop. | 4 | 16 (D3D) / 4 (oGL) | 16 (D3D) / 4 (oGL) | 16 (D3D) / 4 (oGL) | 16 (D3D) / 4 (oGL) |
| RAMDAC | 2x400MHz | 2x400MHz | 2x400MHz | 2x400MHz | 2x400MHz |
| TV-Encoder | extern | integriert | integriert | integriert | integriert |
| Sonstiges | DVD MC | DVD MC/iDCT | DVD MC/iDCT | DVD MC/iDCT, MPEG2 En- / Decoder, MPEG4 En- / Decoder |
DVD MC/iDCT, MPEG2 En-/Decoder, MPEG4 En-/Decoder |
| Präz. pro Kanal | 9Bit (FX9) | 32Bit (FP32) | 32Bit (FP32) | 32Bit (FP32) | 32Bit (FP32) |
| * nVidias High-End GPU unterstützen seit dem NV30 ein Verfahren, bei dem in den ROPs am Ende der Pipeline jeweils zwei, anstatt der üblichen einen Z-/Stencilwerte verarbeitet werden können. Solange Pixel also ohne Farbwert auskommen und auch nicht texturiert sind (Stencilschatten und reine Z-Writes) bekommt man zwei Werte pro Takt durch eine physikalische ROP-Pipeline. | |||||
| ** Der NV40 besitzt zwei FP-Einheiten in jeder seiner 16 Pipelines. Allerdings scheint es ebenso vielfältige Möglichkeiten wie Einschränkungen zu geben, um diese gemeinsam zu nutzen. Nur die wenigsten der komplexeren Shader-Instruktionen können auf beiden wirklich parallel und ohne irgendwelche Abhängigkeiten laufen. | |||||
nVidia hat mit dem Design des NV40 anscheinend nicht gekleckert, sondern geklotzt. Vielleicht, weil man sich nach dem Rückstand im letzten Jahr in Zugzwang sah. Vielleicht aber auch, weil man von ATis Next-Gen-Chip, dem R420, viel erwartete.
Weitere Details zur neuen GeForce 6800-Serie gibt es in unserem ausführlichen Launchartikel [1] zu dieser Grafikkartengeneration.
Testsystem
Wieder einmal kommt unser aktuelles Testsystem auf Pentium 4-Basis mit HT-Support für das Review zum Einsatz.
Hier ein kleiner Überblick über das System:
- CPU:
- Pentium 4 3,00GHz [9] (200MHz FSB QDR)
- Motherboard:
- Intel D875 PBZ [10] mit BIOS B03 vom 15.3.2003
- Arbeitsspeicher:
- 2*512MB OCZ DDR550 DDR-RAM [11] mit 2,5-5-3-3 Timing
- Grafikkarte:
- ATi Radeon X800 Pro 256 MB GDDR3, Catalyst 4.5, 475 MHz GPU und 450 MHz RAM
- ATi Radeon X800 XT „Platinum Edition“, Beta-Catalyst 4.5, 520 MHz GPU und 560 MHz RAM
- GeForce 6800 Ultra 256MB GDDR3, inoffz. FW61.34, 400 MHz GPU, 550 MHz RAM
- GeForce 6800 GT 256MB GDDR3, inoffz. FW61.34, 350 MHz GPU, 500 MHz RAM (simuliert mit GF 6800 Ultra)
- Inno3D GF FX 5950 Ultra [12] 256MB DDR, inoffz. FW60.72, 300/475 MHz GPU, 475 MHz RAM
- PNY GF FX 5800 Ultra [13] 128MB DDR II, inoffz. FW60.72, 300/500 MHz GPU, 300/500 MHz RAM
- PowerColor Radeon 9800 Pro [14] 256MB DDR II, offz. Cat4.4, 380 MHz GPU, 340 MHz RAM
- Connect3D Radeon 9700 Pro [15] 128MB DDR, offz. Cat4.4, 325 MHz GPU, 310 MHz RAM
- Gigabyte Radeon 9600 Pro [16] 128MB DDR, offz. Cat4.4, 400 MHz GPU, 300 MHz RAM
- Creative GF4 Ti 4800 [17] 128MB DDR, inoffz. FW60.72, 300 MHz GPU, 325 MHz RAM
- Peripherie
- Western Digital WD800JB (80 GB, 7200 rpm, 8 MB Cache)
- Pioneer DVD U03S
- Adaptec 2940UW SCSI-Controller
- Creative Labs SoundBlaster Live! Player
- Onboard CSA-GBit LAN
- Sonstiges
- A4 Tech Double Wheel Mouse
- Software
- WindowsXP Professional SP1
- DirectX 9.0b
- Intel Chipset Utility v5.00.1012
Benchmarks
Wir haben uns trotz oftmals vorhandener CPU-Limitierung dagegen entschieden, die 1024er-Auflösung aus dem Programm zu nehmen um so auch die Spieler zu erreichen, die beispielsweise ein auf diese Auflösung festgelegtes TFT-Display besitzen. Ebenso haben wir uns gegen 1280x960 und für 1280x1024 entschieden, weil eine zunehmende Menge an TFTs eben dies als native Auflösung bieten und damit auch überwiegend nutzen. Schließlich und endlich kommen die High-End-TFT-Besitzer und Röhrenfans mit der 1600er-Auflösung auf ihre Kosten. Obwohl auch 2048x1536 teilweise noch möglich wäre, kann schon ein durchschnittlicher 19"-Röhrenmonitor mit 96kHz Zeilenfrequenz für 1600x1200 ausreichen.
Zum Vergleich und damit die ermittelten Werte nicht komplett im leeren Raum stehen, haben wir diverse Topmodelle aus den letzten Jahren noch mit in den Vergleich aufgenommen. Die GeForce 4 Ti 4800 als Repräsentantin der alten DirectX 8-Garde und deren leistungsfähigsten Vertreter. Die Radeon 9600 XT als ähnlich leistungsstarkes, aktuelles Mid-Range-Modell mit mehr als nur der Option auf DirectX 9. Die beiden Topmodelle der GeForce FX-Reihe 5800 Ultra (originale CineFX-Architektur und vielfach als Sargnagel nVidias gehandelt) und FX 5950 als gründlich aufpoliertes Modell, das durchaus in einigen Bereichen mit der Radeon 9800 XT, die als leistungsfähigster Refresh der Radeon 9700 Pro, dem Urvater der DirectX-9-Chips, den preislich und leistungsmäßig direkten Vorgänger der X800-Reihe stellt.
Für unsere kleine Leistungsschau verwenden wir folgende Programme:
- MDolenc's Fillrate Tester
- Testet die Füllrate unter Verwendung verschiedener Arten von Shadern
- VillageMark
- HSR- und Füllraten-Test mit enorm viel Overdraw und dreifachem Multitexturing
- Fablemark
- Ein Programm, das stark von Stencilperformance profitiert und durch Soft-Shadows massiv transparenten Overdraw besitzt
- Templemark
- Multitexturing-Test mit viel Overdraw und aufwendigen Texturoperationen
- Far Cry
- Einer der aktuell aufwendigsten Shooter mit hochprozentigem Shadereinsatz, großen Arealen und guten Spezialeffekten
- Spellforce: Order of Dawn
- Basiert auf der k.r.a.s.s.-Engine, die auch Aquanox2 und den Aquamark3 befeuert und enthält einige der längsten Shaderprogramme
- Tomb Raider: Angel of Darkness
- Besser bekannt als TRAOD konnte dieser Titel eher durch seine frühe Adaption von DirectX9 als durch seine spielerischen Qualitäten überzeugen. Großflächiger 2.0-Shadereinsatz ist hier Programm.
- Delta Force: Black Hawk Down
- Basiert auf der Engine von NovaLogic und ersetzt das schon recht angegraute Comanche4 mit Pixelshader-Effekten und einer Vielzahl an Einheiten auf dem Bildschirm
- UT2003 Pyramid-Timedemo der Vollversion
- Sehr aktueller, weil vielgespielter Benchmark mit großen Anforderungen an die Grafikkarte bzw. das Gesamtsystem
- Max Payne
- In der Hauptsache zwar „nur“ DirectX7, aber trotzdem recht anspruchsvoll, sowohl was Textur- als auch Partikeloperationen angeht
- Max Payne II: The Fall of Max Payne
- Wie der Vorgänger eine „Film Noir“-Story, diesesmal aber gewürzt mit einigen Pixelshader-Effekten einschließlich PS2.0
- Call of Duty
- Wie auch das nachfolgende „Alice“ auf der Quake3-Engine basierend bietet CoD den bislang höchsten Augenschmaus in dieser Sparte.
- Alice
- Selten genutzt, aber grafikintensiv wie kaum ein anderes Spiel mit der Quake3-Engine
Treiber und Einstellungen
Generell haben wir mit den höchstmöglichen Qualitätseinstellungen im Treiber getestet und auch in den Benchmarks sind grafisch möglichst fordernde Einstellungen gewählt worden. Ausnahmen werden explizit vermerkt.
Leider machen uns sowohl nVidia als auch ATi das Leben immer schwerer, die höchstmögliche Qualität auch wirklich auf den Bildschirm zu bekommen. Selbst bei High-End-Karten wird im Kampf um teilweise wenige Prozentpunkte an Leistung die Filterqualität reduziert oder werden Filteranweisungen schlicht umgangen.
Für die GeForce-FX-Generation konnten die Optimierungen in Direct3D sowohl mit dem genutzten als auch mit dem offiziell angebotenen Treiber der Version 56.72 nicht umgangen werden und aus Gründen der Vergleichbarkeit und der Kontinuität haben wir dies unter OpenGL, wo es mittels externer Programme noch möglich ist, bleiben gelassen.
Mit dem mittlerweile aufgetauchten ForceWare-Treiber der Version 61.34 ist es nunmehr möglich, alle bekannten Optimierungen der Texturfilter zu deaktivieren - leider kam dieser Treiber zu spät, um noch für alle Karte im Test Berücksichtigung zu finden, weswegen nur die neuen GeForce 6800-Karten in den „Genuß“ kamen, wirklich überall die maximale, vom Chip her mögliche Bildqualität liefern zu müssen.
Ebenso optimiert ATi die anisotrope Texturfilterung zusätzlich zur bekannten Winkelabhängigkeit, die nun leider auch die GeForce 6-Serie „bietet“, mit der Reduzierung aller Texturstufen außer der ersten auf bilinear-anisotrope Filterung. Auch wenn sich hierdurch in den Qualitätsbenchmarks möglicherweise ein größerer Vorteil ergibt, haben wir darauf verzichtet, diese Option zu deaktivieren, um wenigstens dem Umstand nicht negativ Rechnung zu tragen, dass man diese Deaktivierungsmöglichkeit hat!
Für die Radeon 9600 und die beiden X800-Karten gab es (bis vor kurzem unbekannt) noch weitere Optimierungen in Form einer - ähnlich wie bei nVidia - Reduzierung des trilinearen Anteils am Gesamtbild und eine Verringerung der genutzten Sampleanzahl zum Filtern der Basistextur. Während bei einer Budget- oder Mid-Range-Karte zum erreichen spielbarer Frameraten so eine Optimierung noch in Grenzen sinnvoll erscheinen mag, sind wir der Meinung, dass man sich High-End-Karten zulegt, um mit maximal möglicher Bildqualität zu spielen. Wir haben aus diesem Grunde die Optimierungen bei der Radeon X800 XT „PE“ deaktiviert. Die Sapphire X800 Pro hingegen kam noch in den Genuß aller Optimierungen, da zum Testzeitpunkt noch nicht bekannt war, wie man diese umgehen konnte.
Update: Der obige Absatz ist mißverständlich formuliert. Ganz deutlich ausgedrückt sollte es heißen, die X800 Pro war bereits wieder auf dem Weg zurück an Sapphire, als wir herausfanden, wie die Optimierungen abzustellen sind. Die Registry-Einträge hierfür sollten natürlich auch bei einer X800 Pro ihre Wirkung tun.
Nach einigem Hin und Her war es uns nun endlich möglich, alle Optimierungen sowohl auf Karten von ATi als auch nVidia zu deaktivieren, um möglichst vergleichbare Bedingungen zu erreichen - die verbleibenden Unterschiede in der Bildqualität sind, so noch vorhanden und wahrnehmbar, auf die Auslegung der Hardware zurückzuführen und nicht auf die angebotene Qualität im Treiber, die in vielen Fällen nur dazu dienen soll, mit einem möglichst langen Balken im Benchmarkdiagramm zu protzen. Wie wir dies erreicht haben, klärten wir bereits vor einigen Tagen in einem kurzen Artikel zum Thema Filterung [5].
Wir möchten uns an dieser Stelle noch einmal ausdrücklich für das Kuddelmuddel bezüglich Treiber- und Optimierungsunterschiede entschuldigen, sehen aber leider keine andere Möglichkeit, zumindest zeitnah einen Test zu bringen, der komplett identische Bedingungen bei allen Teilnehmern schafft. Die Hauptakteure in Form der Spitzenmodelle Radeon X800 XT PE und GeForce 6800 Ultra sind nun jedenfalls sehr gut vergleichbar.
Folgende Optimierungen sind bisher bei den jeweiligen Chipherstellern bekannt und ab Werk im Treiber aktiviert:
ATi:
- Stage-Optimierung:
Existiert auf allen Radeon-Karten im Testfeld, wirkt nur bei anisotroper Filterung. Filtert nur die erste Texturschicht mit trilinear und AF. Alle weiteren Texturschichten bekommen nur noch bilinear und AF. Nachteil: Sichtbares Mip-Banding bsw. bei Detail-Texturen. - Reduzierung des Trilinearen Filters:
Existiert auf Radeon 9600- und X800-Serien und ist immer wirksam. Die Übergänge zwischen zwei Mip-Stufen einer Textur werden nur noch in einem schmaleren Streifen trilinear gefiltert. Der Bereich, wo nur bilinear gefiltert wird, steigt an. Nachteil: Mip-Banding kann sichtbar werden. - Reduzierung der Sampelzahl innerhalb der Basistextur:
Existiert auf Radeon 9600- und X800-Serien und ist immer wirksam. Wirkt ähnlich wie die folgende LOD-Optimierung, allerdings nur innerhalb der Basistextur dicht am Point-of-View im Bild. Die Schwelle, ab der eine höhere Samplezahl zur Texturfilterung genutzt wird, wird nach hinten geschoben - man braucht in der Summe weniger Textursamples und spart Leistung. Nachteil: Unterfilterung und damit evtl. Texturflimmern. - LOD-Optimierung: Existiert bislang nur bei der X800-Reihe und ist nur bei anisotroper Texturfilterung aktiv. Ähnlich wie die vorige Optimierung werden auch hier die Schwellen, ab denen eine Erhöhung der Textursamplezahl nötig wird, weiter nach hinten ins Bild hinein geschoben. Nachteil: Unterfilterung und damit evtl. Texturflimmern.
nVidia:
- Stage-Optimierung:
Existiert auf GeForce FX- und 6800-Karten im Testfeld, von Treiber zu Treiber unterschiedlich und wirkt nur bei anisotroper Filterung. Filtert nur die erste Texturschicht mit trilinear und AF. Alle weiteren Texturschichten bekommen nur noch bilinear und AF. Nachteil: Sichtbares Mip-Banding bsw. bei Detail-Texturen - Reduzierung des Trilinearen Filters:
Existiert auf GeForceFX- und 6800-Karten und ist immer wirksam. Die Übergänge zwischen zwei Mip-Stufen einer Textur werden nur noch in einem schmaleren Streifen trilinear gefiltert. Der Bereich, in dem nur bilinear gefiltert wird, steigt an. Nachteil: Mip-Banding kann sichtbar werden. - Reduzierung der Sampelzahl innerhalb der Basistextur:
Existiert auf GeForce FX- und 6800-Karten und ist immer wirksam. Wirkt ähnlich wie die folgende LOD-Optimierung, allerdings nur innerhalb der Basistextur dicht am Point-of-View im Bild. Die Schwelle, ab der eine höhere Samplezahl zur Texturfilterung genutzt wird, wird nach hinten geschoben - man braucht in der Summe weniger Textursamples und spart Leistung. Nachteil: Unterfilterung und damit evtl. Texturflimmern.
Der Übersicht halber noch einmal eine Liste, welche Karten mit welchen Einstellungen getestet wurden.
- Radeon X800 XT PE: alle bekannten Optimierungen aus
- Radeon X800 Pro: lediglich die Stage-Optimierung des AF wurde umgangen
- GeForce 6800 Ultra & GT: alle bekannten Optimierungen aus
- Radeon 9800XT/9700: Texture-Stage Optimierung des AF an
- GeForce FX 5800u/5950: Optimierung des trilinearen Filters und AF an
- Radeon 9600 XT: Reduzierung des trilinearen Anteils am Gesamtbild an
- GeForce 4 Ti 4800: keine Optimierungen der Texturfilter bekannt
An dieser Stelle sei nochmals darauf hingewiesen, dass die Radeon X800 Pro zwar mit dem aktuellen Catalyst-Treiber [18] 4.5 zusammenarbeitet, die X800 XT „Platinum Edition“ auf diesem allerdings nicht ihren Dienst verrichten mochte. Hier kam der von ATi bereitgestellte Beta-Catalyst-Treiber zum Einsatz. Zum offiziellen Launch der XT-Karten musste ATi also noch einen frei zugänglichen Catalyst-Treiber nachreichen, der auch diese Grafikkarten unterstützt, was mit dem kürzlich erschienenen Catalyst-Treiberpaket 4.6 erfolgt ist.
Synthetische Benchmarks
Shader-Füllrate
- Dieses nützliche kleine Programm dient dazu, die Füllraten einer Grafikkarte zu messen. Im Gegensatz zu den bzw. im 3DMark integrierten Füllraten-Tests, die im Fall von Single-Texturing vornemlich die Bandbreite messen, kann dieses Programm recht differenzierten Aufschluss über verschiedene Arten von Füllrate geben, unter anderem auch die Pixelshader-Füllraten, welche wir hier betrachten wollen.
Da die verwendeten Shader teilweise recht kurz und bandbreitenintensiv sind, haben wir die Auflösung möglichst weit erhöht, um den Fokus etwas mehr auf die Füllrate zu verlagern. Da hier mehrere mathematische Operationen pro Pixel nötig sind, wird die Füllrate durch die Erhöhung der Auflösung stärker belastet, als die Bandbreite.
Getestet wurde in 1600x1200 in 32Bit mit 24Bit Z- und 8Bit Stencilbuffer und 60 Hz Refreshrate. - Weitere Informationen: keine
- Download: Fillrate Tester [19]
MDolenc Fillrate Tester PS1.1
Angaben in Punkten
|
Die GeForce-6-Serie ist hier deutlich gehandicapt und kann nur einen Bruchteil ihrer nominellen Füllrate erreichen. Die Radeon X800 XT „PE“ hingegen zieht mit doppelt so viel Leistung davon. Selbst eine X800 Pro, von der Füllrate her eigentlich deutlich unter den mit 16 Pipelines bestückten GeForces, kann diese hier um ~30 % abhängen. Da verwundert es kaum, dass die GeForce auch mit steigenden Bandbreitenanforderungen durch Anti-Aliasing nicht weiter einbricht, obwohl dies eigentlich geschehen müsste, wie die X800 XT beweist - die X800 PRO hingegen ist für ihre Füllrate mit reichlich Bandbreite ausgestattet.
MDolenc Fillrate Tester PS1.4
Angaben in Punkten
|
Unter Verwendung von Pixelshadern der Version 1.4 scheint die Limitierung, die die GeForce geärgert hatte, nicht mehr zuzuschlagen. Hier verhalten sich die vier Karten der neuen Generation entsprechend ihrer Füllrate, wobei deutlich wird, dass die Radeon X800 XT „PE“ für ihre massive Shaderleistung kaum genug Speicherbandbreite aufbringen kann. Entsprechend stark fällt sie ab, wenn man zusätzlich Anti-Aliasing aktiviert und kann bei 4xAA nur noch 10 % ihrer ehemals 30 % Vorsprung vor der 6800 Ultra ins Ziel retten.
MDolenc Fillrate Tester PS2.0
Angaben in Punkten
|
Dasselbe Verhalten wie mit Pixelshadern 1.4 ist auch mit unkomplizierten 2.0-Shadern zu beobachten. Auch fällt auf, dass die GeForce 6-Karten keinerlei Vorteile durch reduzierte Genauigkeit, gekennzeichnet durch „PP“ in den Diagrammen, erfahren.
MDolenc Fillrate Tester PS2.0 Longer
Angaben in Punkten
|
Auch geringfügig längere 2.0-Shader offenbaren noch keine Unterschiede bei den Karten der 2004er-Generation. Außer den der längeren Abarbeitungszeit geschuldeten, allgemein niedrigeren Füllraten und der Tatsache, dass die X800 XT „PE“ ihre Füllratenvorteile auch mit höheren AA-Modi umsetzen kann.
MDolenc Fillrate Tester PS2.0 Longer 4 Registers
Angaben in Punkten
|
Auch mit ehemals kritischen 4 Temp-Registern, traditionell ein knappes Gut in der DX9-GeForce-Architektur, wie an den älteren Karten zu sehen, kommt die aktuelle Generation ohne Probleme zurecht. Den Radeons haben viele Temp-Register allerdings noch nie viel ausgemacht.
MDolenc Fillrate Tester PS2.0 per Pixel Lighting
Angaben in Punkten
|
Auch mit schon recht anspruchsvoller per-Pixel-Beleuchtung tun sich die aktuellen Karten nicht viel - Unterschiede werden größtenteils über die zur Verfügung stehende Shader-Füllrate und damit, zwischen 6800 Ultra und X800 XT PE, die Taktfrequenz definiert.
Interessant ist hier der ausnehmend starke Zuwachs der GeForce 6 Karten durch „Partial Precision“. Wie wir im Forum des 3DCenter [20] erfuhren, kann der im Treiber enthaltene Shader-Compiler wohl schon bestimmte Befehlsfolgen in Shadern erkennen. In diesem Falle konnten die drei Anweisungen
Zitatdp3_pp r1.w, t1, t1
rsq_pp r1.w, r1.w
mul_pp r1.xyz, t1, r1.w
in eine einzige
Zitatnrm_pp r1.xyz, t1
umgewandelt werden, die der nV40 mit reduzierter Genauigkeit („PP“) sogar noch nebenbei, nahezu ohne größeren Aufwand, ausführen kann.
HSR-Füllrate
- Dieser Benchmark wurde von PowerVR entwickelt und diente dazu, die Vorzüge des Kyro 2 zu verdeutlichen, da im VillageMark der Overdraw mit einem Faktor von bis zu 10 besonders groß ist. Viele, besonders ältere Grafikkarten, berechnen hier auch die Oberflächen, die durch andere verdeckt sind und daher eigentlich nur verschwendete Bandbreite und Füllrate bedeuten, so dass dieser grafisch eigentlich nicht sehr aufwendige Benchmark doch öfter als man zunächst denkt zu einem Stolperstein wird. Deswegen ist es von größter Bedeutung in diesem Benchmark, eine gut funktionierende Technik zum Entfernen verdeckter Oberflächen (HSR = Hidden Surface Removal) zu besitzen.
Getestet wurde mit folgender Kommandozeile: [InstallDir]\D3DVillagemark.exe -benchmark=1 -width=xxxx -height=xxxx -bpp=32" - Weitere Informationen: PowerVR.com [21]
- Download: PowerVR.com [22]
VillageMark v1.20 1024 default
Angaben in Bildern pro Sekunde (FPS)
|
Kaum kommen wir von Shadern zu texturierten Oberflächen, die dann auch noch trilinear gefiltert werden, gibt es die erste Überraschung. Trotz 46 % höherer, nomineller Füllrate gegenüber der Radeon X800 Pro muss sich die X800 XT „PE“ dieser geschlagen geben, da wir bei der kleineren Karte die Optimierungen nicht deaktivierten.
Dass es um die Texturcache-Anbindung im Chip oder die Ansteuerung durch den Treiber noch nicht optimal bestellt ist, zeigt hingegen deutlich der Vergleich der X800 XT „PE“ zur GeForce 6800 GT, die nahezu dieselbe Texelfüllrate wie die X800 Pro besitzt, aber ohne Optimierung antritt.
VillageMark v1.20 1024 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Schaltet man jedoch FSAA und AF hinzu, kann sich bei der daraus resultierenden, stärkeren Belastung die X800 XT ihrer ungenutzten Reserven profitbringend bedienen und lässt die GeForce hinter sich. Ein unverhältnismäßig hohes Resultat erreicht die mit Optimierungen laufende X800 Pro hier ein weiteres Mal.
VillageMark v1.20 1280 default
Angaben in Bildern pro Sekunde (FPS)
|
An dieser Stelle sei vorerst ein letztes Mal auf die FPS-Gewinne durch die Optimierung des Texturfilters hingewiesen. Wie man an der absoluten Spitze sieht, braucht die X800 XT „PE“ in diesem Test 30 % mehr Füllrate, um die 6800 Ultra knapp zu schlagen.
Direkt dahinter aber genügt der optimiert laufenden X800 Pro dieselbe Füllrate wie die der 6800 GT, um mit dieser Schritt zu halten.
VillageMark v1.20 1280 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Keine neuen Erkenntnisse bringt die Erhöhung der Auflösung in Sachen gesteigerter Bildqualität. Durch höhere Taktraten (respektive Optimierung) können sich die Radeon X800-Karten zum Teil deutlich von ihren GeForce 6 Pendants absetzen.
VillageMark v1.20 1600 default
Angaben in Bildern pro Sekunde (FPS)
|
Das schon für die 1280er-Auflösung Gesagte trifft auch hier 1:1 zu.
VillageMark v1.20 1600 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Hier beginnt bereits die Bandbreite die Kandidaten einzuschränken, so dass die FPS-Unterschiede nicht mehr ganz so ausgeprägt ausfallen - wie wohl noch immer deutlich zu erkennen.
Z/Stencil-Füllrate
- Der Fablemark wurde, wie auch der nachfolgende Templemark, von PowerVR entwickelt und dient trotz eines sehr hohen Anteils an Overdraw der Zurschaustellung der Stärken des Kyro-Chips was den Stencil-Buffer angeht.
Natürlich wird auch auf allen anderen Karten die Stencil-Performance stark gefordert, so dass dieser Test ein Indiz für kommende Spiele sein kann, die vor dem eigentlichen Rendering einen Z-/Stencil-only Pass einlegen, um vorab jeglichen Overdraw zu vermeiden. John Carmack von id-Software programmiert gerade so eine Engine für sein nächstes Spiel, welches noch in diesem Jahr erscheinen soll.
Getestet wurde mit folgender Kommandozeile: [InstallDir]\D3DFablemark.exe -benchmark=1 -width=xxxx -height=xxxx -bpp=32" - Weitere Informationen: PowerVR.com [23]
- Download: PowerVR.com [24]
FableMark v1.0 1024 default
Angaben in Bildern pro Sekunde (FPS)
|
Im FableMark schlägt deutlich die Stunde der Z-/Stencil-Optimierung der GeForce-Karten, die hier eine doppelt so hohe Füllrate für farblose Pixel ins Feld führen können wie die jeweiligen Radeon-Karten. Da jedoch auch Speicherbandbreite stark und Textureinheiten ein wenig belastet werden, gestaltet sich das Endergebnis doch recht erträglich.
FableMark v1.0 1024 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Beim Zuschalten von 2xFSAA sollte eigentlich die Stunde der Radeon schlagen, denn unter diesem Umstand kann sie eigentlich mit zwei Stencil-Operationen pro Takt und Pipeline aufwarten und ihre Füllratenvorteile, die wir unten noch sehen, ausspielen. Doch das Gegenteil ist der Fall und selbst einer GeForce 6800 GT muss sich das kanadischen High-End-Flaggschiff hier geschlagen geben.
FableMark v1.0 1280 default
Angaben in Bildern pro Sekunde (FPS)
|
Auch hier vermögen 170 MHz mehr GPU-Takt und eine höhere Speicherbandbreite auf Seiten der Radeon es nur knapp, den zweiten Platz hinter der 6800 Ultra gegen die 6800 GT zu verteidigen. Da die Texturierung im FableMark nur einen sehr geringen Anteil an der Gesamtperformance hat, gewinnt man einen guten Eindruck von der echten Leistungsfähigkeit der Radeon X800 Pro, obwohl sie auch hier mit Optimierungen antritt.
FableMark v1.0 1280 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Auch hier gibt es nicht mehr viel anzumerken. Wäre der FableMark ein Spiel, könnte man sagen, die Unterschiede zwischen den jeweiligen Konkurrenten sind zwar vorhanden, tun der Spielbarkeit aber keinen Abbruch. Nur sollten sie umgekehrt ausfallen - zumindest im Falle X800 XT und 6800 Ultra.
FableMark v1.0 1600 default
Angaben in Bildern pro Sekunde (FPS)
|
Das gewohnte Bild: der höhere Takt der X800 XT kann die Stenciloptimierung der GeForce nur knapp aufwiegen.
FableMark v1.0 1600 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Hiermit dürfte wohl ein Indiz feststehen: Wenn Doom3 nicht massiv shaderlimitiert sein wird, dürften die Radeons es schwer haben, mit der Konkurrenz in dem Spiel mitzuhalten. Vielleicht ist allerdings auch nur der Treiber nicht ganz ausgereift, wenn es darum geht, Z-/Stencilfüllrate mit Texturfüllrate zu kombinieren, denn...
MDolenc Fillrate Tester Z-/Stencil
Angaben in Punkten
|
... wie wir hier sehen, bestätigen die Ergebnisse ohne FSAA das im FableMark gewonnene Bild. Ganz anders jedoch sieht es aus, sobald durch FSAA die spezielle Stenciloptimierung der GeForces ausgehebelt wird - die Radeons sortieren sich dort ein, wo man es anhand der theoretischen Leistungsdaten erwarten würde.
Treiberbug im FableMark oder ein generelles Problem, Stenciloperationen mit Texturzugriffen gemeinsam zu nutzen?
Multitexturing-Füllrate
- Der Templemark ist, genau wie der vorherige Fablemark, ursprünglich ein Demonstrationsprogramm von PowerVR gewesen. Da er jedoch eine Menge aktueller Features, wie Hardware-TnL, Bump Mapping und bis zu sechs Texturlagen in einem Durchgang unterstützt, eignet er sich auch gut als unabhängiger Benchmark, der garantiert nicht auf nVidia- oder ATi-Chips optimiert ist.
Getestet wurde mit folgender Kommandozeile: [InstallDir]\templedemov1-0-6.exe -benchmark" - Weitere Informationen: PowerVR.com [25]
- Download: PowerVR.com [26]
TempleMark v1.06
Angaben in Bildern pro Sekunde (FPS)
|
Glaubten wir Anfangs noch, mit rund 215 FPS am Systemlimit angekommen zu sein, bewiesen uns die 6800er GeForces, dass auch hier noch etwas die Radeons davon abhält, ihrem vollen Potential zu entsprechen.
Interessant, aber für das Doppel-Duell an der Spitze unerheblich, ist der Treiberfehler, der die Radeon 9700 Pro (und nur diese!) in dem Raum mit dem Wasserbassin zu einem deutlich sichtbaren Einbruch in der FPS-Rate zwingt. Dies trat auch mit älteren Catalyst-Treibern auf, so dass hier offenbar ein Workaround für einen Fehler entfernt wurde, der bsw. im Chip der Radeon 9800 XT nicht mehr enthalten ist.
TempleMark v1.06 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Auch mit FSAA und AF, traditionellen Vorteilen in Sachen Leistung bei den Radeons, können diese zwar die alten Karten deutlich hinter sich lassen, aber erst mit unseren Maximaleinstellungen wirklich zur GeForce 6800 Reihe aufschließen.
MDolenc Fillrate Tester Triple-Texturing
Angaben in Punkten
|
Einen Teil der Erklärung für vorangegangene Phänomene bieten die Texturing-Tests aus MDolencs Füllraten-Tester. Je höher die Last auf die gesamte Karte wird, desto weniger stark können sich in diesem Test die Radeons in Szene setzen und bleiben hinter den Erwartungen zurück.
MDolenc Fillrate Tester Quad-Texturing
Angaben in Punkten
|
Bei vier genutzten Texturlagen verdeutlicht sich das zuvor gewonnene Bild nochmals - besonders die X800 Pro kann hier kaum überzeugen.
Doch lassen wir die graue Theorie hinter uns, da an dieser sowieso niemand Spielfreuden erleben wird und wenden uns echten Games zu - denn darauf kommt es an!
Spiele-Benchmarks
Far Cry v1.1
- Hinweis: Far Cry bietet standardmäßig in der Version 1.1 auf Grafikkarten mit einem Chip von nVidia leider nur eine unzureichende Bildqualität, die bei weitem nicht an das heranreicht, was man auf ATi-Karten betrachten kann. Wir hoffen, dass die Entwickler dieses Spiels diesen Umstand mit einem späteren Patch zumindest für GeForce 6800-Karten aus der Welt schaffen, denn vor allem der NV40-Chip hat mit Sicherheit die Leistung, die eine Darstellung aller Details ermöglicht.
Um bei diesem Umstand, der Far Cry als Benchmark relativ wertlos machen würde, zumindest auf der GeForce 6800 Abhilfe zu schaffen, haben wir uns der Patch-DLLs [27] von Tommti-Systems bedient. Wie auf Nachfrage zu erfahren war, zwingen diese Dateien alle Karten in den R300-Modus und sind somit ein Garant für volle Bildqualität. Da allerdings auch ein anderer Schattenmodus, sowie eine Radeon-gerechte Shadersortierung genutzt wird, handelt es sich hierbei um eine Art Worst-Case Szenario für die GeForce 6800. - Far Cry bietet, entwickelt in Deutschen Landen, momentan den höchsten optischen Genuss in der Shooterlandschaft und lässt sich diese Pracht auch mit teils großem Hardware-Hunger bezahlen. Die Einstellungen wurden im Spielmenü maximal gewählt, alle Settings standen dabei auf „Very High“, Wasser, welches in unserer Demo allerdings nicht vorkommt, auf „Ultra High“ und als Texturfilter war trilinear ausgewählt. Da die AA und AF-Einstellungen in Far Cry nicht den gewohnten Methoden folgen, haben wir die anisotrope Filterung dem Treiber überlassen. Die FSAA-Modi wurden ebenfalls per Treiber erzwungen, da ATi- und nVidia-Karten unterschiedlich auf „Low, Medium und High“ reagieren. Eine Ausnahme stellte hier das 4xAA der nV-Karten dar, da hier der Treiber zu große Buffer zuweist, die die Performance stark beschneiden. Hier, und nur hier, haben wir auf die in-Game Einstellung zurückgegriffen.
Unsere Demo ist eine Aufzeichnung von mehr als 5000 Bildern, die bei einem Durchlauf durch den von Gegnern befreiten und per aktiver Taschenlampe erhellten „Kühlraum“-Level gerendert werden wollen. Dabei kommen sowohl sehr große Innenräume, als auch haufenweise per Pixelshader berechnete Bildpunkte zum Einsatz.
Weitere Informationen: www.farcry.de [28] - Download: Gamershell.com (Demo) [29]
Far Cry v1.1 CB_Cooler 1024
Angaben in Bildern pro Sekunde (FPS)
|
Wie oben schon beschrieben, nutzten wir Patch-DLLs, um zumindest den vier Karten, um die es hauptsächlich geht, speziell den GeForce 6800-Karten, in Sachen Shaderdarstellung Manieren beizubringen. Wie auch schon ausgeführt, ist eine durchgehende FP32-Berechnung zwar wünschenswert, wenn sie aber ohne die passende Schattierungstechnik und dazu noch auf dem Renderpfad der Konkurrenz erfolgt, eine etwas einseitige Darstellung. Der Vollständigkeit halber haben wir also sowohl die FP32- als auch die FP16-erzwingende DLL eingesetzt, die sich hier als grauer Balken mit reduzierter Genauigkeit widerspiegelt.
Nur mit Hilfe dieses Modus kann die GeForce 6800 Ultra einigermaßen mit der führenden Radeon X800 XT mithalten, ansonsten sind schon in der niedrigsten von uns getesteten Auflösung 10 fps Rückstand festzustellen. Die in Sachen Füllraten und eingeschränkt auch Shaderleistung etwas vergleichbareren Statthalter sind hier bei DX9-Full-Precision gleichauf, wobei die Radeon X800 Pro noch den Vorteil aktiver Optimierungen hat.
Far Cry v1.1 CB_Cooler 1024 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Da wir Far Cry ursprünglich ohne FSAA und AF testen wollten und uns erst später entschlossen haben, diese Settings hier mit aufzunehmen, fehlen leider die Werte der X800 Pro, die unser Testlabor leider zu früh wieder verlassen hat, um noch nachgetestet zu werden. Wir bitten dies zu entschuldigen.
Aber auch so sieht man deutlich, dass mit gesteigerter Bildqualität der Vorsprung der Radeon X800 XT PE immer prozentual immer deutlicher wird, so dass wir bei 4xAA und maximalem AF, einer Einstellung wo auch FP16 ud FP32 bei der GeForce kaum noch einen Unterschied machen, bereits bei den nominellen 30 % Vorsprung durch Taktrate angelangt sind.
Far Cry v1.1 CB_Cooler 1280
Angaben in Bildern pro Sekunde (FPS)
|
Auch hier wieder zeigt sich, dass ATi mit der Radeon X800 XT „PE“ ein eindeutiges Zeichen gesetzt hat und deutlich macht, dass man nicht gewillt ist, die Performancekrone wieder abzugeben. Selbst mit FP16-Renderpfad, der im Mittel übrigens nicht oder nur kaum langsamer ist, als der offizielle GeForce-Pfad im Patch 1.1, aber deutlich besser aussieht, kann die 6800 Ultra nicht an die „XT PE“ heranreichen. Etwas weiter unten, im auch preislich für ein Großteil der Käufer sicherlich interessanteren Gebiet, schenken sich GT und Pro dagegen kaum etwas. Architekturelle Vorteile sind also kaum zu attestieren.
Far Cry v1.1 CB_Cooler 1280 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Die Differenz zwischen GeForce 6800 und Radeon X800 XT „PE“ wird hier bereits interessanter als die akademischen zehn Bilder Differenz in Bereichen, wo es trotz allem noch gut spielbar bleibt. Die 10 fps, die sich hier auftun, insbesondere mit 4xAA und maximalem AF, werden bei dem einen oder der anderen sicherlich den Ausschlag geben, das Spiel noch in diesen Settings zu spielen, oder lieber doch etwas herunterzuschalten.
Far Cry v1.1 CB_Cooler 1600
Angaben in Bildern pro Sekunde (FPS)
|
Wer bereit ist, auf acht Bit pro Farb- und Transparenz-Kanal zu verzichten, kann hier durchaus einiges an Performance herausschlagen. Dabei sind allerdings die acht Bit Differenz zwischen nVs FP32 und ATis FP24 deutlich ausschlaggebender, als diejenigen zwischen FP24 und FP16 auf der anderen Seite, denn selbst so kommt nVidias 6800 Ultra kaum an die X800 XT „PE“ heran. Wie schon zuvor ist das Duell der kleineren Ableger äußerst knapp und trotz deaktivierter Optmierungen vermag die 6800 GT die X800 Pro in Schach zu halten.
Far Cry v1.1 CB_Cooler 1600 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Eher akamdemischer Natur, wenn auch prozentual am ausgeprägtesten, sind die Unterschiede in 1600x1200 mit aktivem FSAA und AF, wobei man mit 2xAA und 2xAF auf der X800 XT „PE“ eventuell noch zufrieden sein dürfte - so denn das Ausgabegerät da noch mitspielt.
Spellforce
- Wie das vorhergehende Far Cry ein deutsches Gewächs, präsentiert sich Spellforce als hardwaremordender Genre-Mix aus Echtzeitstrategie und Rollenspiel, in welchen der Avatar, die Spielfigur des Spielers, sich mit fortschreitender Story auch weiterentwickelt und in seinen Kampf- und Magieeigenschaften verbessern kann.
Die Auswahl zwischen Draufsicht und Third-Person Perspektive auf die mit der mit der k.r.a.s.s.-Engine dargestellte Spielwelt sowie die vielen, gut animierten Einheiten und die detailreiche und mit hübschen, stimmungsvollen Texturen verzierte Landschaft fordert sowohl die Grafikkarten als auch die CPU. Ein ausreichend ausgebauter Hauptspeicher tut ein Übriges.
Zur Ermittlung der durchschnittlichen Frameraten haben wir uns der Intro-Sequenz, die sowohl Ausblicke in die weitläufige Landschaft als auch Nahansichten von Charakteren und einige Spezialeffekte bietet, nach übersprungenem Tutorial bedient. Alle in-Game Optionen standen dabei auf höchster Stufe, die Texturfilterung war auf trilinear eingestellt. FSAA und AF wurde per Treiber erzwungen.
Weitere Informationen: www.spellforce.de [30] - Download: Gamershell.com (Demo) [31]
SpellForce: Order of Dawn 1024 default
Angaben in Bildern pro Sekunde (FPS)
|
Etwas mehr als 10 % Vorsprung vor der Radeon X800 XT „PE“ kann hier die GeForce 6800 Ultra für sich verbuchen - erstaunlicherweise allerdings schafft dies auch die niedriger getaktete GT und verweist im internen Duell die X800 Pro mit über 20 % auf die Plätze.
SpellForce: Order of Dawn 1024 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Auch FSAA und AF, die zumindest bei einsetzender CPU-Limitierung nivellierend wirken sollten, tun hier ihr möglichstes, um die Unterschiede gar noch anwachsen zu lassen. Die beiden X800-Karten verlieren absolut und proportional stärker an Leistung als die GeForce 6800-Geschwister, die bei 4xAA und maximalem AF mehr als 50 % Vorsprung erzielen.
SpellForce: Order of Dawn 1280 default
Angaben in Bildern pro Sekunde (FPS)
|
Auch in 1280x1024, der nächsthöheren Auflösung, wendet sich das Blatt nicht in die erwartete Richtung. Die Unterschiede werden - im Gegenteil - sogar noch größer. Da allerdings im unteren Segment auch die GeForce FX-Karten mehr als nur mit den R3x0-Chips auf Radeon 9700 Pro und Radeon 9800 XT mithalten, drängt sich der Verdacht auf, dass hier eventuell der Treiber ein besseres Abschneiden der Radeons verhindert.
SpellForce: Order of Dawn 1280 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
In 1280 mit 4xAA verlässt so langsam aber sicher die komplette Radeon-Riege, inklusive des Top-Modells, den spielbaren Bereich. 2xAA und 2xAF dagegen vertragen auch diese Karten noch hinreichend in diesem, ihnen ganz offensichtlich nicht liegenden, Spiel.
SpellForce: Order of Dawn 1600 default
Angaben in Bildern pro Sekunde (FPS)
|
Das gute Abschneiden der GeForce4 Ti erklärt sich damit, dass ihr leistungsraubende Pixelshader 2.0-Effekte abgehen und sie somit, bei reduzierter Qualität konkurrenzfähig selbst zu modernen Karten bleibt. Angenehm spielbar ist Spellforce in dieser Auflösung allerdings nur noch auf den aktuellen Geschossen bis einschließlich der X800 Pro.
SpellForce: Order of Dawn 1600 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Während die Spielbarkeit in höchsten Einstellungen auch auf dem Spitzenreiter in Sachen Performance ziemlich knapp wird, bietet sich hier allerdings ein ziemlicher Augenschmaus. Wenn das Game später allerdings actionlastiger wird und man nicht mehr gemütlich durch die Gegen zuckelt, wird man wohl auch auf der GeForce 6800 Ultra und GT freiwillig auf 4xAA und 16xAF verzichten.
Eine Anmerkung noch zur Bildqualität:
Sowohl auf den offiziellen Catalyst 4.5-Treibern, als auch den für die X800 XT „PE“ genutzen Beta-Treibern flackerten einige Licht- und Schatteneffekte bei Spellforce, die eigentlich auf- und abnehmende Beleuchtung durch schwankende Bäume darstellen sollten.
Tomb Raider - AoD
- Als einer der ersten Titel mit voller DirectX9 Unterstützung sorgte „Tomb Raider: Angel of Darkness“ für Furore. Zwar eher, was die erschreckend niedrigen Bildwiederholraten der GeForceFX-Karten im Vergleich zur ATi-Konkurrenz anging, als durch überragendes Gameplay oder erdrückende Verkaufszahlen, aber immerhin, das Spiel blieb in aller Munde.
Pikanterweise war dieses Spiel auch auf der offiziellen Liste [32] des „The Way It's Meant To Be Played“-Programms zu finden und das, obwohl es mehr schlecht als recht lief. Kurzerhand wurde im aktuellen Patch [33] der Version v52 die Unterstützung für die Benchmarkfunktion wieder entfernt. Auch gibt es den Patch v49, der diese Funktion unterstützt, und den wir verwendeten, nicht mehr auf der offiziellen Eidos-Seite zum Herunterladen.
- Zur Ermittlung der durchschnittlichen Frameraten haben wir uns des besagten Patches v49, des TRAOD SCU (Tomb Raider: Angel of Darkness Startup Configuration Utility) und eines selbsterstellten Durchlaufes durch große Teile des Prag3a-Levels bedient. Es wurde das Standard-Profil für PS2.0-fähige Karten ausgewählt (Mit Ausnahme natürlich der Ti4800), VSync, wie auch in allen anderen Benchmarks, deaktiviert, Fogging eingeschaltet und alle Texturen auf trilineare Filterung geschaltet. Ansonsten wurden alle Effekte, wie Full-Screen Tiefenunschärfe, Glow und Hitzeflimmern aktiviert - die spanische Inquisition für Grafikkarten also.
AF wurde per Treiber erzwungen, beim FSAA mussten wir teilweise im Game-Setup nachhelfen, weil die X800-Karten reines Treiber-FSAA nicht akzeptierten.
Weitere Informationen: www.tombraider.de [34] - Download: nicht verfügbar
Tomb Raider: AOD 1024 default
Angaben in Bildern pro Sekunde (FPS)
|
Trotz maximalen Pixelshader-Einsatzes, der zudem oftmals wirklich bildschirmfüllend geschah, kann die GeForce 6800 Ultra hier gut mit der X800 XT „PE“ mithalten. Die GT vermag die X800 Pro sogar geringfügig zu distanzieren.
Tomb Raider: AOD 1024 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Die Abstände werden, wie schon bekannt, ein wenig größer, sobald zusätzliche Last auf der Grafikkarte erzeugt wird. Trotz aller Optimierungen reicht es für die X800 Pro erst unter 4xAA und 16xAF, die 6800 GT zu überholen und sich der Ultra sehr zu nähern.
Tomb Raider: AOD 1280 default
Angaben in Bildern pro Sekunde (FPS)
|
Ohne Bildqualitätsoptionen, aber mit höherer Auflösung werden die Abstände derweil knapper, auch kann sich die X800 Pro zwischen GT und Ultra der GeForce-Serie schieben.
Tomb Raider: AOD 1280 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Ausbauen kann sie diesen Vorteil aber auch mit FSAA und AF nicht. Der Vorsprung der XT „PE“ vor der 6800 Ultra beginnt allerdings, Wirkung zu zeigen.
Tomb Raider: AOD 1600 default
Angaben in Bildern pro Sekunde (FPS)
|
Die Abstände bleiben erstaunlich konstant, auch in 1600x1200. Lediglich die vollausgebaute X800 kann ihren Vorsprung weiter vergrößern. Spielentscheidend ist der Unterschied zwischen 50 und 60 fps allerdings in Tomb Raider eher nicht.
Tomb Raider: AOD 1600 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Derjenige Unterschied zwischen 50 und 40 und besonders zwischen 33 und 44 fps hingegen jedoch schon eher. Mehr kann man allerdings seinem System mit TRAOD kaum abverlangen - ein vergnügliches Spielerlebnis dürfte hier auf allen vier neuen Karten garantiert sein.
Anmerkung zur Bildqualität:
Mit dem 61.34-Treiber, der zu keiner merklichen Leistungssteigerung führte, erstreckte sich der Tiefenunschärfe-Effekt teilweise sehr dicht an die Betrachterposition heran. Auch die, über Third-Persion Perspektive gesteuerte, Spielfigur Lara Croft war teilweise davon erfasst. Weiterhin stellte keine nVidia-Karte ohne die Option „nVidia Shadows“ die Schatten dar.
Delta Force - BHD
- Als Nachfolger so berühmt-berüchtigter Titel wie Comanche und Delta Force baut Delta Force: Black Hawk Down auf einer moderneren Engine auf, als die Voxelspace-Vorgänger und nutzt, wie Comanche 4, welches hierdurch abgelöst wird, Pixelshader nach DirectX 8. Die weitläufigen Terrains, die die Engine darstellen kann, fordern nicht nur die CPU, sondern dank teils recht detailierter Texturen, umfangreicher Rauch- und Partikeleffekte und schönen Spezialeffekten auch die Grafikkarte. Gespielt wird in der Egoshooter Perspektive.
- Zur Leistungsermittlung haben wir mittels FRAPS [35] die immer gleich ablaufende Introsequenz der ersten Mission „Marka Breakdown“ vermessen, die unweigerlich mit dem Tode der Spielerfigur an immer deselben Stell endet. Die Details im Spiel stellten wir auf die per Menü maximal verfügbare Stufe, AA und AF wurden per Treiber erzwungen.
Weitere Informationen: www.novalogic.com [36] - Download: Gamershell.com [37]
Delta Force: BHD 1024 default
Angaben in Bildern pro Sekunde (FPS)
|
Mit knapp 100 fps stoßen wir hier an das Systemlimit, welches auch ältere GeForce FX-Karten knapp zu erreichen im Stande sind. Bei den Radeons wird dieses, nahezu unabhängig von der verfügbaren Grafikleistung, rund 10 fps früher, bei 90 Bildern pro Sekunde erreicht.
Delta Force: BHD 1024 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Auch mit niedrigen Stufen von Anti-Aliasing und anisotroper Filterung ändert sich das Bild kaum, erst 4xAA und maximales AF bringen die vier aktuellen Karten in gewohnter Spitzengruppe zusammen.
Delta Force: BHD 1280 default
Angaben in Bildern pro Sekunde (FPS)
|
Wie gehabt, ohne FSAA und AF schlägt auch in 1280x1024 das Systemlimit zu, DF:BHD bleibt dabei aber, mit Ausnahme der Ti 4800, problemlos spielbar.
Delta Force: BHD 1280 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Erst mit hohen AA und AF-Stufen können die beiden Radeons hier die GeForce 6800 Karten überflügeln.
Delta Force: BHD 1600 default
Angaben in Bildern pro Sekunde (FPS)
|
Ohne diese Rechenzeit verschlingenden Maßnahmen übernehmen in 1600x1200 allerdings wieder die 6800er-Geschwister die Führung, ohne dass sich jedoch die Frage einer Einschränkung der Spielbarkeit stellen würde.
Delta Force: BHD 1600 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Die X800 Pro mit aktiven Optimierungen kann hier gut mir ihrer deutlich leistungsfähigeren Cousine mithalten, während die GeForce-Karten das Feld weiterhin mit 2xAA und 2xAF knapp anführen. Sobald aber, wie in 1280x1024 auch, 4xAA und maximales AF ins Spiel kommt, liegen sie teils deutlich zurück.
Der hohe Verlust gegenüber der 1280er-Auflösung, der auf der Radeon gerade einmal halb so hoch ist und die Tatsache, dass auch die beiden 128-MB-Karten FX5800 Ultra und Radeon 9700 Pro unverhältnismäßig weit hinter ihren mit 256 MB ausgestatteten Nachfolgern zurückliegen, könnte allerdings darauf hindeuten, dass hier der GeForce aufgrund ihres von 3dfx geerbten Downfiltering beim Scanout, mit dem man etwas Bandbreite beim FSAA sparen kann, gleichzeitig aber deutlich mehr Video-RAM belegt. Ein ähnliches Phänomen sehen wir nachher nochmal bei Max Payne II, welches Triple Buffering nutzen kann.
Unreal Tournament 2003
- Das schon in der Demo-Version von uns zum Benchmark genutzte Unreal Tournament 2003 findet sich nunmehr auch in der Vollversion in unserem Testparcours. Mit dem Patch v2.225 auf einen aktuellen Stand gebracht haben wir die Pyramid-Timedemo von 3DCenter [38] vermessen. Abweichend von der Maxime -alles auf 'highest'-, haben wir auf Echtzeitschatten verzichtet und stattdessen 'Blob'-Schatten benutzt, die die CPU weniger stark belasten. Auch 3D-Hardware Sound haben wir uns aus dem Grunde gespart, einen möglichst großen Teil der Last auf die Grafikkarte zu verlagern.
Im Gegensatz zum FlyBy- sowie Botmatch-Modus des integrierten Benchmarks sind die hier erzielten Frameraten spürbar niedriger. Man muss jedoch auch sagen, dass Unreal Tournament 2003 nicht die Frameraten eines Quake3 benötigt, um sich anständig spielen zu lassen. Viele sind der Meinung, dass bereits ein Durchschnitt von etwa 40-45 fps im Pyramid-Timedemo, dass auf der Map CTF-Face3 aufgenommen wurde und ein intensives Capture-The-Flag mit wenig Taktik und viel Action zeigt, ausreicht, um das Spiel flüssig spielen zu können. - Weitere Informationen: UnrealTournament2003.com [39]
- Download: UnrealTournament2003.com (Demo, nicht mit der Pyramid-Demo zu benchen) [40]
UT2003 VV Pyramid 1024 default
Angaben in Bildern pro Sekunde (FPS)
|
Obwohl wir bei den alten Karten einige Optimierungen durchgehen ließen, sind wir bei 69-70 bereits am absoluten CPU-Limit angekommen. Nur Radeon 9600 XT und GeForce 4 Ti 4800 verfehlen dieses.
UT2003 VV Pyramid 1024 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Auch mit geringen Stufen von AA und AF gibt es kaum nennenswerte Unterschiede, weder zwischen alten und neuen Karten, noch zwischen den aktuellen High-End-Boliden zu vermelden. In den höheren Settings geht den mit nur 128 MB bestückten Karten allerdings langsam der Texturspeicher aus.
UT2003 VV Pyramid 1280 default
Angaben in Bildern pro Sekunde (FPS)
|
Auch die nächsthöhere Auflösung vermag nur die beiden kleinsten Karten an ihre Grenzen zu treiben. An der Spitze tummelt sich die bekannte Vierergruppe.
UT2003 VV Pyramid 1280 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
So langsam wird ersichtlich, warum sich manch einer eine Radeon X800- oder GeForce 6800-Karte wünschen könnte. Insbesondere letztere zeigt sich auch bei vierfachem Anti-Aliasing kaum beeindruckt von den Anforderungen, die Unreal Tournament 2003 stellt. Die aktiven Optimierungen ermöglichen der X800 Pro sich zusammen mit ihrer Artgenossin von der grünen Konkurrenz abzusetzen.
UT2003 VV Pyramid 1600 default
Angaben in Bildern pro Sekunde (FPS)
|
In 1600x1200 sind ausschließlich X800- und 6800-Karten noch nahe des Systemlimits. Spielbar bleibt das Spiel allerdings auch noch mit einer Radeon 9700 Pro oder FX 5800 Ultra.
UT2003 VV Pyramid 1600 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Im höheren Setting mit 4xAA und 16xAF auf den neuen Karten, fällt wieder dasselbe Phänomen auf, wie in DF:BHD. Mehr noch als mangelnde Renderleistung scheinen vielmehr selbst die 256 MB des verbauten Video-RAMs knapp zu werden. In diesem Setting verliert übrigens die X800 XT „PE“ durch ihre abgeschalteten Optimierungen gute acht Bilder pro Sekunden - deswegen kann die X800 Pro, die noch über aktive Optimierungen verfügt, auch so gut mit ersterer mithalten.
Max Payne
- Max Payne nutzt die Max-FX Engine, wie sie zum Teil auch schon im 3DMark 2001 verwendet wird. Es werden hohe Anforderungen an die Hardware gestellt, da sehr komplexe und aufwendige 3D-Effekte verwendet werden. Trotz einiger verwendeter DirectX 8.0-Funktionen wird jedoch noch statisches T&L gemäß DirectX 7.0 genutzt. Zum Einsatz kam der PCGH-Benchmark-Mod mit dem VGA-Demo als Timedemo. Gebencht wurde ausschließlich in 32 Bit Farbtiefe, mit 32 Bit Texturen und allen Settings auf "high". Mittlerweile sollten zumindest High-End-Grafikkarten auch keinen Max Payne mehr in hohen und höchsten Auflösungen fürchten müssen. Erst das Zuschalten von FSAA und AF könnte einige Ruckler in den ansonsten flüssigen Spielverlauf zaubern.
- Weitere Informationen: MaxPayne.com [41]
- Download: nicht verfügbar
Max Payne 1024 default
Angaben in Bildern pro Sekunde (FPS)
|
Dachten wir noch im letzten Test, bei ca. 90 fps das Limit erreicht zu haben, was unser System in Max Payne zu leisten vermag, wurden wir durch die komplette Frühjahrskollektion 2004 eines besseren belehrt. Nehmen wir bis zur nächsten Generaton also mal an, dass 95 fps das Limit darstellen. ;-)
Max Payne 1024 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Auch mit 4xAA und maximalem AF bleibt die Spitzengruppe in unveränderter Komposition zusammen. Trotz Optimierung fällt die X800 Pro allerdings schon drei FPS hinter ihre große Verwandte zurück.
Max Payne 1280 default
Angaben in Bildern pro Sekunde (FPS)
|
10 fps Vorsprung vor der letzen Generation sprechen auch und gerade in diesem Spiel eine deutliche Sprache - und das in Standardqualität.
Max Payne 1280 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Knapp, aber immerhin, die GeForce bleibt vor der Radeon. Hier ist entweder der Treiber besser auf Max Payne optimiert oder die Radeon leidet noch an ihrer Texturierungsschwäche, die auch AA und AF noch nicht kaschieren können.
Max Payne 1600 default
Angaben in Bildern pro Sekunde (FPS)
|
Trotz großem Performanceunterschied zwischen 6800 Ultra an der Spitze und Ti 4800 am unteren Ende - Spielbarkeit gewährleistet.
Max Payne 1600 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Auch hier wieder der schon beinahe charakteristische Abfall der GeForce in 1600x1200 mit maximalem MSAA und AF. Dank der Optimierung bleibt sogar die X800 Pro vor der 6800 Ultra, die sich nur unwesentlich von ihrer Vorgängering, die allerdings mit aktiven Optimierungen antritt, absetzen.
Max Payne 2
- Max Payne2: The Fall of Max Payne bietet, wie schon der Vorgänger, das sogenannte Bullet-Time Feature, vielen sicherlich von den Extrem-Zeitlupen aus dem Film „Matrix“ bekannt, welches weiter verbessert wurde. Neben photorealistischen Texturen und sehr detailiert gestalteten Umgebungen gibt es Radiosity Lighting, Gesichtsanimation und Lippensynchronisation und eine voll integrierte „Havoc“-Physik-Engine, die außer der Grafikkarte auch den Rest des Systems nicht vollkommen nutzlos herumidlen lassen.
- Gemessen wurde Part II, Mission I „Return to Monas Funhouse“, welches eine schöne Intro-Sequenz mit einer Bullet-Time Szene kombiniert, an deren Ende Max Payne sich aufrappelt und wir den FRAPS-Durchlauf beenden. In-Game Settings waren auf maximale Einstellungen, Texturfilter auf trilinear gesetzt und Triple-Buffering aktiviert. FSAA und AF wurden per Treiber erzwungen.
- Weitere Informationen: MaxPayne2.com [42]
- Download: Demo [43] (nicht benchmarkfähig)
Max Payne II 1024 default
Angaben in Bildern pro Sekunde (FPS)
|
Alle aktuellen, in derselben Klasse spielenden Karten, sind dicht beeinander. Selbst die angegraute Ti 4800 erreicht noch knapp über 100 Bilder pro Sekunde.
Max Payne II 1024 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Lediglich die älteren GeForce-Karten beginnen langsam zu schwächeln, wenn FSAA und AF aktiviert werden. X800- und 6800-Serie bleibt hart am Systemlimit.
Max Payne II 1280 default
Angaben in Bildern pro Sekunde (FPS)
|
Auch hier erlauben selbst ältere oder Mid-Range-Karten noch ergonomische Bildwiederholraten oberhalb von 85 fps, die sich auch mit aktivem VSync geniessen lassen.
Max Payne II 1280 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Mit aktiver Kantenglättung beginnt Max Payne 2 auf GeForce 6800-Karten langsam aber sicher den Tribut für die hochauflösenden Texturen in Form vermehrten VRAM-Bedarfs zu fordern. Zuammen mit der schon erwähnten Problematik des Filter@Scanout, welches nochmal zusätzlich etliche MB verschlingt, wird die GeForce 6800 hier schon deutlich gebremst.
Max Payne II 1600 default
Angaben in Bildern pro Sekunde (FPS)
|
Keine Sorgen dagegen in hoher Auflösung allein - hier schwächelt einzig die X800 Pro geringfügig, trotz aktiver Optimierungen.
Max Payne II 1600 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Spätestens hier wird es mehr als deutlich. Die nur mit 128 MB bestückte FX 5800 Ultra verbraucht schon für die Bildpuffer mehr Speicher, als zur Verfügung steht und bricht so mit einer Fehlermeldung ab. Selbst die in Max Payne ansonsten deutlich leistungsfähigere FX 5950 muss sich der Radeon 9700 Pro heftig erwehren.
Die GeForce 6800 Ultra und GT werden schließlich beide von der Radeon 9800 XT überholt, was nicht gerade ein rühmliches Licht auf die verwendete Spezialtechnik beim Anti-Aliasing wirft. Als kleine Ehrenrettung und zum Untermauern des eben gesagten sei noch erwähnt, dass die 6800 Ultra mit ansonsten gleichen Einstellungen im letzten Test mit 4xAA und 16xAF bei Double- anstatt Triple-Buffering 114,21 fps erreichte.
Hier sollte nVidia wirklich genau überlegen, ob der eine eingesparte Framebuffer-Write wirklich einen solchen Leistungseinbruch in genau den Settings rechtfertigt, für die man Karten dieses Preis- und Leistungssegmentes eigentlich erwirbt, sinnvoll ist.
Call of Duty
- Auf der bekannten und bewährten Quake3-Engine basierend bietet der WWII-Shooter „Call of Duty“ eine Single-Player Kampagne, in deren Verlauf man das Zurückdrängen der deutschen Wehrmacht auf alliierter Seite aus drei Perspektiven erlebt: Als Sowjet, Brite und Amerikaner. Speziell die D-Day Landung in der Normandie und einige Missionen auf Seiten der Russen, die mit dem Kampf um den Reichstag enden, verstehen es, beim Spielen ein beklemmendes Gefühl zu erzeugen.
- Genutzt wurde die integrierte Timedemo-Funktion bei einem aufgezeichneten Deathmatch auf der weitläufigen und mit vielen Alpha-Texturen anspruchsvollen Brecourt-Map. Es wurde der dritte Durchlauf der Timedemo gewertet, da insbesondere auf den GeForce-Karten der erste Durchlauf immer ein wenig höher ausfiel, als die folgenden.
Im Spiel selber waren maximale Details aktiviert, trilineare Filterung jedesmal neu angefordert und auch der Sound wurde mit EAX2.0-Unterstützung auf höchstem verfügbaren Niveau belassen. Die Texturdetails auf „extra“ belasteten das verfügbare Video-RAM durch ihre schiere Größe, so dass hier 128MB-Karten zum Grenzfall werden konnten. Die Option „nVidia Distance Fog“ blieb deaktiviert.
- Weitere Informationen: activision.com [44]
- Download: Aus rechtlichen Gründen geben wir hier keinen Download-Link zu einer Call of Duty Demo an, da wir nicht ausschließen können, dass darin eine, laut deutschem Gesetz in Spielzeugen verbotene, Swastika gezeigt wird.
CoD Brecourt 1024 default
Angaben in Bildern pro Sekunde (FPS)
|
Mit deutlichem Abstand führen die nVidia-Karten ihre Radeon-Konkurrenz hier an. Dies erstreckt sich in alle Bereiche, bis hinab zu GeForce 4 Ti 4800 und Radeon 9600 XT. Die Spielbarkeit mit der jeweils unterlegen Karte ist natürlich in keiner Weise gefährdet.
CoD Brecourt 1024 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
FSAA und anisotrope Filterung verlangen älteren Karten schon einiges ab, die Radeons werden damit besser fertig, als die GeForce FX Konkurrenz. Die X800 XT „PE“ erreicht in dem höheren der beiden Settings jedoch beinahe 6800 Ultra-Niveau.
CoD Brecourt 1280 default
Angaben in Bildern pro Sekunde (FPS)
|
Ohne qualitätsverbessernde Maßnahmen können die GeForce-Karten ihre jeweiligen Vorsprünge auch in 1280x1024 halten.
CoD Brecourt 1280 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Das höhere der beiden Settings zeigt, im Gegensatz zu 2xAA und 2xAF, wo die GeForce 6800-Karten ihren Vorsprung verteidigen können, so dass es für die 6800 Ultra zur Performancekrone nicht reicht. Die Karten mit nur 128 MB stoßen hier bereits an die Grenzen ihres Texturspeicher und liefern kaum noch spielbare Bildraten ab.
CoD Brecourt 1600 default
Angaben in Bildern pro Sekunde (FPS)
|
Auch in 1600x1200 gibt es keine Veränderung in der bekannten Rangfolge.
CoD Brecourt 1600 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Auch hier müsste dasselbe, was in 1280x1024 mit aktiven Qualitätsoptionen erwähnt wurde, wiederholt werden: Die X800 XT „PE“ setzt sich dank ihrer höheren Füllrate knapp ab, während die X800 Pro, die über dieselbe Füllrate, wie die 6800 GT verfügt, hier trotz aktiver Optimierungen nicht ganz an die mit etwas höherer Bandbreite ausgestattete Konkurrenz heranreicht.
Anmerkung zum Treiber:
Eine deutliche Leistungssteigerung erfuhren die 6800-Karten mit dem ForceWare-Treiber 61.34. Ursprünglich lagen die erreichten FPS-Raten in dieser Auflösung bei etwa 130 Bildern pro Sekunde. Je höher der AA/AF-Modus, desto geringer wurde der Leistungszuwachs. Eine Verringerung der Bildqualität konnte durch Inaugenscheinnahme nicht festgestellt werden. Möglicherweise hat nVidia hier noch eine Bremse gefunden und rechtzeitig lösen können.
Alice
- Ein eher selten genutzter Test im Benchmarkparcours ist eigentlich ein alter Hut. American McGee's Alice, wie das Spiel mit vollem Namen heißt, basiert sowohl auf der Quake3-Engine als auch auf einer leicht psychedelischen Version von Alice im Wunderland. Sowohl Polygonzahl als auch Texturdetails wurden gegenüber der Quake3-Urversion erheblich gesteigert, so dass die graphischen Ansprüche für Alice schon ein ganzes Stückchen über dem Original liegen. Getestet wurde das in einem Außenlevel ablaufende und damit aufgrund der Q3-Engine für besondere Schwierigkeiten sorgende Curiosity-Timedemo mit den maximalen Details, die im Spiel vorgesehen sind. Zusätzlich wurde noch per Konsole der trilineare Filter, für den es im Spiel selber keinen Schalter gibt, mit dem Befehl r_texturemode GL_LINEAR_MIPMAP_LINEAR und einem folgenden vid_restart aktiviert.
Durch den Einsatz von zusätzlichen Detail-Texturen im Nahbereich ergibt sich eine optisch gelungene und aufgrund des eher ungewöhnlichen Settings ungewöhnliche Spieleerfahrung in diesem Third-Person Action-Adventure. - Weitere Informationen: ElectronicArts.com [45]
- Download: ElectronicArts.com (Demo) [46]
Alice Curiosity 1024 default
Angaben in Bildern pro Sekunde (FPS)
|
Mit gut 150 Bildern pro Sekunde dürften sowohl FX 5950 als auch die beiden 6800er-Karten kaum noch steigerungsfähig in dieser Einstellung sein. Die beiden X800-Karten laborieren auf einem Niveau mit der FX 5800 Ultra am offenbar mehr Systemleistung beanspruchenden OpenGL-Treiber von ATi.
Alice Curiosity 1024 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Aktivierte Kantenglättung im Verbund mit aufwendigerer Texturfilterung rückt die Verhältnisse im Sinne der neuen Generation wieder ein wenig gerade. An der Rangfolge innerhalb unseres Viererquartetts ändert sich nichts.
Alice Curiosity 1280 default
Angaben in Bildern pro Sekunde (FPS)
|
1280x1024 scheint selbst für die X800 Pro schon ein wenig Mehrbelastung zu bedeuten. Die 6800er-GeForce Karten und die X800 XT „PE“ bleiben von der höheren Pixelzahl unbeeindruckt.
Alice Curiosity 1280 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Selbst mit maximaler Multisampling-Qualität innerhalb unserer Testsettings und maximaler Texturfilterung kann sich die 6800 GT einen hauchdünnen Vorsprung vor der Radeon-Konkurrenz bewahren.
Alice Curiosity 1600 default
Angaben in Bildern pro Sekunde (FPS)
|
Auch hier das bekannte Bild: Reine Füllrate unter OpenGL liegt den 6800er-GeForces am besten. Danach folgt die X800 XT „PE“ und mit Respektsabstand die X800 Pro.
Alice Curiosity 1600 Qualität
Angaben in Bildern pro Sekunde (FPS)
|
Eines der wenigen Spiele, die offenbar weiterhin Domäne der nVidia-Karten bleiben. Ob es nun eine geringere Größe des benötigten Texturplatzes im Vergleich zu Call of Duty oder schlicht der Umstand, dass kaum noch jemand „Amercian McGee's Alice“ kennt und bencht, ist, bis auf weiteres ist hier trotz durchweg problemlos spielbarer Frameraten kein Blumentopf für die X800-Serie zu gewinnen.
Leistungsaufnahme
In Anlehnung an unseren älteren Stromverbrauch-Artikel [47] wollen wir die Leistungsaufnahme auch weiterhin als Bestandteil unserer Tests pflegen. Im Gegensatz zu älteren Artikeln hat sich das Testsystem allerdings wieder einmal geändert, so dass die aktuellen Werte nur untereinander vergleichbar sind.
Kurz zur Methodik (für eine ausführlichere Beschreibung sei ein Blick in den älteren Artikel empfohlen):
Mit einem ELV EM600-Energiemonitor haben wir vor dem Netzteil die gesamte Leistungsaufnahme des Testrechners gemessen. Die angegebenen Werte sind also nur in Relation zu sehen und stellen keinesfalls die Leistungsaufnahme der Grafikkarte alleine dar.
Zunächst der ruhende Windows XP Professional Desktop in 1280x960x32 mit 100Hz:
WindowsXP Desktop
Angaben in Watt (W)
|
Hier sehen wir einen unbestreitbaren Glanzpunkt der Radeon X800-Serie. ATis Ingenieure haben - zusammen mit dem 0,13µ-lowK-Fertigungsprozess der taiwanischen Chipschmiede TMSC - das Kunststück vollbracht, ihr aktuelles High-End-Flaggschiff im Windows-Desktop-Verbrauch deutlich unter die Grenze zu drücken, die noch die weitaus leistungsschwächere und zwei Jahre alte Radeon 9700 Pro setzte. Zudem sind die temperaturgeregelten Referenzkühler während unseres Testbetriebs direkt nach dem BIOS-Screen in den langsamsten Modus verfallen und dort auch unter Last geblieben. Respekt!
Im direkten Vergleich und trotz der Balkenfarbe alles andere als im grünen Bereich scheint die GeForce 6800-Reihe. Im Vergleich zum jeweiligen ATi-Pendant sind es ca. 14 bzw. 26 Watt mehr, die sich die 222 Millionen Transistoren auch für's (beinahe) Nichtstun genehmigen. Zu viel für einen Rechner, der nicht nur für ein paar vergnügliche Gaming-Stunden pro Woche angeworfen wird, sondern eventuell auch mal einige Tage hindurch ununterbrochen läuft.
Als Anmerkung sei hier noch gestattet, dass ein vergleichweise herangezogenes Serienexemplar der 6800 Ultra, die auch über ein aktuelleres BIOS verfügte als das Refenzmodell von nVidia, sich im Desktop-Betrieb mit etwa gemäßigteren 105,8 Watt begnügte und auch die Werte der 6800 GT, die wir mit eben jener Serien-Ultra simulierten, bereits deutlich niedriger als die Pegelausschläge des Referenzmodelles waren. Somit sollte man, bevor man die GeForce 6 als Schluckspecht verteufelt, erst einmal auf Serienexemplare warten.
Vollbelastung - Codecreatures
Angaben in Watt (W)
|
Hier, unter 3D-Last, haben sich einige erstaunliche Werte ergeben. Zwar begnügt sich die 6800 GT hier im direkten Vergleich zur X800 Pro mit etwa 10 W mehr Leistungsaufnahme. Jedoch kamen sowohl Radeon 9800 XT als auch die GeForce FX-Modelle mit teils deutlich höherem Verbrauch daher als die GeForce 6800 GT. Bei den FX-Modellen ist eine mögliche Erklärung relativ naheliegend: Der CodeCreatures-Benchmark nutzt vorwiegend Pixelshader nach DirectX 8 sowie massiv Vertexshader-Instruktionen. Dadurch werden auch die älteren Karten der FX-Reihe, die noch über extra Logik für DirectX8-Berechnungen verfügen, bis an ihre Grenzen getrieben, was die Leistungsaufnahme angeht. Ein weiterer Faktor ist das deutlich Strom sparendere GDDR3-RAM, welches auf allen Karten der neuen Generation, die sich hier versammelten, zum Einsatz kommt.
Auch hier wieder der Vergleich mit dem Serienmodell, welches bereits für die 6800 GT herhalten musste. Auf defaultmäßigem Ultra-Niveau entrang diese Karte dem Gesamtsystem lediglich eine Leistungsaufnahme von 208,9 W. Unerreicht jedoch ist die wiederum erstaunliche Sparsamkeit der X800-Modelle. Insbesondere dann, wenn man die gebotene Leistung dazu in Relation setzt.
Fazit
Ein eindeutiges Fazit zu ziehen fällt schwer. Entscheiden muss schließlich - wie so oft - sowieso jeder für sich selbst, welche Aspekte wichtig für ihn persönlich sind.
ATi:
Positiv auf Seiten ATis hervorzuheben ist ohne weitere Diskussion die energiesparende Realisierung der neuen High-End Karten, die auch ohne aufdringliche Kühllösung auf Betriebstemperatur gehalten werden können. Ebenso beeindruckt hat uns die brachiale Leistungsfähigkeit der Pixel- und Vertexshadereinheiten - auch die kleinere Version der Karte, die X800 Pro, hatte keine Mühe, die Vorgängergeneration komplett zu düpieren. Auch die einzige, für den Spieler eventuell relevante Neuerung, 3dc, hat bei einer kurzen Inaugenscheinnahme bei der ATi-eigenen Ruby-Demo zu gefallen gewusst.
Temporal-Anti Aliasing, wenn auch in unserem Testbetrieb nicht gewürdigt, kann für ältere Spiele, die durchgehend oberhalb von 60 fps zu laufen im Stande sind, durchaus einen gewissen Mehrwert bringen - allerdings auch bei Karten auf Basis der Vorgängergeneration.
Damit kommen wir zu den Negativpunkten, die wir, bei aller Begeisterung über die Leistungsexplosion, nicht verschweigen wollen. Zunächst einmal sei da die von uns in den vergangenen Wochen mehrfach thematisierte Optimierung der Texturfilterung zu nennen. In den Leistungsregionen einer X800 - und sei es „nur“ eine X800 Pro - ist so eine Optimierung in unseren Augen eine eindeutige Verschwendung von Ressourcen. Weiterhin wäre zu kritisieren, dass ATi seit nunmehr beinahe zwei Jahren auf nahezu demselben Stand der Technik verharrt, die allerdings, das muss man zugestehen, zumindest bis zum Nachfolgechip durchaus noch ausreichen dürfte, um 99 % aller Spiele mit voller Bilderpracht genießen zu können. Dass die Winkelabhängigkeit der anisotropen Texturfilterung nicht entfernt oder zumindest als Option realisiert wurde, ist bedauerlich. Angesichts der bislang nur wenig massiven Kritik daran allerdings aus ATis Sicht verständlich.
Wenig Anlass zur Freude gibt allerdings die Umsetzung der 30 % höheren Nennleistung gegenüber der GeForce 6800 Ultra, die, abseits von Bandbreitenlimitierung, nur selten voll zum Tragen kommt. Hier bleibt zu hoffen, dass verborgenes Potential in den Treibern mobilisiert werden kann und das Problem nicht in der Hardware begründet liegt. Insgesamt ist ATi eine erstklassige, Energie sparende Grafikkarte gelungen, die die Bedürfnisse einer großen Mehrzahl der Spieler sicherlich zu erfüllen weiß und noch besser wäre, wenn endlich auch im Treiber alle oftmals nutzlosen Optimierungen deaktivierbar wären.

nVidia:
Wo viel Licht ist, da ist auch viel Schatten. Dies trifft auch auf den kalifornischen Transistor-Godzilla zu. Einerseits hat man einen gewaltigen Leistungssprung von der Vorgängergeneration aus hingelegt, der auch nötig war, um zur Konkurrenz aus Kanada aufzuholen. Andererseits hat man aufgrund der vielen integrierten und zukunftsweisenden Features den Chip sehr komplex gemacht und damit höhere Taktraten verhindert. Auch wenn eine „Ultra Extreme“ schon auf einigen Webseiten kursierte und auch etliche der normalen Ultra-Karten die offenbar angepeilten 450 MHz GPU-Takt problemlos zu verkraften scheinen, hat man sich mit der vergleichsweise niedrig getakteten, featurebeladenen GeForce 6800 Ultra selbst den Weg zur Rückkehr an die eindeutige Performancespitze verbaut. Dazu kommt das von uns vermutete Problem der Speicherknappheit in hohen Auflösungen mit hohem FSAA-Level. Bei einer Karte, die explizit für solche Settings empfohlen und wohl auch angeschafft wird, sollte so etwas nicht vorkommen. Unserer Meinung nach ist auch genau das das Problem, welches zu einer Deaktivierung des treiberseitigen FSAA für Far Cry führte.
Dazu kommen die in der Referenzlösung akustisch suboptimale Kühlung der Karte und die im Vergleich zur direkten Konkurrenz höhere Leistungsaufnahme, obwohl hier Serienmodelle durchaus noch Linderung der Symptome bringen können, wie unsere simulierte 6800 GT zeigte.
Was wir jedoch ausdrücklich mißbilligen, ist die Einführung einer bislang unabänderlichen Winkelabhängigkeit für den anisotropen Filter. In einer High-End-Karte hat so etwas schlicht nichts zu suchen, solange es nicht wenigstens deaktivierbar ist. Mit gesenkter Bildqualität erreicht man auch mit alten Karten hohe FPS-Zahlen.
Dem Bildqualitätsanspruch allerdings zugute kommt die längst überfällig Verbesserung der Kantenglättung, die, bis auf die Gammakompensation, zumindest bis zum 4x Multisampling-Modus nun mit der von ATi Schritt halten kann. Auch, dass weiterhin optionale Supersampling-Modi angeboten werden, ist zu begrüßen, denn gerade angesichts der Leistungssteigerungen wird die Zahl der älteren Spiele, für die Supersampling aus dem einen oder anderen Grund wünschenswert ist und die trotzdem spielbar bleiben, immer größer.
Insgesamt ist nVidia eine Karte gelungen, die leistungsmäßig auch bei gut vergleichbarer Bildqualität weitestgehend mithalten kann und die darüber hinaus ein umfangreiches und vielleicht gar nicht so uninteressantes Featureset für die Zukunft bietet. Insgesamt eher eine Karte für den besonderen Anspruch, wenn es nicht immer das allerschnellste Stück Hardware sein muss.

Vielen Dank an dieser Stelle an alle, die an der Entstehung dieses Artikels beteiligt waren: nVidia und Inno3D-Deutschland für die GeForce6800-Samples, ATi und Sapphire-Deutschland für die X800-Samples und Ralf Kornman für die Zusammenarbeit beim Entdecken und Deaktivieren diverser Optimierungen.







