Einleitung
Dass die kleine spanische Insel Ibiza im sonnigen Mittelmeer mehr als nur ein Ferienparadies sein kann, zeigte sich an diesem Wochenende bei der Präsentation der neuen Grafikchips von ATi, der R5xx-Familie. Neben einem umfangreichen Abendprogramm sowie diversen Freizeitunterhaltungen zwischendurch, wurde natürlich auch das Geheimnis um die neue ATi-Generation gelüftet und die frischen Stücke Silizium in Form der Radeon-X1800-, der X1600- und X1300-Serien ausführlich vorgestellt.




Auf jene wartet man mittlerweile schon mehrere Monate und immer wieder war von Fertigungsproblemen sowie Verschiebungen die Rede. Ebenso kamen Gerüchte über 32 Pixel-Pipelines und Chiptaktraten von 700 MHz auf. All diese Spekulationen sind nun mit der Präsentation in Vergessenheit geraten, womit ab dem heutigen Tag endlich Klarheit über den Hauptkonkurrenten der GeForce 7800 GTX von nVidia herrscht, den R520.
Shader-Model 3.0, einen 512 MB großen VRAM, angepasste FP16-Blending-Einheiten in den ROPs sowie FP16-fähige TMUs zur Darstellung von High-Dynamic-Range-Rendering, neue Funktionen zur Bildverbesserung und Beschleunigung von HDTV-Videos; ATi hat sich eine Menge vorgenommen, um die Konkurrenz aus Kalifornien zu schlagen. Da wir zu den Glücklichen gehörten und verschiedene Modelle der neuen Radeon-Familie gleich mit nach Hause nehmen durften, wird sich in diesem Artikel zeigen, wie sich der neue R520 und seine kleinen Geschwister in mehreren Disziplinen gegen die GeForce 7800 GTX und andere nVidia-Derivate behaupten können.
Dabei werden wir nicht nur einen Blick auf die beliebten Spiele-Benchmarks werfen, auch die Filterqualität des anisotropen Filters wird kurz untersucht werden – in der Vergangenheit wurde hier bei neuen Chipgenerationen des Öfteren die Bildqualität gesenkt, damit man, aufgrund der gewonnenen Füllrate, in Benchmarks besser dasteht. Darüber hinaus werden auch die vorhandenen Anti-Aliasing-Modi kontrolliert. Vielleicht gibt es ja beim R520 etwas Neues, das gegen nVidias viel gelobtes Transparency-AA, welches hilfreich gegen flimmernde Alpha-Test-Texturen ist, bestehen kann?
Technische Daten
| Radeon X1800 XT |
Radeon X1800 XL |
Radeon X1600 XT |
Radeon X1600 Pro |
Radeon X1300 Pro |
Radeon X1300 |
|
|---|---|---|---|---|---|---|
| Logo | ||||||
| Chip | R520 | R520 | RV530 | RV530 | RV515 | RV515 |
| Transistoren | ca. 321 Mio. | ca. 321 Mio. | ca. 157 Mio. | ca. 157 Mio. | ca. 105 Mio. | ca. 105 Mio. |
| Fertigung | 0,09 µm | 0,09 µm | 0,09 µm | 0,09 µm | 0,09 µm | 0,09 µm |
| Chiptakt | 625 MHz | 500 MHz | 590 MHz | 500 MHz | 600 MHz | 450 MHz |
| Pixel-Pipelines | 16 | 16 | 4 | 4 | 4 | 4 |
| ROPs | 16 | 16 | 4 | 4 | 4 | 4 |
| Pixelfüllrate | 10000 MPix/s | 8000 MPix/s | 2360 MPix/s | 2000 MPix/s | 2400 MPix/s | 1800 MPix/s |
| TMUs je Pixel-Pipeline | 1 | 1 | 4 (insgesamt!) | 4 (insgesamt!) | 1 | 1 |
| Texelfüllrate | 10000 MTex/s | 8000 MTex/s | 2360 MTex/s | 2000 MTex/s | 2400 MTex/s | 1800 MTex/s |
| Vertex-Pipelines | 8 | 8 | 5 | 5 | 2 | 2 |
| Dreiecksdurchsatz | 1250 MV/s | 1000 MV/s | 738 MV/s | 625 MV/s | 300 MV/s | 225 MV/s |
| Pixelshader | PS 3.0 | PS 3.0 | PS 3.0 | PS 3.0 | PS 3.0 | PS 3.0 |
| Vertexshader | VS 3.0 | VS 3.0 | VS 3.0 | VS 3.0 | VS 3.0 | VS 3.0 |
| Speichermenge | 512/256 GDDR3 | 256 GDDR3 | 256/128 GDDR3 | 256/128 GDDR3 | 256 GDDR3 | 256/128 GDDR3 |
| Speichertakt | 750 MHz | 500 MHz | 690 MHz | 390 MHz | 400 MHz | 250 MHz |
| Speicherinterface | 256 Bit | 256 Bit | 128 Bit | 128 Bit | 128 Bit | 128 Bit |
| Speicherbandbreite | 48000 MB/s | 32000 MB/S | 22080 MB/s | 12480 MB/s | 12800 MB/s | 8000 MB/s |
| Präzision pro Kanal | FP32 | FP32 | FP32 | FP32 | FP32 | FP32 |
| Interface | PCIe | PCIe | PCIe | PCIe | PCIe | PCIe |
| SLI/CF-Unterstützung | Ja | Ja | Ja | Ja | Ja | Ja |
| GeForce 6800 Ultra |
GeForce 7800 GT |
GeForce 7800 GTX |
Radeon X850 XT-PE |
|
|---|---|---|---|---|
| Logo | ![]() |
![]() |
![]() |
|
| Chip | NV40/45 | G70 | G70 | R480 |
| Transistoren | ca. 222 Mio. | ca. 303 Mio. | ca. 303 Mio. | ca. 160 Mio. |
| Fertigung | 0,13 µm | 0,11 µm | 0,11 µm | 0,13 µm low-k |
| Chiptakt | 400 MHz | 400 MHz | 430 MHz | 540 MHz |
| Pixel-Pipelines | 16 | 20 | 24 | 16 |
| ROPs | 16 | 16 | 16 | 16 |
| Pixelfüllrate | 6400 MPix/s | 6400 MPix/s | 6880 MPix/s | 8640 MPix/s |
| TMUs je Pixel-Pipeline | 1 | 1 | 1 | 1 |
| Texelfüllrate | 6400 MTex/s | 8000 MTex/s | 10320 MTex/s | 8640 MTex/s |
| Vertex-Pipelines | 6 | 7 | 8 | 6 |
| Dreiecksdurchsatz | 600 MV/s | 700 MV/s | 860 MV/s | 810 MV/s |
| Pixelshader | PS 3.0 | PS 3.0 | PS 3.0 | PS 2.b |
| Vertexshader | VS 3.0 | VS 3.0 | VS 3.0 | VS 2.0 |
| Speichermenge | 256 GDDR3 | 256 GDDR3 | 256 GDDR3 | 256 GDDR3 |
| Speichertakt | 550 MHz | 500 MHz | 600 MHz | 590 MHz |
| Speicherinterface | 256 Bit | 256 Bit | 256 Bit | 256 Bit |
| Speicherbandbreite | 35200 MB/s | 32000 MB/S | 38400 MB/s | 37760 MB/s |
| Präzision pro Kanal | FP32/FP16 | FP32/FP16 | FP32/FP16 | FP24 |
| Interface | PCIe/AGP | PCIe | PCIe | PCIe/AGP |
| SLI/CF-Unterstützung | Ja (PCIe) | Ja | Ja | ja (PCIe) |
Technik im Detail
Der R520-Chip verfügt mit 321 Millionen Transistoren über deutlich mehr Schalteinheiten, als man aufgrund der nur 16 Pixel-Pipelines vermuten könnte. Weiterhin verfügt er über insgesamt acht Vertex-Shader-Einheiten, 16 ROPs und ebensovielen Texture Mapping Units. Als erster Desktop-Grafikchip verwenden der R520 sowie die kleineren Derivate erstmals den 90-nm-Prozess von TSMC, der nicht nur höhere Taktraten, sondern auch einen niedrigeren Stromverbrauch ermöglichen soll. Jener wird darüber hinaus durch eine erhöhte Flexibilität des R5x0 erreicht: Bei jenem ist es kein Problem, nicht mehr nur einzelne Pixel-Pipelines zu deaktivieren, ebenso lassen sich die Vertex-Shader, TMUs, ROPs und weitere Einheiten problemlos abschalten, um so ein- und denselben Chip für langsamere Grafikchips zu verwenden. Zudem verfügt der Chip über die Fähigkeit, sich im 2D-Modus herunterzutakten und zudem den gesamten 3D-Part zu deaktivieren, womit der Stromverbrauch unter der Windows-Oberfläche und 2D-Anwendungen stark gesenkt werden soll.
Der RV530, der in der Radeon X1600-Serie verbaut wird, wurde von ATi deutlich abgespeckt, weswegen der Chip nur noch eine ungefähre Größe von 180 Millionen Transistoren besitzt. Erreicht wird dies unter anderem durch die Reduzierung auf 12 Pixel- und fünf Vertex-Pipelines, zudem verfügt der Pixelbeschleuniger insgesamt nur noch über vier Texture Mapping Units sowie vier ROPs. Die Radeon X1300-Reihe mit dem RV515-Chip setzt noch einen drauf und besitzt nur noch zirka 100 Millionen Transistoren. Zusätzlich wurden noch weitere Pixel-Quads entfernt, womit das Silizium nur noch vier Pixel-Pipelines besitzt. Die ROPs und TMUs sind immer noch vierfach vorhanden, allerdings kann der RV515 nur noch mit zwei Vertex-Pipelines umgehen. Ansonsten sind die drei Chips größtenteils identisch aufgebaut.



Komplett neu bei allen drei Versionen der R520-Generation ist der sogenannte „Ring-Bus“, welcher ein neuartiges Speicherinterface bezeichnet. Während beim R420 das 256-bitige Memoryinterface mit Hilfe von vier 64 Bit breiten Kanälen arbeitete, gibt es beim Ring-Bus eine Aufteilung in acht Kanäle, die jeweils 32 Bit groß sind. Da jeder diese Kanäle gleichzeitig eine Lese- oder Schreibanfrage bearbeiten kann, kann der neue Ring-Bus innerhalb kürzerer Zeit die selben Daten verarbeiten wie ATis bisheriges Speicherinterface. Somit verringert sich die Latenz, sprich die Performance erhöht sich. Darüber hinaus ist der neue Ring-Bus fähig, jeglichen zur Zeit auf dem Markt befindlichen DDR-Speicher anzusteuern und ebenso den in der Zukunft erscheinenden GDDR4-Speicher.
Um die Effizienz des Memoryinterfaces zu erhöhen, setzen die Entwickler der R5x0-Generation auf mehrere Memory-Clients, welche die ankommenden Speicheranfragen bearbeiten und wieder losschicken können. Damit jene nicht auf eine komplexe Anbindung angewiesen sind, die die Komplexität, Hitze und Latenz extrem steigern würden, wird der so genannte Ring-Bus eingesetzt, der Namensgeber des neuen Interfaces. Dieser Bus umschließt alle Memory-Klienten ringförmig, um so den zurückzulegenden Weg gering zu halten. Dabei bestehen diese Ringe aus zwei 256 Bit breiten Datenleitungen – daher auch die Bezeichnung 512-Bit-Bus –, die jeweils in die entgegengesetzte Richtung kommunizieren, um so die Latenz ein weiteres Stück zu minimieren. Wenn die Daten über den Ring-Bus transportiert werden, können sie insgesamt an vier „Ring Stop“-Leitungen die Daten „abliefern“ und diese schicken die Informationen weiter an den Speicher.
Ebenfalls neu ist die Verbesserung der hauseigenen Texturkompression 3Dc, wobei der Nachfolger auf den simplen Namen „3Dc+“ hört. 3Dc+ ist nun auch in der Lage, acht Bit Integer Texturen mit einer Kompressionsrate von 2:1 zu verkleinern. Ebenso wurden die von ATi implementierten HyperZ-Funktionen zur Entfernung von Pixeln, die in einem nicht sichtbaren Bereich liegen und somit unnötig Bandbreite verschwenden, weiter verbessert. So soll bei der Radeon-X1800-Serie unter anderem die HierarchicalZ-Berechnungen um bis zu 50 Prozent beschleunigt worden sein. HierarchicalZ ist die erste Stufe der Berechnung von nicht sichtbaren Pixeln. Zuerst wird jeder Pixel in einen Block kleinerer Pixel unterteilt, die einzeln auf Sichtbarkeit untersucht werden. Während Blöcke, die komplett unsichtbar sind, direkt verworfen werden, werden komplett oder teils sichtbare Pixelblöcke weiter in die Pixel-Engine geleitet.
Wie es seit dem NV4x bereits jeder Grafikchip von nVidia ist, ist auch die R5x0-Familie fähig, Pixel- und Vertex-Shader Befehle der Version 3.0 zu verarbeiten. Ein Teil des Shader-Models 3.0 ist das sogenannte „Dynamic Branching“, welches laut ATi einer der wichtigsten Bestandteile der neuesten Shader-Version darstellt und auf dem R5x0 auch sehr schnell laufen soll. So ist es mit Dynamic Branching dem Spieleentwickler theoretisch möglich, einen langen, einzelnen Shader zu schreiben, der dank dem Feature dennoch schnell abgearbeitet werden kann. So entscheidet die Karte, ob der Shader-Code komplett ausgeführt werden muss oder nicht benötigte Codeteile einfach übersprungen werden können. Während der NV4x und G70 relativ viele Takte benötigen, um so einen Sprung zu vollführen, soll der R520 entsprechend wenige Zyklen benötigen, um dynamisch durch den Shader-Code springen zu können.
Weiterhin wurde die Pixel-Pipeline und ebenso der Vertex-Shader optimiert, so dass sich größtenteils die Latenz verringert, um ohne Wartezeiten Daten verarbeiten zu können. Alle diese hier zu erklären würde allerdings den Artikel ins unendliche verlängern, weswegen wir nur die wichtigsten Folien abbilden werden. Weiter möchten wir aber noch zwei wichtige Änderungen gegenüber dem Vorgänger R4x0 erläutern: So rendert der R5x0 jeglichen Shadercode mit voller FP32-Genauigkeit und kann nicht, wie die nVidia-Pendants, auf halbe Präzision (FP16) zurückschalten, um so den Shadercode schneller ausführen zu können, jedoch je nach Shader auch an Bildqualität zu verlieren. Laut den ATi-Ingenieuren kann der R5x0 mit voller Präzision genauso schnell rendern wie mit Partial Precision, weswegen letzteres auf den ATi-Chips nicht zur Verfügung steht.
Zu guter Letzt verfügt die Radeon-X1k-Serie über ein wichtiges Feature, welches die Konkurrenz nicht bietet: So läuft auf entsprechenden Chips 64-bitiges FP-High-Dynamic-Range-Rendering inklusive Multi-Sampling-Anti-Aliasing. Zwar müssen die Spiele angepasst werden, laut den Crytek-Programmierern soll dies aber recht schnell möglich sein – so lief auf der Präsentation eine spezielle Version von Far Cry mit HDR sowie Anti-Aliasing einwandfrei und vor allem sehr flüssig.
Impressionen
Radeon X1800 XT
ATis neues Flaggschiff hört auf den Namen Radeon X1800 XT und arbeitet mit Hilfe des R520-Chips, der über 16 Pixel-Pipelines und acht Vertex Shader verfügt. Jene sind mit hohen 625 MHz getaktet, was größtenteils dem neuen 90-nm-Prozess bei TSMC zu verdanken ist. Der erste Blick auf das rote PCB unseres Referenzdesigns macht deutlich, dass die Tage zierlicher Karten mit einem Single-Slot-Kühler im High-End-Segment wohl ersteinmal vorbei sind. So ist die Karte mit einer Länge von 23 cm ebenso lang wie das nVidia-Pendant GeForce 7800 GTX, wobei die ATi-Karte jedoch mit einem Dual-Slot-Kühler daherkommt, der einen PCI-Anschluss einnimmt.
Trotz des gewaltig aussehenden Lüfters bleibt die Radeon X1800 XT erfreulicherweise relativ leise, nur beim ersten Starten macht sie mit voller Drehzahl deutlich auf sich aufmerksam, regelt sich einige Sekunden nach der Initialisierung allerdings von selbst wieder herunter und bleibt selbst nach längerer Zeit unter Last auf dem selben Lautstärkeniveau. Insgesamt erreicht sie im 2D-Betrieb zwar nicht den leisen Geräuschpegel einer GeForce 7800 GTX – die für eine High-End-Karte erstaunlich leise arbeitet –, störend ist der Lüfter aber nicht. Unter Last wird der 6,5 cm große Radiallüfter nur minimal lauter, was einen guten Wert darstellt.



Der eigentliche Kühler ist aus Kupfer gefertigt, was das Gesamtgewicht der Karte recht schwer werden lässt. Ebenfalls gekühlt mit einem kleinen Passivkühlkörper werden die Spannungswandler – die GeForce 6800 Ultra/GT lässt grüßen. Die Rückseite bleibt dagegen komplett Kühlerlos. ATis neuestes Top-Produkt wird es in zwei verschiedenen Versionen geben: einmal mit einem 256 MB großen VRAM und ebenso mit einem 512 MB großen Speicher, mit welchem auch unsere Version ausgestattet ist. Jener wird von Samsung hergestellt und bietet eine Zugriffszeit von sehr guten 1,2 ns, weswegen ATi den GDDR3-Speicher auch mit 750 MHz takten lässt, um so gegen das Speicherbandbreitenproblem heutiger Grafikkarten anzukämpfen.



Die Radeon X1800 XT verfügt über zwei Dual-Link-fähige DVI-Anschlüsse, um so im CrossFire-Betrieb auch höhere Auflösungen als 1600x1200 mit 60 Hz darstellen zu können. Der TV-Ausgang verfügt über ViVo-Funktionalität, womit sich in Kombination mit den neuen Avivo-Funktionen auch videobegeisterte Kunden anlocken lassen sollten. Während die 256-MB-Variante den Käufer 499 US-Dollar kosten wird, soll der größere VRAM einen Aufpreis von knapp 50 Dollar wert sein und somit werden entsprechende Karten mit 549 US-Dollar zu Buche schlagen. Nach offiziellen Angaben werden sie ab dem 5. November im Handel erhältlich sein. Die entsprechende CrossFire-Edition wird für 599 Dollar den Besitzer wechseln.
Radeon X1800 XL
Die Radeon X1800 XL stellt die etwas kleinere Variante des XT-Top-Modells dar, ist technisch jedoch vollkommend identisch mit dem größeren Bruder. So wird auf jenen Karten ebenso der R520-Chip verbaut, die Taktrate ist mit 500 MHz aber deutlich geringer. Das PCB ist identisch mit dem der XT-Version, allerdings setzt ATi erfreulicherweise auf einen Single-Slot-Kühler, der aber nicht zu begeistern weiß – später dazu mehr. Entsprechende Karten sollen laut ATi ab sofort verfügbar sein und werden für 449 Euro über die Ladentheke wandern.
Der recht große Kühlkörper, der bei dem Referenzdesign mit dem Ruby-Maskottchen versehen ist, besitzt ebenfalls Kühllamellen aus Kupfer, womit die Karte zwar nicht mehr ganz so schwer wie die X1800 XT erscheint, aber immer noch nicht zu den Leichtgewichten zählt. Auch bei der X1800 XL wird auf den Spannungswandlern ein passiver Kühlkörper verwendet. Kommen wir nun zu dem Kühler zurück: Jener ist ein recht klein ausgefallenes Produkt, welches sich ebenso nach dem Start von alleine herunter regelt. Somit macht die Karte nach den ersten Minuten einen guten Eindruck, dieser wird allerdings nach einiger Zeit direkt wieder zu Nichte gemacht. Obwohl wir den Testrechner unberührt ließen, drehte der Lüfter plötzlich auf und schrie mit einer doch sehr hohen Lautstärke grundlos nach Aufmerksamkeit. Einige Zeit später setzt die Lüftersteuerung wieder ein, regelt den Schreihals herunter, nach einigen Minuten wiederholt sich das Spiel aber.



Dass wir ein defektes Testsample erwischt haben, ist somit durchaus möglich, zudem wiederholt sich das gesamte Prozedere unter Last ebenso. Falls dies kein Fehler in der Lüftersteuerung ist, hat ATi beziehungsweise später die Kartenhersteller noch einiges zu verbessern – das ständige „Auf und Ab“ nervt den Kunden mehr als ein andauernd mit voller Drehzahl laufender Lüfter. Der Speicher ist ein mit einer Zugriffszeit von 1,4 ns ausgestatteter GDDR3-RAM, der mit 500 MHz taktet und 256 MB groß ist. Ebenso wie der größere Bruder besitzt die Karte zwei DVI-Ausgänge und einen TV-Out mit ViVo-Funktionalitäten.



Radeon X1600 XT
Die ATi Radeon X1600 XT setzt auf den deutlich einfacheren RV530-Kern, der als Ausgleich mit einer deutlich einfacheren Kühlung zurechtkommt. Der Chip verfügt über 12 Pixel-Pipelines, die jeweils aber nur noch vier Texture Mapping Units und vier Rasteroperationseinheiten besitzen, womit man insgesamt eine deutlich schlechtere Füllrate bietet. Der Chip gewinnt somit eher durch fixe Shader-Berechnungen an Performance und sollte unserer Meinung nach bei älteren, texturlastigen Spielen nicht ganz so flott unterwegs sein.
Das PCB ist mit zirka 17 cm deutlich kompakter als das der beiden X1800-Derivate und erinnert sehr an die modernen Mid-Range-Grafikkarten. Der Kühlkörper besteht erneut aus Kupferlamellen und bedeckt neben der GPU auch zwei weitere RAM-Bausteine mit, die restlichen zwei bleiben dagegen ungekühlt. Der eigentliche Kühler ist identisch mit dem der Radeon X1800 XL und fällt mit einem Durchmesser von knapp 4,5 cm sehr klein aus. Leider ist aber nicht nur die Größe identisch, die Lautstärke ist es ebenso, wobei die kleine X1600 XT unerklärlicherweise noch eine volle Schippe drauflegt, um den mit 590 MHz getakteten Kern zu kühlen. Der Lüfter scheint sich nach dem Booten gar nicht mehr herunter zu regeln und bleibt konstant auf einem sehr hohen Niveau. Hier muss ATi noch nachbessern, dieser Lautstärkepegel ist kaum akzeptabel.



Der Speicher taktet mit schnellen 690 MHz, weswegen auch hier der hochwertige VRAM von Samsung wie auf der Radeon X1800 XT verbaut wird (1,2 ns Zugriffszeit). Mit 256 MB fällt dieser allerdings etwas kleiner aus. Die Radeon X1600 XT verfügt – was ungewöhnlich für eine Karte der mittleren Preisklasse ist – ebenso über zwei DVI-Ausgänge und einen TV-Ausgang. Der Preis der Radeon X1600 XT soll sich auf 249 US-Dollar belaufen, die CrossFire-Edition wird mit 299 Dollar zu Buche schlagen. Laut ATi soll die X1600 XT ab dem 30. Oktober im Handel erhältlich sein.


Radeon X1300 Pro
Auf der Radeon X1300 Pro wird der kleinste Chip der R5x0-Serie verbaut, der RV515. Jener verfügt wie die größere X1600 XT über vier ROPs und vier TMUs, kann jedoch nur noch auf vier Pixel-Pipelines zurückgreifen, weswegen er von ATi als Low-End-Chip angesehen wird. Entsprechende Karten sollen 149 US-Dollar kosten und ab sofort im Handel erwerbbar sein. Eine richtige CrossFire-Edition wird es bei der X1300-Serie dagegen nicht mehr geben, weil jene Karten nur über den PCIe-Bus kommunizieren müssen, da die erforderliche Bandbreite für diesen Weg gering genug ist.




Der Chip der X1300 Pro taktet mit satten 600 MHz und der 256 MB große GDDR3 Speicher, der über eine Zugriffszeit von 2,5 ns verfügt und von Infineon hergestellt wird, mit 400 MHz. Leider setzt ATi beim Referenzdesign auf das Lüftersystem von der Radeon X1600 XT, was auf der X1300 Pro ebenso laut arbeitet wie auf dem Mid-Range-Derivat und sich somit für einen Silent-Rechner mühelos disqualifiziert. Eine kleine, wenn auch unbedeutende Änderung gibt es dennoch: Auf der kleinsten Version werden nicht mehr zwei DVI-Anschlüsse, sondern ein DVI- und ein D-Sub-Ausgang sowie ein TV-Out verbaut.


AA und AF kontrolliert
Moderne Grafikkarten sollten nicht nur schnell sein, sondern auch ein exzellentes Bild liefern. Eine Möglichkeit, um jenes zu erreichen, auch wenn der gelieferte Grafik-Content des Spieles nicht allzu gut ausfällt, ist die Aktivierung von Anti-Aliasing, welches die Polygonkanten glättet, und ebenso das Hinzuschalten des anisotropen Filters, das die Texturen auch in weiter Ferne noch scharf erscheinen lässt. Da ATi als auch nVidia versuchen, in den Features den Konkurrenten zu übertreffen, erlebt man bei manch neuer Chipgeneration eine positive Überraschung – wobei eine Negative allerdings auch nicht ausgeschlossen werden kann –, da die Bildqualität sich verbessert hat. Aus diesem Grund gehört zu einem Grafikkarten-Review einer neuen Chipserie nicht nur das Testen der Geschwindigkeit, es sollte ebenfalls ein Blick auf die gelieferte Bildqualität geworfen werden.
Dabei werden wir beide Bildverbesserungsmechanismen nicht nur in der Praxis, sondern auch in der Theorie begutachten. So untersuchen wir die Qualität des anisotropen Filters mit dem oft benutzten Tool „AF-Tester“ sowie mit einer Spielszene aus Half-Life 2, wobei gar selbst erstellte Videos zur Kontrolle herangezogen werden. Auf den Ego-Shooter greifen wir auch bei den Untersuchungen des Anti-Aliasings zurück, jedoch werden wir zusätzlich die Sample-Positionen in dem Tool „FSAA-Viewer“ vergleichen.
nVidia G70




ATi R4x0




ATi R520




Auf den ersten Blick wird bereits deutlich, dass ATi beim Next-Generation-Chip R520 die Sample-Positionen im Gegensatz zum R4x0 nicht verändert hat – und dies ist auch durchaus gut so, denn ATis Anti-Aliasing-Modi glätten Geometrie-Pixel mehr als zufriedenstellend und man ist qualitativ gleichauf oder bietet je nach Spiel gar eine bessere Glättung als dies der G70 zu schaffen vermag. Nichtsdestotrotz hat nVidia neuester Spross zwei Vorteile gegenüber ATis bisherigen Samplepositionen: Super Sampling. Jenes ist in heutigen Spielen durchaus als wichtig anzusehen, da unter anderem für die Darstellung von Zäunen oder beispielsweise Blättern, sprich für aufwendige, transparente Geometrie, sogenannte Alpha-Test-Texturen benutzt werden, die allerdings nicht von herkömmlichen Multi-Sampling-Anti-Aliasing geglättet werden und somit unaufhaltsam flimmern.
In diesem Fall greift dann das von nVidia implementierte Super-Sampling ein, dass in einem Ordered-Grid-Muster angeordnet ist und damit auch jene Alpha-Test-Texturen bekämpft. Jedoch geht bereits bei 1x2 oder 2x1 SSAA die Hälfte und bei 2x2 SSAA bereits ein Viertel der vorhandenen Füllrate verloren, weswegen selbst moderne Grafikkarten bei aufwendigen Spielen deutlich in der Performance einbrechen. Hier hilft nVidias Transparency-AA, dass die benutzen Texturen analysieren kann und falls diese Alpha-Test-Texturen oder durchsichtige Shader-Oberflächen beinhalten, nur bei den entsprechenden Texturen aufwendiges SSAA verwendet, womit diese Texturen nicht mehr oder stark vermindert flimmern, wobei die Geschwindigkeit nur recht gering einbricht.
Dies konnte ATi aufgrund der starken Beliebtheit von TSSAA nicht auf sich beruhen lassen und baut einen Modi in die neue R520-Generation ein, der auf den Namen „Adaptive Anti-Aliasing“ hört und eine ähnliche Vorgehensweise wie das nVidia-Derivat hat. Jener bietet jedoch einige Vorteile gegenüber der nVidia-Variante, trotz der identischen Vorgehensweise. So wird bei Adaptive-AA im Gegensatz zu Transparency-AA kein Ordered-Grid-SSAA, sondern ein Rotated-Grid-SSAA benutzt, was aufgrund der besser angeordneten Samplepositionen eine bessere Glättung bietet. Zudem bietet ATi mit dem R5x0 im sogenannten „Quality“-Mode immer gleich viele Textur-Sample wie Geometrie-Sample an, sprich bei vier-fachem Adaptive-AA rendert die Grafikkarte mit 4xMSAA und 4xSSAA, bei 6xA-AA bereits mit sechs Geometrie- und ebensovielen Textur-Sample. Darüber hinaus ist das Adaptive-AA bei jeder von ATi angebotenen AA-Art, wie beispielsweise Super-AA und Temporal-AA, verwendbar.
Auf Nachfrage bei Raja Koduri, dem Senior Architekten von ATi, soll es auch einen Performance-Mode geben, der immer nur die Hälfte der eingestellten SSAA-Samples benutzt, sprich bei 4xA-AA vier-faches MSAA und 2xSSAA beziehungsweise 6xMSAA und 6xSSAA. Nur bei 2xAA soll die Anzahl der Textursamples gleich bleiben. Etwas überrascht waren wir jedoch beim Suchen dieses Performance-Modus, welcher schlicht und ergreifend nicht im Catalyst Control Center vorzufinden ist. Wahrscheinlich wird die entsprechende Funktion erst in einem neueren Treiber implementiert. Weiterhin teilte uns Koduri mit, dass der AA-Algorithmus programmierbar ist und somit auf die Sample-Anzahl und Sample-Position mit einem Treiberupdate Einfluss genommen werden kann.
nVidia G70




ATi R4x0




ATi R520





Wie man deutlich auf den Screenshots erkennen kann, arbeitet das herkömmliche Anti-Aliasing sowie das Adaptive-AA auf der neuen ATi-Grafikkarte einwandfrei und liefert eine sehr gute Bildqualität. Mit den bekannten AA-Modi werden die Geometrie-Kanten gleich gut wie auf den nVidia-Pendants geglättet, nur das 6xAA ist, wie gewohnt, dem 4xAA der Kalifornier leicht überlegen. Das neue Adaptive-AA arbeitet ebenfalls sehr gut, auch wenn uns hier erst die 6xAA-Variante überzeugen konnte. Zwar werden bereits bei 4xA-AA die Alpha-Texturen relativ gut geglättet, jedoch ist die nVidia-Lösung der von ATi noch leicht vorraus. Erst das 6xA-AA kann endgültig an der Konkurrenz vorbeiziehen. Das Adaptive-AA arbeitet trotz des Lobes aber auch nicht einwandfrei: So kann man an dem Kran einige Bildfehler erkennen, die aber hoffentlich in nächster Zeit behoben werden.
nVidia G70




ATi R4x0




ATi R520




ATi R520 (HQ)




Bei der Radeon X1k-Serie wird es wie bei dem R3x0 wieder einen Performance- und einen Quality-Mode bei der anisotropen Filterung geben. Der Performance-Modus unterschied sich so gut wie gar nicht von dem AF der alten R4x0-Serie, allerdings scheint das LOD minimal verschoben worden zu sein. Raja Koduri erwähnte uns gegenüber eine leicht verbesserte Präzision – ob durch jene der Effekt erzeugt wird, bleibt unbekannt und ist unserer Meinung nach auch relativ unwahrscheinlich.
Als wir den Quality-Modus aktivierten, trauten wir unseren Augen – oder eher gesagt dem AF-Tester – nicht: Der R5x0-Chip bietet wieder eine winkelunabhängige Filterung, was es bei ATi noch nie und bei nVidia seit dem NV35 nicht mehr gegeben hat! Zwar werden nicht alle Winkel mit dem voll eingestellten AF gefiltert, allerdings behandelt der neue AF-Algorithmus nun auch Winkel, die auf der Vorgängergeneration und auf den aktuellen nVidia-Grafikkarten einfach ignoriert werden. Dafür müssen wir ATi nach den deutlichen Verschlechterungen der Texturfilterung in letzter Zeit ein großes Lob aussprechen! Somit werden nun auch in Spielen mit eher untypischen Winkeln diese anisotrop gefiltert und nicht einfach ignoriert.
Das Bild mit 16-facher Filterung sieht im Gegensatz zu dem 8-fachem AF etwas merkwürdig aus. Warum die Blume in diesem Fall so aussieht, muss noch ungeklärt bleiben. So könnte es sein, dass ATi dort an der Präzision gespart hat, um nicht allzu viel Performance zu verlieren.
nVidia G70




ATi R4x0




ATi R520




ATi R520 (HQ)




Wie man auf den Screenshots und auch auf diversen selbstaufgenommenen Videos erkennen kann, hat sich die Bildqualität auch in der Praxis nicht verändert; das etwas veränderte LOD lässt sich auch bei mehrmaliger Wiederholung der Videos nicht erkennen. Somit ist das nVidia- und das ATi-AF qualitativ so gut wie gleichauf, solange bei nVidia die High-Quality-Einstellung verwendet wird und somit das Texturflimmern kaum noch auftritt. So kommt es auf das Spiel an, welcher Algorithmus das bessere Ergebnis liefert.
Ohne Probleme vorbeiziehen kann ATi jedoch mit dem neuen High-Quality-AF, was ATi auf den Namen „Area-Aniso“ getauft hat. Dieser filtert beinahe alle Winkel mit dem voll eingestellten AF-Grad, auch wenn das auf den Half-Life-2-Bildern nicht sichtbar wird, da diese nicht die entsprechenden Winkeln zeigen. Ein Spiel, das des öfteren diese Winkel benutzt, wäre beispielsweise „Gothic 2“.
AA und AF Performance
Anti-Aliasing - Half-Life 2
Angaben in Prozent
|
Wie man deutlich erkennen kann, verliert die neue Radeon X1800 XT beim Einsatz von Anti-Aliasing am wenigsten Performance im Vergleich zu der GeForce 6800 Ultra und 7800 GTX. Selbst bei 6xAA bricht die Karte nur um ungefähr 17 Prozent ein, während die GeForce 7800 GTX bereits bei 4-fachem AA mit 22 Prozent deutlich mehr einbricht. Das neue Adaptive-AA bricht ebenso wie bei der GeForce 7800 GTX nur minimal gegenüber herkömmlichem MSAA ein, weswegen man es aufgrund einer deutlich besseren Glättung von Alpha-Test-Texturen aktivieren sollte. Der 6xAA-Modus von ATi und das 8xSAA von nVidia sind aufgrund des Super-Sampling-Anteils von nVidia nicht direkt vergleichbar.
Anisotroper Filter - Half-Life 2
Angaben in Prozent
|
Der anisotrope Filter scheint bei der Radeon X1800 XT ebenfalls sehr effizient zu arbeiten. Bei 16-fachem AF bricht die Karte nur um 18 Prozent ein, selbst bei der winkelunabhängigen-Variante betragen die Geschwindigkeitseinbußen nur 22 Prozent, weshalb man das Feature auf jeden Fall aktivieren sollte, auch wenn die Karte bei anderen Spielen eventuell stärker einbricht.
Testsystem
Testsystem:
- Prozessor
- AMD Athlon 64 4000+ (San Diego-Kern, 90 nm, SSE3, 1024 kB Level-2-Cache)
- Motherboard
- Gigabyte GA-K8NXP-SLI (nVidia nForce 4 SLI, Sockel 939)
- Arbeitsspeicher
- 2x 512 MB Crucial BallistiX DDR400 (2-2-2-5)
- Grafikkarten
- ATi Radeon X1800 XT (625/750)
- ATi Radeon X1800 XL (500/500)
- ATi Radeon X1600 XT (590/690)
- ATi Radeon X1300 Pro (600/400)
- ATi Radeon X850 XT-PE (540/590) (Simuliert durch Übertakten der Radeon X850 XT)
- ATi Radeon X850 XT (520/540)
- ATi Radeon X850 Pro (507/520)
- ATi Radeon X800 XL (400/490)
- ATi Radeon X800 (400/350)
- nVidia GeForce 7800 GTX (430/600)
- nVidia GeForce 7800 GT (400/500)
- nVidia GeForce 6800 Ultra (425/550)
- nVidia GeForce 6800 GT (350/500) (Simuliert durch Heruntertakten der GeForce 6800 Ultra)
- nVidia GeForce 6800 (256 MB) (350/300)
- Peripherie
- Aopen AAP-1648Pro-DVD-Laufwerk
- Samsung S-ATA 2-HDD mit 200 GB Speicherplatz (NCQ aktiviert)
- Treiberversionen
- nVidia ForceWare 78.03
- ATi Catalyst 5.8
- ATi 8-173-1-050921a-026915E (Beta-Treiber für Radeon 1x00)
- Software
- Microsoft Windows XP Professional SP2
- Microsoft DirectX 9.0c
Benchmarks
Folgende Benchmarks kamen während unseres Tests zum Einsatz:
- Synthetische Benchmarks:
- 3DMark 01 SE Version 330
- 3DMark 05 Version 1.2.0
- Aquamark 3
- Spielebenchmarks:
- Unreal Tournament 2004
- Age of Empires 3 Demo
- Earth 2160
- Far Cry Version 1.3
- Splinter Cell: Chaos Theory
- Half-Life 2
- Doom 3
- The Chronicles of Riddick
Alle Benchmarks werden mit maximalen Details ausgeführt, damit die Grafikkarte möglichst hoch belastet wird. Als Einstellungen haben wir uns dabei für 1280x1024 und 1600x1200 entschieden. Damit zollen wir Tribut an die modernen High-End-Beschleuniger, die durch ihre Rechenkraft niedrigere Auflösungen als 1280x1024 CPU-limitiert werden lassen. Neben den reinen Auflösungen lassen wir den Benchmarkparcours auch mit 4-fachem Anti-Aliasing sowie 16-fachen anisotropen Filter durchlaufen, da dies oft vorkommende Qualitätseinstellungen sind.
Achtung: Nach sorgfältiger Überlegung and mehrfacher Analyse selbst aufgenommener Spielesequenzen, sind wir zu dem Schluss gekommen, im ForceWare-Treiber für nVidia-Karten die Qualitätseinstellungen auf High Quality anzuheben, da man nur mit diesem Setting das Texturflimmern effektiv bekämpfen kann. Zudem ist dieser Modus vergleichbar mit der Einstellung „Catalyst A.I. Off“ auf den ATi-Pendants, wodurch bei der Bildqualität größtenteils ein Gleichstand erreicht wird.
Treibereinstellungen: nVidia-Grafikkarten
- Systemleistung: Hohe Qualität
- Vertikale Synchronisierung: Aus
- MipMaps erzwingen: keine
- Trilineare Optimierung: Aus
- Anisotrope Mip-Filter-Optimierung: Aus
- Optimierung des anisotropen Musers: Aus
- Negativer LOD-Bias: Clamp
- Gamma-angepasstes AA (G70): Ein
- Transparenz AA (G70): Aus
Treibereinstellungen: ATi-Grafikkarten
- Catalyst A.I.: Standard
- Mipmap Detail Level: High Quality
- Wait for vertical refresh: Always off
- Adaptive Anit-Aliasing: Off
- High Quality AF: Off
- Truform: Always Off
Theoretische Benchmarks
- Dieses nützliche kleine Programm dient dazu, die Füllraten einer Grafikkarte zu messen. Im Gegensatz zu den bzw. im 3DMark integrierten Füllraten-Tests, die im Fall von Single-Texturing vornehmlich die Bandbreite messen, kann dieses Programm recht differenzierten Aufschluss über verschiedene Arten von Füllrate geben, unter anderem auch die Pixelshader-Füllraten, welche wir hier betrachten wollen.
Da die verwendeten Shader teilweise recht kurz und bandbreitenintensiv sind, haben wir die Auflösung möglichst weit erhöht, um den Fokus etwas mehr auf die Füllrate zu verlagern. Da hier mehrere mathematische Operationen pro Pixel nötig sind, wird die Füllrate durch die Erhöhung der Auflösung stärker belastet als die Bandbreite.
Getestet wurde in 1600x1200 in 32Bit mit 24Bit Z- und 8Bit Stencilbuffer und 60 Hz Refreshrate. - Download: Fillrate Tester [1]
- Der VillageMark wurde von PowerVR entwickelt und diente dazu, die Vorzüge des Kyro 2 zu verdeutlichen, da in jenem Benchmark der Overdraw mit einem Faktor von bis zu 10 besonders groß ist. Viele, besonders ältere Grafikkarten, berechnen hier auch die Oberflächen, die durch andere verdeckt sind und daher eigentlich nur verschwendete Bandbreite und Füllrate bedeuten, so dass dieser grafisch eigentlich nicht sehr aufwendige Benchmark doch öfter als man zunächst denkt zu einem Stolperstein wird. Deswegen ist es von größter Bedeutung in diesem Benchmark, eine gut funktionierende Technik zum Entfernen verdeckter Oberflächen (HSR = Hidden Surface Removal) zu besitzen.
Getestet wurde mit folgender Kommandozeile: [InstallDir]\D3DVillagemark.exe -benchmark=1 -width=xxxx -height=xxxx -bpp=32" - Weitere Informationen: PowerVR.com [2]
- Download: PowerVR.com [3]
VillageMark v1.20
Angaben in Bildern pro Sekunde (FPS)
|
- Der Fablemark wurde, wie auch der nachfolgende Templemark, von PowerVR entwickelt und dient trotz eines sehr hohen Anteils an Overdraw der Zurschaustellung der Stärken des Kyro-Chips was den Stencil-Buffer angeht.
Natürlich wird auch auf allen anderen Karten die Stencil-Performance stark gefordert, so dass dieser Test ein Indiz für kommende Spiele sein kann, die vor dem eigentlichen Rendering einen Z-/Stencil-only Pass einlegen, um vorab jeglichen Overdraw zu vermeiden.
Getestet wurde mit folgender Kommandozeile: [InstallDir]\D3DFablemark.exe -benchmark=1 -width=xxxx -height=xxxx -bpp=32" - Weitere Informationen: PowerVR.com [4]
- Download: PowerVR.com [5]
FableMark v1.0
Angaben in Bildern pro Sekunde (FPS)
|
- Der Templemark ist, genau wie der vorherige Fablemark, ursprünglich ein Demonstrationsprogramm von PowerVR gewesen. Da er jedoch eine Menge aktueller Features, wie Hardware-TnL, Bump Mapping und bis zu sechs Texturlagen in einem Durchgang unterstützt, eignet er sich auch gut als unabhängiger Benchmark, der garantiert nicht auf nVidia- oder ATi-Chips optimiert ist.
Getestet wurde mit folgender Kommandozeile: [InstallDir]\templedemov1-0-6.exe -benchmark" - Weitere Informationen: PowerVR.com [6]
- Download: PowerVR.com [7]
TempleMark v1.06
Angaben in Bildern pro Sekunde (FPS)
|
- Der ShaderMark liegt zur Zeit in der aktuellen Version 2.1 vor und wurde von Tommti-Systems [8] entwickelt. Dank zahlreichen Updates befindet sich der Benchmark immer noch auf der Höhe der Zeit und misst die Performance der Shader-Einheiten moderner Grafikkarten. Dabei unterstützt das Programm auch das Shader-Model 3.0, weswegen es sich gut zu einem Vergleich aktueller Architekturen eignet. Getestet werden dabei bis zu 25 unterschiedliche Shader-Anweisungen unter der Auflösung 1024x768, die allesamt in der Hochsprache HLSL (High Level Shader Language) geschrieben sind.
- Download: ShaderMark.de [9]
Synthetische Benchmarks
3DMark2001 SE
- Obwohl der 3DMark01 SE bereits seit vier Jahren seinen Dienst verrichtet und technisch nicht mehr auf dem aktuellen Stand ist, wird er immer noch mit großer Beliebtheit von der Community verwendet. Aus diesem Grund und auch, da sich der Benchmark aus dem Hause Madonion, mittlerweile bekannt unter dem Namen Futuremark, immer noch gut dazu eignet die Gesamtperformance eines Systems zu messen, werden wir die zu testenden Treiber unter dem Programm auf Herz und Nieren überprüfen. Darüber hinaus reagiert der 3DMark01 SE sehr empfindlich auf Änderungen am System oder auch am Grafikkartentreiber, weswegen er gerade prädestiniert für diese Aufgabe ist. Technisch gesehen ist, wie bereits erwähnt, der Benchmark nicht mehr auf der Höhe der Zeit, weshalb er eine deutliche CPU-Limitierung aufweist. Der 3DMark01 SE setzt größtenteils auf DirectX 7-Effekte, benutzt die Vertexshader entsprechender Grafikkarten allerdings, um die CPU im Bereich der Schatten und Charakteranimation zu entlasten. Zaghafte Versuche die Vertexshader-Einheiten der Version 1.1 zu benutzen zeigen sich zudem in der letzten der vier Testszenen. Nicht vergessen darf man allerdings, dass der synthetische Benchmark kein Ergebnis eines realen Spiels darstellt, auch wenn er die in Max Payne verwendeten MaxFX-Engine benutzt.
- Download: 3DMark2001 SE [10]
3DMark2001 SE
Angaben in Punkten
|
3DMark2001 SE
Angaben in Punkten
|
3DMark05
- Der 3DMark05 ist das neueste Produkt aus dem Hause Futuremark und liegt technisch auf sehr hohem Niveau. So kommen große Texturen mit der Auflösung 2048x2048, gemischt mit der Benutzung des Shader-Model 3.0, 2.x oder 2.0, zum Einsatz. Das letztes Jahr erschienene Programm setzt auf komplexe Lichteffekte, dynamische Schatten, aufwendige Bump Mapping-Effekte und benötigt vor allem eine hohe Geometrieleistung. Im Ergebnis spiegelt sich allerdings nur die Geschwindigkeit der Grafikkarte wieder, da diese selbst bei aktueller Hardware immer den Flaschenhals darstellt. Der wohl größte Nachteil beim 3DMark05 sind die weitläufigen Treiberoptimierungen aller aktuellen Grafikkartenhersteller. Diese gehen soweit, dass sich die Endergebnisse je nach Treiber im zweistelligen Prozentbereich verändern, somit können qualitätsmindernde Optimierungen nicht ausgeschlossen werden. Zudem basiert der synthetische Benchmark auf keinerlei Spieleengine, weshalb er keine reale Situation darstellt. Weitere Details zu diesem Programm gibt es in einem unserer ausführlichen Artikel [11].
- Download: 3DMark05 [12]
3DMark05
Angaben in Punkten
|
3DMark05
Angaben in Punkten
|
AquaMark 3
- Kommen wir nun zu dem letzten synthetischen Benchmark in unserem Testparcours. Das von Massive Development entwickelte Programm nutzt eine erweiterte Version der Grafikengine aus dem U-Boot-Spiel AquaNox 2 - Revelation. Die Engine hört auf den Namen Krass und unterstützt mittlerweile auch Pixelshader 2.0-Effekte. Darüberhinaus kommen noch Pixelshader der älteren Version 1.1 sowie 1.4, weiterhin auch die Vertexshader 1.1, zum Einsatz. Angereichert mit einigen schönen Effekten wie zum Beispiel einem verbesserten Partikelsystem soll dies laut den Entwicklern der erste DirectX 9-fähige Reality-Benchmark der Welt sein.
- Download: AquaMark3.com [13]
Aquamark 3
Angaben in Bildern pro Sekunde (FPS)
|
Aquamark 3
Angaben in Bildern pro Sekunde (FPS)
|
Spielebenchmarks
Unreal Tournament 2004
- Unreal Tournament 2004 ist der ein Jahr später erschienene Nachfolger des Ego-Shooters UT 2003. Technisch basiert er auf der selben Engine, allerdings wurde diese minimal modifiziert. So wird nun ein zarter Gebrauch der Vertexshader gemacht, auch Pixelshader der Version 1.4 kommen zum Einsatz, um Berechnungen schneller durchführen zu können. Weiterhin ist eine starke Transform and Lighting-Einheit entscheidend für die Performance, da UT 2004 umfangreichen Gebrauch davon macht. Die von uns verwendete „Primeval-Timedemo“ stammt von den Kollegen des 3DCenter [14] und zeigt eine Szene auf der weitläufigen Map Primeval. Hochauflösende Texturen, hohe Sichtweiten und ein starkes Gegneraufkommen mit schwerem Waffenfeuer und dementsprechend vielen Effekten werden geboten. Die Timedemo ist ebenfalls erst in höheren Qualitätsmodi GPU-fordernd.
Unreal Tournament 2004
Angaben in Bildern pro Sekunde (FPS)
|
Unreal Tournament 2004
Angaben in Bildern pro Sekunde (FPS)
|
Age of Empires 3
- Wohl kaum ein Strategiespiel wie „Age of Empires“ und dessen Nachfolger haben aufgrund deren Erfolge Geschichte unter den PC-Spielern geschrieben. Nun erscheint der dritte Teil der Serie, welcher mit einer für Strategietitel atemberaubenden Grafik erscheint, die dazu modernste Techniken wie das Shader-Model 3.0 und gar High-Dynamik-Range-Rendering unterstützt. Wir lassen für den Testparcours eine Zwischensequenz aus der Demo durchlaufen, die einige anspruchsvolle Szenen enthält. Jedoch haben wir die Shader-Details auf „High“ heruntergesetzt, da die Stufe „Very High“ nur auf SM3-kompatiblen Grafikkarten verfügbar ist und SM2-Karten einige grafische Details somit nicht darstellen können, was die Ergebnisse verfälschen würde. Leider kann Age of Empires 3 in den Qualitätseinstellungen nur mit dem anisotropen Filter getestet werden, da das Anti-Aliasing auf ATi-Karten gravierende Fehler bereitete und das Spiel abstürzen ließ.
Age of Empires 3
Angaben in Bildern pro Sekunde (FPS)
|
Age of Empires 3
Angaben in Bildern pro Sekunde (FPS)
|
Splinter Cell 3
- „Chaos Theory“ ist der Titel des dritten Teils der bekannten Schleichreihe „Splinter Cell“ vom Publisher Ubi Soft und setzt auf ein stark modifiziertes Grundgerüst der zweiten Unreal-Grafikengine auf. Diese wurde für den neuesten Splinter Cell-Spross deutlich umgeändert und unterstützt nun neben dem Shader-Model 3.0 unter anderem auch High Dynamic Range-Effekte. Somit ist Splinter Cell 3 das zweite Spiel neben Far Cry, welches einen deutlich erweiterten Wertebereich der erfassbaren Lichtintensität aufweisen kann. Weiterhin kann das Spiel mit schönen Schatten- sowie Bump Mapping-Effekten auftrumpfen. Die selbst erstellte Timedemo zeigt einen kleinen Ausschnitt aus der ersten Mission, die den Hauptprotagonisten Sam Fischer über einen dunklen Strand bei Regen und durch eine mit schicken Lichteffekten verzierte Höhle führt. Die nVidia-Karte sowie der R5x0 von ATi werden dabei auf das SM 3.0 zurückgreifen, während sich die ATi X800 mit dem SM 2.0 begnügen muss. Alle exklusiven SM 3.0-Effekte wie beispielsweise HDR oder Parallax-Mapping werden deaktiviert, damit die GeForce-Karte nicht benachteiligt wird.
Splinter Cell 3
Angaben in Bildern pro Sekunde (FPS)
|
Splinter Cell 3
Angaben in Bildern pro Sekunde (FPS)
|
Earth 2160
- Earth 2160 ist der Nachfolger des erfolgreichen Echtzeit-Startegiespiels Earth 2150 und setzt wie der Vorgänger auf modernste Techniken, was sich auch in der sehr guten Grafikqualität bemerkbar macht. Das Spiel bietet nicht nur detaillierte Texturen, aufwendige Rauch- sowie Partikeleffekte, auch „Geometry Instancing“, ein Shader-Model-3.0-Effekt, wird geboten. Zudem setzen die Hersteller auf reichlich Licht- und Schatten-Effekte, ebenso protzt die Grafik mit überaus schicken Feuergefechten und Explosionen. Wir verwenden die integrierte Timedemo, die eine effektvolle Schlacht mit vielen Fahr- und Fluggeräten zeigt.
Earth 2160
Angaben in Bildern pro Sekunde (FPS)
|
Earth 2160
Angaben in Bildern pro Sekunde (FPS)
|
Far Cry
- Far Cry gehört wohl zweifellos zu den technisch am weitesten entwickelten Spielen und sieht dementsprechend auch sehr gut aus. Es gibt fast kein Feature einer Grafikkarte, das die Programmierer vom deutschen Entwicklerteam Crytek nicht bedacht und implementiert haben. Die Liebe zur Grafik geht sogar soweit, dass Features wie die Unterstützung des Shader-Model 3, High Dynamic Range oder die Texturkompression 3Dc [15] nachträglich per Patch eingebaut werden. Dementsprechend fordert Far Cry das Maximum an Leistung aus jedem PC und eignet sich somit hervorragend als Benchmark.
In unserem Test verwenden wir die Pier-Timedemo, die die Kollegen des Print-Magazins PC Games Hardware [16] aufgenommen haben. Diese Timedemo zeigt einen Ausschnitt des Levels „Pier“ und besteht somit aus weitläufigen Außenarealen mit einer extremen Sichtweite. Es werden aufwendige Wassereffekte dargestellt sowie eine hohe Anzahl von Polygonen, die den Rechner aufs Höchste beanspruchen. Die Texturen sind durchgehend detailliert und sehr aufwendig gestaltet. Bei den getesteten Grafikkarte von nVidia und den neuen Modellen von ATi kommt das Shader-Model 3.0 zum Einsatz, während die R4x0-Serie weiterhin das Shader-Modell 2.b verwendet. Deswegen gibt Far Cry auch einen kleinen Einblick in die zukünftige Welt der Spiele und ist quasi ein Muss für jeden Grafiktest.
Far Cry
Angaben in Bildern pro Sekunde (FPS)
|
Far Cry
Angaben in Bildern pro Sekunde (FPS)
|
Half-Life 2
- Half-Life 2 ist wohl zweifellos aufgrund seines legendären Vorgängers eines der meist erwarteten Spiele aller Zeiten gewesen. Nun ist es da und begeistert nicht nur in spielerischer Hinsicht, sondern auch durch seine Grafik, die unter anderem durch massiven Shader Model 2.0-Einsatz ermöglicht wird. Für Half-Life 2 haben wir uns eine eigene Timedemo aufgenommen. Sie spielt in der Map „Coast_09“, welches zu den anspruchsvollsten Levels im gesamten Spiel gehört. Es zeigt eine Szene, in der der Held Gordon Freeman in einem kleinen Hovercraft-Boot auf einem Fluss fährt und gleichzeitig herabfallenden Bomben eines Helikopters ausweichen muss, die effektvoll explodieren. Die Timedemo stellt ein regelrechtes „Worst-Case“-Szenario dar; wenn dort alles flüssig läuft, sollte dies auch im restlichen Spiel der Fall sein. Anspruchvoll sind dabei aber nicht alleine die Pixelshader-Effekte. So gibt es viele aufwendige Partikeleffekte wie auch sehr detaillierte Texturen. Die Umwirbelungen der Luft auf dem Wasser, die durch den Rotor des Helikopters erzeugt werden, stellen höchste Anforderungen an die Grafikkarte und zwingen diese mit Leichtigkeit in die Knie.
Half-Life 2
Angaben in Bildern pro Sekunde (FPS)
|
Half-Life 2
Angaben in Bildern pro Sekunde (FPS)
|
Doom 3
- Angst? Schock? Dunkelheit? Grafikpracht? All dies gibt es wohl zu Genüge im Gruselshooter Doom 3. John Carmack, einer der Chefentwickler des Spiels und eine legendäre Persönlichkeit, wenn es um spektakuläre Grafik-Engines geht, hat bei seinem neuesten Werk die größte Aufmerksamkeit den Stencil-Schatten gewidmet. Dementsprechend dunkel ist das gesamte Spiel, damit die schablonenartigen Schatten gut auf den Spieler wirken. Aber dies waren noch nicht genug Effekte für den Entwickler ID-Software. So macht Doom 3 auch Gebrauch von den Pixelshader-Einheiten der Grafikkarten und setzt ebenfalls massiv auf Bump Mapping sowie Normal Maps. Zwar sind die Texturen verbesserungswürdig, aber trotzdem gehört Doom 3 zu den anspruchsvollsten Titeln des Jahres 2004 und ist somit prädestiniert für unseren Benchmarkparcours. Das Spiel setzt ID-typisch nicht auf DirectX als API, sondern auf OpenGL.
Doom 3
Angaben in Bildern pro Sekunde (FPS)
|
Doom 3
Angaben in Bildern pro Sekunde (FPS)
|
The Chronicles of Riddick
- „The Chronicles of Riddick“ lehnt sich an den Kinofilm „Riddick: Chroniken eines Kriegers“ an und basiert auf der OpenGL-API. Dabei gehört Riddick zu einer der größten Überraschungen des Jahres und bietet dementsprechend auch eine sehr fordernde und vor allem spektakuläre Grafik. Dabei kommen nicht nur die modernen Shadereinheiten aktueller Grafikkarten zum Zuge, auch durch hochauflösende Texturen sowie feinste Bump Mapping-Effekte geraten heutige GPUs ins Schwitzen. Die verwendete Timedemo Panoptical 1 zeigt einen reellen Spielausschnitt aus Riddick, welcher mehrere Schusswechsel, Explosionen sowie Rauch beinhaltet, und zeigt somit eine für das Spiel realistische Performancedarstellung.
The Chronicles of Riddick
Angaben in Bildern pro Sekunde (FPS)
|
The Chronicles of Riddick
Angaben in Bildern pro Sekunde (FPS)
|
Performancerating
Kommen wir nun abschließend zum Performancerating. Dadurch soll es erleichtert werden, alle Ergebnisse auf einen Blick zusammengefasst zu bekommen, auch wenn man sich dadurch kein differenziertes Bild machen kann. Um dies zu erreichen, sollte man sich alle Ergebnisse im Einzelnen ansehen.
Performancerating 1280x1024
Angaben in Prozent
|
Performancerating 1600x1200
Angaben in Prozent
|
Performancerating Qualität
Rating 1280x1024 4xAA/16xAF
Angaben in Prozent
|
Rating 1600x1200 4xAA/16xAF
Angaben in Prozent
|
Sonstiges
Lautstärke
Da quasi alle aktuellen Modelle über eine herstellerseitige Lüftersteuerung verfügen, unterscheiden wir bei den Messungen den 2D- und den 3D-Betrieb. Für die Last-Messungen wird der 3DMark05 in der Endlosschleife ausgeführt und nach dreißig Minuten die Lautstärke notiert. Beide Messungen werden im Abstand von 15 cm zur Grafikkarte durchgeführt. Um nur die Lautstärke der jeweiligen Grafikkarte messen zu können, wurden beim Test die Gehäuselüfter vom Netz getrennt.
Lautstärke
Angaben in Dezibel
|
Punkten konnte bei der Lautstärke vor allem die schnellste ATi-Karte, die Radeon X1800XT. Jene kommt zwar nicht ganz an den Geräuschpegel der GeForce 7800 GTX heran, arbeitet aber trotzdem auf einem angenehmen Niveau. Überhaupt nicht gefallen hat uns jedoch die Radeon X1800 XL, wobei wir hier einen Defekt der Lüftersteuerung aber nicht ausschließen können. Jene wechselte selbst unter Windows andauernd die Geschwindigkeiten des Lüfters, was wir als äußerst störend empfunden haben. Weniger schlimm, aber dennoch zu laut waren die Lüfter der Radeon X1600 XT und X1300 Pro. Diese sind eigentlich lauter als die X1800 XL, blieben aber immer konstant auf diesem sehr hohen Niveau. Nichtsdestotrotz disqualifizieren sich beide Karten direkt für einen Silent-PC.
Temperatur
Ähnlich den Messungen zur Lautstärke werden auch die Temperatur-Messungen durchgeführt. Fast alle aktuellen Grafikkarten besitzen Sensoren, die per Treiber oder Hersteller-Tool ausgelesen werden können. Die Kern-Temperatur wird dabei im Ruhezustand im Windows-Desktop und unter Last nach dreißig Minuten 3DMark05 abgelesen. Zudem messen wir mit Hilfe eines Infrarot-Thermometers die Chiptemperatur auf der Rückseite der Grafikkarte.
Temperatur
Angaben in °C
|
Leider gibt es zur Zeit kein Tool, dass die Chiptemperatur über den internen Temperatursensor der X1k-Grafikkarten auslesen kann, ebenso ist dies im Treiber derzeit nicht möglich. Auf der Chiprückseite stellte sich die Radeon X1800 XT als ein ziemlicher Hitzeliebhaber heraus und „erkämpft“ sich dort somit den ersten Platz der wärmsten Grafikkarten. Die Radeon X1800 XL blieb dagegen immer schön kühl und reiht sich in das Mittelfeld ein. Die X1600 XT und X1300 Pro sind sogar noch ein Stück kälter, womit man die Karten problemlos auch längere Zeit in schlecht belüfteten Gehäusen einsetzen kann.
Stromverbrauch
Für die Messungen der Stromaufnahme wird ein handelsüblicher Verbrauchs-Monitor, den man sich auch beim örtlichen Stromversorger ausleihen kann, genutzt. Gemessen wird die Gesamt-Stromaufnahme des Testsystems. Auch hier gilt die Teilung zwischen Idle- und Last-Betrieb, letzterer wird erneut durch Verwendung des 3DMark05 simuliert.
Stromverbrauch
Angaben in Watt (W)
|
Trotz des 90-nm-Prozesses scheinen die Radeon X1k-Karten allgemein sehr viel Strom zu benötigen. Die X1800 XT benötigt ebenso wie die X1800 XL unter Windows vergleichsweise viel Strom. Die beiden kleineren Karten sind zwar etwas genügsamer, besitzen aber für ihre Leistungsklasse ebenfalls eine sehr hohe Stromaufnahme. Unter Last sieht es dagegen schon deutlich besser aus und die Radeon-Karten liegen in etwa gleich auf mit den nVidia-Pendants, die dennoch immer etwas sparsamer arbeiten.
HDTV-Wiedergabe
Zum Einsatz in dieser Disziplin kam der schon altbekannte Film-Trailer namens „Step into Liquid“, der eine Länge von einer Minute und 56 Sekunden hat und in der Auflösung von 1920x1080 Pixel (1080p) vorliegt. Wer unseren Test auf seinem System nachahmen möchte, kann das Video direkt bei Microsoft herunterladen [17] (Direktlink - 114 MB), benötigt aber zusätzlich jeweils die neuesten Treiber aus dem Hause nVidia [18] und ATi [19], den Media Player in der Version 10 [20] und ein spezielles Hotfix [21], damit der Player die HDTV-Beschleunigung auch unterstützt. Die CPU-Last wurde während des Abspielens von uns mittels ThrottleWatch und einem selbst geschriebenen Skript aufgezeichnet.
Zuallererst möchten wir anmerken, dass keine der Radeon X1k-Grafikkarten das HDTV-Video ohne grobe Bildfehler wiedergeben konnte. Dieser Fehler ist ATi bekannt und sollte in dem nächsten Treiber behoben sein, also ist bei den Ergebnissen etwas Vorsicht angebracht. Die neuen ATi-Grafikkarten liegen in etwa gleich auf mit den nVidia-Derivaten.
Fazit
Nun ist es endlich soweit. Nach einer langen Durststrecke ohne einen richtigen Konkurrenten, ist es nun wieder Zeit für einen Kampf um die Spitze. Der R520-Chip ist größtenteils eine Neuentwicklung, weswegen er nicht nur effizienter arbeitet als der Vorgänger, sondern auch um wichtige Features erweitert wurde, die jeder Chip der R5x0-Serie beherrscht. Adaptive Anti-Aliasing zur Glättung von Alpha-Test-Texturen war dabei ein richtiges Muss, da nVidia mit Hilfe ihres Transparency Anti-Aliasing jene Texturen bereits seit längerer Zeit ohne einen allzu großen Performanceverlust glätten kann. ATis Adaptive-AA setzt gar noch einen drauf und glättet mit einer sehr guten Performance im 6xA-AA-Modus die transparenten Texturen zwar nicht perfekt, aber durchaus sehr gut und auch besser als es nVidia auf dem G70 bis jetzt kann.
Richtig gut gefallen hat uns der neue anisotrope Filter. Während im Performance-Modus mit dem bekannten AF-Algorithmus des R4x0 nur Hausmannskost angeboten wird, weiß das neue „Area-AF“ richtig zu gefallen. Endlich gibt es wieder eine (größtenteils) winkelunabhängige Texturfilterung, die nicht einige Winkel rigoros auslässt und somit gibt es je in Spielen mit ungünstigen Winkeln keinen Textur-Matsch. Hier gebührt ATi ein großes Lob, da sie mit jeder neuen Generation die Qualität des anisotropen Filters nach oben geschraubt haben – hierbei muss man aber auch zugeben, dass dies nach dem schlechten AF des R200 auch kein Kunststück gewesen ist. Auch hier zeichnet sich somit eine Überlegenheit gegenüber dem derzeitigen Top-Produkt von nVidia ab.
Neben dem Shader-Model 3.0 unterstützen die R5x0-Karten nun auch endlich High-Dynamik-Range-Rendering, können sich aber auch hier durch ein wichtiges Features vor den G70 der Kalifornier setzen: Bei der Radeon X1k-Serie funktioniert bei aktiviertem HDR nun auch Anti-Aliasing und somit muss man nicht mehr nur mit einem Kompromiss leben, wie man es bisher getan hat, sondern kann sich auf eine dynamische Farbanpassung inklusive geglättete Kanten freuen.
Performancemäßig sieht es aufgrund der deutlichen Verspätung nicht allzu rosig aus, dennoch ist der neue Chip nicht langsam. Während sich das Top-Produkt X1800 XT in den einfachen Qualitätsmodi noch leicht gegenüber der GeForce 7800 GTX geschlagen geben muss, übernimmt das neue ATi-Derivat bei Einsatz von AA und AF die Führung. Ebenfalls gefallen hat uns der nur sehr geringe Geschwindigkeitsverlust beim Einsatz des Area-AFs. Bei der etwas kleineren X1800 XL ergibt sich ein ähnliches Bild gegenüber der direkten Konkurrenz, der GeForce 7800 GT. Während man diesmal bei vier fachem Anti-Aliasing und bei 16-facher anisotroper Filterung gleich auf mit der 7800 GT ist, muss man sich ohne diese Features hinter dem nVidia-Chip einreihen.
Die Radeon X1600 XT hat es zur Zeit noch etwas schwer, was aber teilweise auch an unserem schnellen Testparcours liegt. Jene Grafikkarte kämpft aufgrund der etwas ungewöhnlichen Architektur vor allem bei texturlastigen Spielen, wogegen sie bei Spielen, in denen die Shader limitieren, richtig aufblühen kann. Da es in naher Zukunft immer mehr Shader-limitierte Spiele geben wird, kann sich die Designentscheidung von ATi durchaus als richtig und vielleicht als gar richtig geschickt erweisen – dies wird die Zeit zeigen müssen. Nichtsdestotrotz weiß der RV530, vor allem aufgrund der fortschrittlichen Features, auch schon heute zu gefallen.
Die Radeon X1300 Pro sieht aufgrund des viel zu starken Testparcours, der größtenteils vor allem aus viel teureren Grafikkarten besteht, logischerweise kein Land mehr. Hier muss man ihn jedoch entschuldigen, da es in dem Testfeld keine richtige Konkurrenz für ihn gibt. Etwas Probleme bereit dagegen noch der Treiber, der sich aber noch in einem Beta-Stadium befindet. So war es uns nicht möglich, das HDTV-Video ohne grobe Bildfehler abzuspielen – somit ist es zur Zeit nicht möglich, auf einem R5x0-Chip HDTV-Videos zu genießen, allerdings ist ATi dieser Bug bereits bekannt und er sollte bald mit einem Treiber-Update behoben werden. Ebenfalls Bildfehler liefern Half-Life 2 bei Einsatz des Adaptive-AAs und Far Cry, der 3DMark05 und Aquamark 3. Während es bei den letzten beiden Probleme mit der Qualmdarstellung gibt, weist Far Cry diverse Texturfehler auf – aber auch hier sind wir sicher, dass diese Fehler bald passé sind.
Lange Rede, kurzer Sinn: Der R5x0 hat uns insgesamt vor allem aufgrund der Features sehr gut gefallen. Zwar kommt er aus Performancesicht nicht immer an die nVidia-Konkurrenz heran oder gar vorbei, jedoch opfern wir gerne etwas Geschwindigkeit, um mit einer besseren Bildqualität spielen zu können. Zudem wird dies sicherlich noch nicht das Ende der Fahnenstange für die Radeon X1k-Serie sein, mit zukünftigen Treibern kann man sicherlich noch etwas an Geschwindigkeit herausholen. Wir sind bereits gespannt auf die endgültigen Produktlösungen der Hersteller!











