Dass die kleine spanische Insel Ibiza im sonnigen Mittelmeer mehr als nur ein Ferienparadies sein kann, zeigte sich an diesem Wochenende bei der Präsentation der neuen Grafikchips von ATi, der R5xx-Familie. Neben einem umfangreichen Abendprogramm sowie diversen Freizeitunterhaltungen zwischendurch, wurde natürlich auch das Geheimnis um die neue ATi-Generation gelüftet und die frischen Stücke Silizium in Form der Radeon-X1800-, der X1600- und X1300-Serien ausführlich vorgestellt.
Auf jene wartet man mittlerweile schon mehrere Monate und immer wieder war von Fertigungsproblemen sowie Verschiebungen die Rede. Ebenso kamen Gerüchte über 32 Pixel-Pipelines und Chiptaktraten von 700 MHz auf. All diese Spekulationen sind nun mit der Präsentation in Vergessenheit geraten, womit ab dem heutigen Tag endlich Klarheit über den Hauptkonkurrenten der GeForce 7800 GTX von nVidia herrscht, den R520.
Shader-Model 3.0, einen 512 MB großen VRAM, angepasste FP16-Blending-Einheiten in den ROPs sowie FP16-fähige TMUs zur Darstellung von High-Dynamic-Range-Rendering, neue Funktionen zur Bildverbesserung und Beschleunigung von HDTV-Videos; ATi hat sich eine Menge vorgenommen, um die Konkurrenz aus Kalifornien zu schlagen. Da wir zu den Glücklichen gehörten und verschiedene Modelle der neuen Radeon-Familie gleich mit nach Hause nehmen durften, wird sich in diesem Artikel zeigen, wie sich der neue R520 und seine kleinen Geschwister in mehreren Disziplinen gegen die GeForce 7800 GTX und andere nVidia-Derivate behaupten können.
Dabei werden wir nicht nur einen Blick auf die beliebten Spiele-Benchmarks werfen, auch die Filterqualität des anisotropen Filters wird kurz untersucht werden – in der Vergangenheit wurde hier bei neuen Chipgenerationen des Öfteren die Bildqualität gesenkt, damit man, aufgrund der gewonnenen Füllrate, in Benchmarks besser dasteht. Darüber hinaus werden auch die vorhandenen Anti-Aliasing-Modi kontrolliert. Vielleicht gibt es ja beim R520 etwas Neues, das gegen nVidias viel gelobtes Transparency-AA, welches hilfreich gegen flimmernde Alpha-Test-Texturen ist, bestehen kann?
| Radeon X1800 XT | Radeon X1800 XL | Radeon X1600 XT | Radeon X1600 Pro | Radeon X1300 Pro | Radeon X1300 | |
| Logo |
|
|
|
|||
| Chip | R520 | R520 | RV530 | RV530 | RV515 | RV515 |
| Transistoren | ca. 321 Mio. | ca. 321 Mio. | ca. 157 Mio. | ca. 157 Mio. | ca. 105 Mio. | ca. 105 Mio. |
| Fertigung | 0,09 µm | 0,09 µm | 0,09 µm | 0,09 µm | 0,09 µm | 0,09 µm |
| Chiptakt | 625 MHz | 500 MHz | 590 MHz | 500 MHz | 600 MHz | 450 MHz |
| Pixel-Pipelines | 16 | 16 | 4 | 4 | 4 | 4 |
| ROPs | 16 | 16 | 4 | 4 | 4 | 4 |
| Pixelfüllrate | 10000 MPix/s | 8000 MPix/s | 2360 MPix/s | 2000 MPix/s | 2400 MPix/s | 1800 MPix/s |
| TMUs je Pixel-Pipeline | 1 | 1 | 4 (insgesamt!) | 4 (insgesamt!) | 1 | 1 |
| Texelfüllrate | 10000 MTex/s | 8000 MTex/s | 2360 MTex/s | 2000 MTex/s | 2400 MTex/s | 1800 MTex/s |
| Vertex-Pipelines | 8 | 8 | 5 | 5 | 2 | 2 |
| Dreiecksdurchsatz | 1250 MV/s | 1000 MV/s | 738 MV/s | 625 MV/s | 300 MV/s | 225 MV/s |
| Pixelshader | PS 3.0 | PS 3.0 | PS 3.0 | PS 3.0 | PS 3.0 | PS 3.0 |
| Vertexshader | VS 3.0 | VS 3.0 | VS 3.0 | VS 3.0 | VS 3.0 | VS 3.0 |
| Speichermenge | 512/256 GDDR3 | 256 GDDR3 | 256/128 GDDR3 | 256/128 GDDR3 | 256 GDDR3 | 256/128 GDDR3 |
| Speichertakt | 750 MHz | 500 MHz | 690 MHz | 390 MHz | 400 MHz | 250 MHz |
| Speicherinterface | 256 Bit | 256 Bit | 128 Bit | 128 Bit | 128 Bit | 128 Bit |
| Speicherbandbreite | 48000 MB/s | 32000 MB/S | 22080 MB/s | 12480 MB/s | 12800 MB/s | 8000 MB/s |
| Präzision pro Kanal | FP32 | FP32 | FP32 | FP32 | FP32 | FP32 |
| Interface | PCIe | PCIe | PCIe | PCIe | PCIe | PCIe |
| SLI/CF-Unterstützung | Ja | Ja | Ja | Ja | Ja | Ja |
| GeForce 6800 Ultra | GeForce 7800 GT | GeForce 7800 GTX | Radeon X850 XT-PE | |
| Logo |
|
|
|
|
| Chip | NV40/45 | G70 | G70 | R480 |
| Transistoren | ca. 222 Mio. | ca. 303 Mio. | ca. 303 Mio. | ca. 160 Mio. |
| Fertigung | 0,13 µm | 0,11 µm | 0,11 µm | 0,13 µm low-k |
| Chiptakt | 400 MHz | 400 MHz | 430 MHz | 540 MHz |
| Pixel-Pipelines | 16 | 20 | 24 | 16 |
| ROPs | 16 | 16 | 16 | 16 |
| Pixelfüllrate | 6400 MPix/s | 6400 MPix/s | 6880 MPix/s | 8640 MPix/s |
| TMUs je Pixel-Pipeline | 1 | 1 | 1 | 1 |
| Texelfüllrate | 6400 MTex/s | 8000 MTex/s | 10320 MTex/s | 8640 MTex/s |
| Vertex-Pipelines | 6 | 7 | 8 | 6 |
| Dreiecksdurchsatz | 600 MV/s | 700 MV/s | 860 MV/s | 810 MV/s |
| Pixelshader | PS 3.0 | PS 3.0 | PS 3.0 | PS 2.b |
| Vertexshader | VS 3.0 | VS 3.0 | VS 3.0 | VS 2.0 |
| Speichermenge | 256 GDDR3 | 256 GDDR3 | 256 GDDR3 | 256 GDDR3 |
| Speichertakt | 550 MHz | 500 MHz | 600 MHz | 590 MHz |
| Speicherinterface | 256 Bit | 256 Bit | 256 Bit | 256 Bit |
| Speicherbandbreite | 35200 MB/s | 32000 MB/S | 38400 MB/s | 37760 MB/s |
| Präzision pro Kanal | FP32/FP16 | FP32/FP16 | FP32/FP16 | FP24 |
| Interface | PCIe/AGP | PCIe | PCIe | PCIe/AGP |
| SLI/CF-Unterstützung | Ja (PCIe) | Ja | Ja | ja (PCIe) |
Der R520-Chip verfügt mit 321 Millionen Transistoren über deutlich mehr Schalteinheiten, als man aufgrund der nur 16 Pixel-Pipelines vermuten könnte. Weiterhin verfügt er über insgesamt acht Vertex-Shader-Einheiten, 16 ROPs und ebensovielen Texture Mapping Units. Als erster Desktop-Grafikchip verwenden der R520 sowie die kleineren Derivate erstmals den 90-nm-Prozess von TSMC, der nicht nur höhere Taktraten, sondern auch einen niedrigeren Stromverbrauch ermöglichen soll. Jener wird darüber hinaus durch eine erhöhte Flexibilität des R5x0 erreicht: Bei jenem ist es kein Problem, nicht mehr nur einzelne Pixel-Pipelines zu deaktivieren, ebenso lassen sich die Vertex-Shader, TMUs, ROPs und weitere Einheiten problemlos abschalten, um so ein- und denselben Chip für langsamere Grafikchips zu verwenden. Zudem verfügt der Chip über die Fähigkeit, sich im 2D-Modus herunterzutakten und zudem den gesamten 3D-Part zu deaktivieren, womit der Stromverbrauch unter der Windows-Oberfläche und 2D-Anwendungen stark gesenkt werden soll.
Der RV530, der in der Radeon X1600-Serie verbaut wird, wurde von ATi deutlich abgespeckt, weswegen der Chip nur noch eine ungefähre Größe von 180 Millionen Transistoren besitzt. Erreicht wird dies unter anderem durch die Reduzierung auf 12 Pixel- und fünf Vertex-Pipelines, zudem verfügt der Pixelbeschleuniger insgesamt nur noch über vier Texture Mapping Units sowie vier ROPs. Die Radeon X1300-Reihe mit dem RV515-Chip setzt noch einen drauf und besitzt nur noch zirka 100 Millionen Transistoren. Zusätzlich wurden noch weitere Pixel-Quads entfernt, womit das Silizium nur noch vier Pixel-Pipelines besitzt. Die ROPs und TMUs sind immer noch vierfach vorhanden, allerdings kann der RV515 nur noch mit zwei Vertex-Pipelines umgehen. Ansonsten sind die drei Chips größtenteils identisch aufgebaut.
Komplett neu bei allen drei Versionen der R520-Generation ist der sogenannte „Ring-Bus“, welcher ein neuartiges Speicherinterface bezeichnet. Während beim R420 das 256-bitige Memoryinterface mit Hilfe von vier 64 Bit breiten Kanälen arbeitete, gibt es beim Ring-Bus eine Aufteilung in acht Kanäle, die jeweils 32 Bit groß sind. Da jeder diese Kanäle gleichzeitig eine Lese- oder Schreibanfrage bearbeiten kann, kann der neue Ring-Bus innerhalb kürzerer Zeit die selben Daten verarbeiten wie ATis bisheriges Speicherinterface. Somit verringert sich die Latenz, sprich die Performance erhöht sich. Darüber hinaus ist der neue Ring-Bus fähig, jeglichen zur Zeit auf dem Markt befindlichen DDR-Speicher anzusteuern und ebenso den in der Zukunft erscheinenden GDDR4-Speicher.
Um die Effizienz des Memoryinterfaces zu erhöhen, setzen die Entwickler der R5x0-Generation auf mehrere Memory-Clients, welche die ankommenden Speicheranfragen bearbeiten und wieder losschicken können. Damit jene nicht auf eine komplexe Anbindung angewiesen sind, die die Komplexität, Hitze und Latenz extrem steigern würden, wird der so genannte Ring-Bus eingesetzt, der Namensgeber des neuen Interfaces. Dieser Bus umschließt alle Memory-Klienten ringförmig, um so den zurückzulegenden Weg gering zu halten. Dabei bestehen diese Ringe aus zwei 256 Bit breiten Datenleitungen – daher auch die Bezeichnung 512-Bit-Bus –, die jeweils in die entgegengesetzte Richtung kommunizieren, um so die Latenz ein weiteres Stück zu minimieren. Wenn die Daten über den Ring-Bus transportiert werden, können sie insgesamt an vier „Ring Stop“-Leitungen die Daten „abliefern“ und diese schicken die Informationen weiter an den Speicher.
Ebenfalls neu ist die Verbesserung der hauseigenen Texturkompression 3Dc, wobei der Nachfolger auf den simplen Namen „3Dc+“ hört. 3Dc+ ist nun auch in der Lage, acht Bit Integer Texturen mit einer Kompressionsrate von 2:1 zu verkleinern. Ebenso wurden die von ATi implementierten HyperZ-Funktionen zur Entfernung von Pixeln, die in einem nicht sichtbaren Bereich liegen und somit unnötig Bandbreite verschwenden, weiter verbessert. So soll bei der Radeon-X1800-Serie unter anderem die HierarchicalZ-Berechnungen um bis zu 50 Prozent beschleunigt worden sein. HierarchicalZ ist die erste Stufe der Berechnung von nicht sichtbaren Pixeln. Zuerst wird jeder Pixel in einen Block kleinerer Pixel unterteilt, die einzeln auf Sichtbarkeit untersucht werden. Während Blöcke, die komplett unsichtbar sind, direkt verworfen werden, werden komplett oder teils sichtbare Pixelblöcke weiter in die Pixel-Engine geleitet.
Wie es seit dem NV4x bereits jeder Grafikchip von nVidia ist, ist auch die R5x0-Familie fähig, Pixel- und Vertex-Shader Befehle der Version 3.0 zu verarbeiten. Ein Teil des Shader-Models 3.0 ist das sogenannte „Dynamic Branching“, welches laut ATi einer der wichtigsten Bestandteile der neuesten Shader-Version darstellt und auf dem R5x0 auch sehr schnell laufen soll. So ist es mit Dynamic Branching dem Spieleentwickler theoretisch möglich, einen langen, einzelnen Shader zu schreiben, der dank dem Feature dennoch schnell abgearbeitet werden kann. So entscheidet die Karte, ob der Shader-Code komplett ausgeführt werden muss oder nicht benötigte Codeteile einfach übersprungen werden können. Während der NV4x und G70 relativ viele Takte benötigen, um so einen Sprung zu vollführen, soll der R520 entsprechend wenige Zyklen benötigen, um dynamisch durch den Shader-Code springen zu können.
Weiterhin wurde die Pixel-Pipeline und ebenso der Vertex-Shader optimiert, so dass sich größtenteils die Latenz verringert, um ohne Wartezeiten Daten verarbeiten zu können. Alle diese hier zu erklären würde allerdings den Artikel ins unendliche verlängern, weswegen wir nur die wichtigsten Folien abbilden werden. Weiter möchten wir aber noch zwei wichtige Änderungen gegenüber dem Vorgänger R4x0 erläutern: So rendert der R5x0 jeglichen Shadercode mit voller FP32-Genauigkeit und kann nicht, wie die nVidia-Pendants, auf halbe Präzision (FP16) zurückschalten, um so den Shadercode schneller ausführen zu können, jedoch je nach Shader auch an Bildqualität zu verlieren. Laut den ATi-Ingenieuren kann der R5x0 mit voller Präzision genauso schnell rendern wie mit Partial Precision, weswegen letzteres auf den ATi-Chips nicht zur Verfügung steht.
Zu guter Letzt verfügt die Radeon-X1k-Serie über ein wichtiges Feature, welches die Konkurrenz nicht bietet: So läuft auf entsprechenden Chips 64-bitiges FP-High-Dynamic-Range-Rendering inklusive Multi-Sampling-Anti-Aliasing. Zwar müssen die Spiele angepasst werden, laut den Crytek-Programmierern soll dies aber recht schnell möglich sein – so lief auf der Präsentation eine spezielle Version von Far Cry mit HDR sowie Anti-Aliasing einwandfrei und vor allem sehr flüssig.
ATis neues Flaggschiff hört auf den Namen Radeon X1800 XT und arbeitet mit Hilfe des R520-Chips, der über 16 Pixel-Pipelines und acht Vertex Shader verfügt. Jene sind mit hohen 625 MHz getaktet, was größtenteils dem neuen 90-nm-Prozess bei TSMC zu verdanken ist. Der erste Blick auf das rote PCB unseres Referenzdesigns macht deutlich, dass die Tage zierlicher Karten mit einem Single-Slot-Kühler im High-End-Segment wohl ersteinmal vorbei sind. So ist die Karte mit einer Länge von 23 cm ebenso lang wie das nVidia-Pendant GeForce 7800 GTX, wobei die ATi-Karte jedoch mit einem Dual-Slot-Kühler daherkommt, der einen PCI-Anschluss einnimmt.
Trotz des gewaltig aussehenden Lüfters bleibt die Radeon X1800 XT erfreulicherweise relativ leise, nur beim ersten Starten macht sie mit voller Drehzahl deutlich auf sich aufmerksam, regelt sich einige Sekunden nach der Initialisierung allerdings von selbst wieder herunter und bleibt selbst nach längerer Zeit unter Last auf dem selben Lautstärkeniveau. Insgesamt erreicht sie im 2D-Betrieb zwar nicht den leisen Geräuschpegel einer GeForce 7800 GTX – die für eine High-End-Karte erstaunlich leise arbeitet –, störend ist der Lüfter aber nicht. Unter Last wird der 6,5 cm große Radiallüfter nur minimal lauter, was einen guten Wert darstellt.
Der eigentliche Kühler ist aus Kupfer gefertigt, was das Gesamtgewicht der Karte recht schwer werden lässt. Ebenfalls gekühlt mit einem kleinen Passivkühlkörper werden die Spannungswandler – die GeForce 6800 Ultra/GT lässt grüßen. Die Rückseite bleibt dagegen komplett Kühlerlos. ATis neuestes Top-Produkt wird es in zwei verschiedenen Versionen geben: einmal mit einem 256 MB großen VRAM und ebenso mit einem 512 MB großen Speicher, mit welchem auch unsere Version ausgestattet ist. Jener wird von Samsung hergestellt und bietet eine Zugriffszeit von sehr guten 1,2 ns, weswegen ATi den GDDR3-Speicher auch mit 750 MHz takten lässt, um so gegen das Speicherbandbreitenproblem heutiger Grafikkarten anzukämpfen.
Die Radeon X1800 XT verfügt über zwei Dual-Link-fähige DVI-Anschlüsse, um so im CrossFire-Betrieb auch höhere Auflösungen als 1600x1200 mit 60 Hz darstellen zu können. Der TV-Ausgang verfügt über ViVo-Funktionalität, womit sich in Kombination mit den neuen Avivo-Funktionen auch videobegeisterte Kunden anlocken lassen sollten. Während die 256-MB-Variante den Käufer 499 US-Dollar kosten wird, soll der größere VRAM einen Aufpreis von knapp 50 Dollar wert sein und somit werden entsprechende Karten mit 549 US-Dollar zu Buche schlagen. Nach offiziellen Angaben werden sie ab dem 5. November im Handel erhältlich sein. Die entsprechende CrossFire-Edition wird für 599 Dollar den Besitzer wechseln.
Die Radeon X1800 XL stellt die etwas kleinere Variante des XT-Top-Modells dar, ist technisch jedoch vollkommend identisch mit dem größeren Bruder. So wird auf jenen Karten ebenso der R520-Chip verbaut, die Taktrate ist mit 500 MHz aber deutlich geringer. Das PCB ist identisch mit dem der XT-Version, allerdings setzt ATi erfreulicherweise auf einen Single-Slot-Kühler, der aber nicht zu begeistern weiß – später dazu mehr. Entsprechende Karten sollen laut ATi ab sofort verfügbar sein und werden für 449 Euro über die Ladentheke wandern.
Der recht große Kühlkörper, der bei dem Referenzdesign mit dem Ruby-Maskottchen versehen ist, besitzt ebenfalls Kühllamellen aus Kupfer, womit die Karte zwar nicht mehr ganz so schwer wie die X1800 XT erscheint, aber immer noch nicht zu den Leichtgewichten zählt. Auch bei der X1800 XL wird auf den Spannungswandlern ein passiver Kühlkörper verwendet. Kommen wir nun zu dem Kühler zurück: Jener ist ein recht klein ausgefallenes Produkt, welches sich ebenso nach dem Start von alleine herunter regelt. Somit macht die Karte nach den ersten Minuten einen guten Eindruck, dieser wird allerdings nach einiger Zeit direkt wieder zu Nichte gemacht. Obwohl wir den Testrechner unberührt ließen, drehte der Lüfter plötzlich auf und schrie mit einer doch sehr hohen Lautstärke grundlos nach Aufmerksamkeit. Einige Zeit später setzt die Lüftersteuerung wieder ein, regelt den Schreihals herunter, nach einigen Minuten wiederholt sich das Spiel aber.
Dass wir ein defektes Testsample erwischt haben, ist somit durchaus möglich, zudem wiederholt sich das gesamte Prozedere unter Last ebenso. Falls dies kein Fehler in der Lüftersteuerung ist, hat ATi beziehungsweise später die Kartenhersteller noch einiges zu verbessern – das ständige „Auf und Ab“ nervt den Kunden mehr als ein andauernd mit voller Drehzahl laufender Lüfter. Der Speicher ist ein mit einer Zugriffszeit von 1,4 ns ausgestatteter GDDR3-RAM, der mit 500 MHz taktet und 256 MB groß ist. Ebenso wie der größere Bruder besitzt die Karte zwei DVI-Ausgänge und einen TV-Out mit ViVo-Funktionalitäten.
Die ATi Radeon X1600 XT setzt auf den deutlich einfacheren RV530-Kern, der als Ausgleich mit einer deutlich einfacheren Kühlung zurechtkommt. Der Chip verfügt über 12 Pixel-Pipelines, die jeweils aber nur noch vier Texture Mapping Units und vier Rasteroperationseinheiten besitzen, womit man insgesamt eine deutlich schlechtere Füllrate bietet. Der Chip gewinnt somit eher durch fixe Shader-Berechnungen an Performance und sollte unserer Meinung nach bei älteren, texturlastigen Spielen nicht ganz so flott unterwegs sein.
Das PCB ist mit zirka 17 cm deutlich kompakter als das der beiden X1800-Derivate und erinnert sehr an die modernen Mid-Range-Grafikkarten. Der Kühlkörper besteht erneut aus Kupferlamellen und bedeckt neben der GPU auch zwei weitere RAM-Bausteine mit, die restlichen zwei bleiben dagegen ungekühlt. Der eigentliche Kühler ist identisch mit dem der Radeon X1800 XL und fällt mit einem Durchmesser von knapp 4,5 cm sehr klein aus. Leider ist aber nicht nur die Größe identisch, die Lautstärke ist es ebenso, wobei die kleine X1600 XT unerklärlicherweise noch eine volle Schippe drauflegt, um den mit 590 MHz getakteten Kern zu kühlen. Der Lüfter scheint sich nach dem Booten gar nicht mehr herunter zu regeln und bleibt konstant auf einem sehr hohen Niveau. Hier muss ATi noch nachbessern, dieser Lautstärkepegel ist kaum akzeptabel.
Der Speicher taktet mit schnellen 690 MHz, weswegen auch hier der hochwertige VRAM von Samsung wie auf der Radeon X1800 XT verbaut wird (1,2 ns Zugriffszeit). Mit 256 MB fällt dieser allerdings etwas kleiner aus. Die Radeon X1600 XT verfügt – was ungewöhnlich für eine Karte der mittleren Preisklasse ist – ebenso über zwei DVI-Ausgänge und einen TV-Ausgang. Der Preis der Radeon X1600 XT soll sich auf 249 US-Dollar belaufen, die CrossFire-Edition wird mit 299 Dollar zu Buche schlagen. Laut ATi soll die X1600 XT ab dem 30. Oktober im Handel erhältlich sein.
Auf der Radeon X1300 Pro wird der kleinste Chip der R5x0-Serie verbaut, der RV515. Jener verfügt wie die größere X1600 XT über vier ROPs und vier TMUs, kann jedoch nur noch auf vier Pixel-Pipelines zurückgreifen, weswegen er von ATi als Low-End-Chip angesehen wird. Entsprechende Karten sollen 149 US-Dollar kosten und ab sofort im Handel erwerbbar sein. Eine richtige CrossFire-Edition wird es bei der X1300-Serie dagegen nicht mehr geben, weil jene Karten nur über den PCIe-Bus kommunizieren müssen, da die erforderliche Bandbreite für diesen Weg gering genug ist.
Der Chip der X1300 Pro taktet mit satten 600 MHz und der 256 MB große GDDR3 Speicher, der über eine Zugriffszeit von 2,5 ns verfügt und von Infineon hergestellt wird, mit 400 MHz. Leider setzt ATi beim Referenzdesign auf das Lüftersystem von der Radeon X1600 XT, was auf der X1300 Pro ebenso laut arbeitet wie auf dem Mid-Range-Derivat und sich somit für einen Silent-Rechner mühelos disqualifiziert. Eine kleine, wenn auch unbedeutende Änderung gibt es dennoch: Auf der kleinsten Version werden nicht mehr zwei DVI-Anschlüsse, sondern ein DVI- und ein D-Sub-Ausgang sowie ein TV-Out verbaut.
Moderne Grafikkarten sollten nicht nur schnell sein, sondern auch ein exzellentes Bild liefern. Eine Möglichkeit, um jenes zu erreichen, auch wenn der gelieferte Grafik-Content des Spieles nicht allzu gut ausfällt, ist die Aktivierung von Anti-Aliasing, welches die Polygonkanten glättet, und ebenso das Hinzuschalten des anisotropen Filters, das die Texturen auch in weiter Ferne noch scharf erscheinen lässt. Da ATi als auch nVidia versuchen, in den Features den Konkurrenten zu übertreffen, erlebt man bei manch neuer Chipgeneration eine positive Überraschung – wobei eine Negative allerdings auch nicht ausgeschlossen werden kann –, da die Bildqualität sich verbessert hat. Aus diesem Grund gehört zu einem Grafikkarten-Review einer neuen Chipserie nicht nur das Testen der Geschwindigkeit, es sollte ebenfalls ein Blick auf die gelieferte Bildqualität geworfen werden.
Dabei werden wir beide Bildverbesserungsmechanismen nicht nur in der Praxis, sondern auch in der Theorie begutachten. So untersuchen wir die Qualität des anisotropen Filters mit dem oft benutzten Tool „AF-Tester“ sowie mit einer Spielszene aus Half-Life 2, wobei gar selbst erstellte Videos zur Kontrolle herangezogen werden. Auf den Ego-Shooter greifen wir auch bei den Untersuchungen des Anti-Aliasings zurück, jedoch werden wir zusätzlich die Sample-Positionen in dem Tool „FSAA-Viewer“ vergleichen.
nVidia G70
ATi R4x0
ATi R520
Auf den ersten Blick wird bereits deutlich, dass ATi beim Next-Generation-Chip R520 die Sample-Positionen im Gegensatz zum R4x0 nicht verändert hat – und dies ist auch durchaus gut so, denn ATis Anti-Aliasing-Modi glätten Geometrie-Pixel mehr als zufriedenstellend und man ist qualitativ gleichauf oder bietet je nach Spiel gar eine bessere Glättung als dies der G70 zu schaffen vermag. Nichtsdestotrotz hat nVidia neuester Spross zwei Vorteile gegenüber ATis bisherigen Samplepositionen: Super Sampling. Jenes ist in heutigen Spielen durchaus als wichtig anzusehen, da unter anderem für die Darstellung von Zäunen oder beispielsweise Blättern, sprich für aufwendige, transparente Geometrie, sogenannte Alpha-Test-Texturen benutzt werden, die allerdings nicht von herkömmlichen Multi-Sampling-Anti-Aliasing geglättet werden und somit unaufhaltsam flimmern.
In diesem Fall greift dann das von nVidia implementierte Super-Sampling ein, dass in einem Ordered-Grid-Muster angeordnet ist und damit auch jene Alpha-Test-Texturen bekämpft. Jedoch geht bereits bei 1x2 oder 2x1 SSAA die Hälfte und bei 2x2 SSAA bereits ein Viertel der vorhandenen Füllrate verloren, weswegen selbst moderne Grafikkarten bei aufwendigen Spielen deutlich in der Performance einbrechen. Hier hilft nVidias Transparency-AA, dass die benutzen Texturen analysieren kann und falls diese Alpha-Test-Texturen oder durchsichtige Shader-Oberflächen beinhalten, nur bei den entsprechenden Texturen aufwendiges SSAA verwendet, womit diese Texturen nicht mehr oder stark vermindert flimmern, wobei die Geschwindigkeit nur recht gering einbricht.
Dies konnte ATi aufgrund der starken Beliebtheit von TSSAA nicht auf sich beruhen lassen und baut einen Modi in die neue R520-Generation ein, der auf den Namen „Adaptive Anti-Aliasing“ hört und eine ähnliche Vorgehensweise wie das nVidia-Derivat hat. Jener bietet jedoch einige Vorteile gegenüber der nVidia-Variante, trotz der identischen Vorgehensweise. So wird bei Adaptive-AA im Gegensatz zu Transparency-AA kein Ordered-Grid-SSAA, sondern ein Rotated-Grid-SSAA benutzt, was aufgrund der besser angeordneten Samplepositionen eine bessere Glättung bietet. Zudem bietet ATi mit dem R5x0 im sogenannten „Quality“-Mode immer gleich viele Textur-Sample wie Geometrie-Sample an, sprich bei vier-fachem Adaptive-AA rendert die Grafikkarte mit 4xMSAA und 4xSSAA, bei 6xA-AA bereits mit sechs Geometrie- und ebensovielen Textur-Sample. Darüber hinaus ist das Adaptive-AA bei jeder von ATi angebotenen AA-Art, wie beispielsweise Super-AA und Temporal-AA, verwendbar.
Auf Nachfrage bei Raja Koduri, dem Senior Architekten von ATi, soll es auch einen Performance-Mode geben, der immer nur die Hälfte der eingestellten SSAA-Samples benutzt, sprich bei 4xA-AA vier-faches MSAA und 2xSSAA beziehungsweise 6xMSAA und 6xSSAA. Nur bei 2xAA soll die Anzahl der Textursamples gleich bleiben. Etwas überrascht waren wir jedoch beim Suchen dieses Performance-Modus, welcher schlicht und ergreifend nicht im Catalyst Control Center vorzufinden ist. Wahrscheinlich wird die entsprechende Funktion erst in einem neueren Treiber implementiert. Weiterhin teilte uns Koduri mit, dass der AA-Algorithmus programmierbar ist und somit auf die Sample-Anzahl und Sample-Position mit einem Treiberupdate Einfluss genommen werden kann.
nVidia G70
ATi R4x0
ATi R520
Wie man deutlich auf den Screenshots erkennen kann, arbeitet das herkömmliche Anti-Aliasing sowie das Adaptive-AA auf der neuen ATi-Grafikkarte einwandfrei und liefert eine sehr gute Bildqualität. Mit den bekannten AA-Modi werden die Geometrie-Kanten gleich gut wie auf den nVidia-Pendants geglättet, nur das 6xAA ist, wie gewohnt, dem 4xAA der Kalifornier leicht überlegen. Das neue Adaptive-AA arbeitet ebenfalls sehr gut, auch wenn uns hier erst die 6xAA-Variante überzeugen konnte. Zwar werden bereits bei 4xA-AA die Alpha-Texturen relativ gut geglättet, jedoch ist die nVidia-Lösung der von ATi noch leicht vorraus. Erst das 6xA-AA kann endgültig an der Konkurrenz vorbeiziehen. Das Adaptive-AA arbeitet trotz des Lobes aber auch nicht einwandfrei: So kann man an dem Kran einige Bildfehler erkennen, die aber hoffentlich in nächster Zeit behoben werden.
nVidia G70
ATi R4x0
ATi R520
ATi R520 (HQ)
Bei der Radeon X1k-Serie wird es wie bei dem R3x0 wieder einen Performance- und einen Quality-Mode bei der anisotropen Filterung geben. Der Performance-Modus unterschied sich so gut wie gar nicht von dem AF der alten R4x0-Serie, allerdings scheint das LOD minimal verschoben worden zu sein. Raja Koduri erwähnte uns gegenüber eine leicht verbesserte Präzision – ob durch jene der Effekt erzeugt wird, bleibt unbekannt und ist unserer Meinung nach auch relativ unwahrscheinlich.
Als wir den Quality-Modus aktivierten, trauten wir unseren Augen – oder eher gesagt dem AF-Tester – nicht: Der R5x0-Chip bietet wieder eine winkelunabhängige Filterung, was es bei ATi noch nie und bei nVidia seit dem NV35 nicht mehr gegeben hat! Zwar werden nicht alle Winkel mit dem voll eingestellten AF gefiltert, allerdings behandelt der neue AF-Algorithmus nun auch Winkel, die auf der Vorgängergeneration und auf den aktuellen nVidia-Grafikkarten einfach ignoriert werden. Dafür müssen wir ATi nach den deutlichen Verschlechterungen der Texturfilterung in letzter Zeit ein großes Lob aussprechen! Somit werden nun auch in Spielen mit eher untypischen Winkeln diese anisotrop gefiltert und nicht einfach ignoriert.
Das Bild mit 16-facher Filterung sieht im Gegensatz zu dem 8-fachem AF etwas merkwürdig aus. Warum die Blume in diesem Fall so aussieht, muss noch ungeklärt bleiben. So könnte es sein, dass ATi dort an der Präzision gespart hat, um nicht allzu viel Performance zu verlieren.
nVidia G70
ATi R4x0
ATi R520
ATi R520 (HQ)
Wie man auf den Screenshots und auch auf diversen selbstaufgenommenen Videos erkennen kann, hat sich die Bildqualität auch in der Praxis nicht verändert; das etwas veränderte LOD lässt sich auch bei mehrmaliger Wiederholung der Videos nicht erkennen. Somit ist das nVidia- und das ATi-AF qualitativ so gut wie gleichauf, solange bei nVidia die High-Quality-Einstellung verwendet wird und somit das Texturflimmern kaum noch auftritt. So kommt es auf das Spiel an, welcher Algorithmus das bessere Ergebnis liefert.
Ohne Probleme vorbeiziehen kann ATi jedoch mit dem neuen High-Quality-AF, was ATi auf den Namen „Area-Aniso“ getauft hat. Dieser filtert beinahe alle Winkel mit dem voll eingestellten AF-Grad, auch wenn das auf den Half-Life-2-Bildern nicht sichtbar wird, da diese nicht die entsprechenden Winkeln zeigen. Ein Spiel, das des öfteren diese Winkel benutzt, wäre beispielsweise „Gothic 2“.
Anti-Aliasing - Half-Life 2
Angaben in Prozent
|
Wie man deutlich erkennen kann, verliert die neue Radeon X1800 XT beim Einsatz von Anti-Aliasing am wenigsten Performance im Vergleich zu der GeForce 6800 Ultra und 7800 GTX. Selbst bei 6xAA bricht die Karte nur um ungefähr 17 Prozent ein, während die GeForce 7800 GTX bereits bei 4-fachem AA mit 22 Prozent deutlich mehr einbricht. Das neue Adaptive-AA bricht ebenso wie bei der GeForce 7800 GTX nur minimal gegenüber herkömmlichem MSAA ein, weswegen man es aufgrund einer deutlich besseren Glättung von Alpha-Test-Texturen aktivieren sollte. Der 6xAA-Modus von ATi und das 8xSAA von nVidia sind aufgrund des Super-Sampling-Anteils von nVidia nicht direkt vergleichbar.
Anisotroper Filter - Half-Life 2
Angaben in Prozent
|
Der anisotrope Filter scheint bei der Radeon X1800 XT ebenfalls sehr effizient zu arbeiten. Bei 16-fachem AF bricht die Karte nur um 18 Prozent ein, selbst bei der winkelunabhängigen-Variante betragen die Geschwindigkeitseinbußen nur 22 Prozent, weshalb man das Feature auf jeden Fall aktivieren sollte, auch wenn die Karte bei anderen Spielen eventuell stärker einbricht.
Testsystem:
Folgende Benchmarks kamen während unseres Tests zum Einsatz:
Alle Benchmarks werden mit maximalen Details ausgeführt, damit die Grafikkarte möglichst hoch belastet wird. Als Einstellungen haben wir uns dabei für 1280x1024 und 1600x1200 entschieden. Damit zollen wir Tribut an die modernen High-End-Beschleuniger, die durch ihre Rechenkraft niedrigere Auflösungen als 1280x1024 CPU-limitiert werden lassen. Neben den reinen Auflösungen lassen wir den Benchmarkparcours auch mit 4-fachem Anti-Aliasing sowie 16-fachen anisotropen Filter durchlaufen, da dies oft vorkommende Qualitätseinstellungen sind.
Achtung: Nach sorgfältiger Überlegung and mehrfacher Analyse selbst aufgenommener Spielesequenzen, sind wir zu dem Schluss gekommen, im ForceWare-Treiber für nVidia-Karten die Qualitätseinstellungen auf High Quality anzuheben, da man nur mit diesem Setting das Texturflimmern effektiv bekämpfen kann. Zudem ist dieser Modus vergleichbar mit der Einstellung „Catalyst A.I. Off“ auf den ATi-Pendants, wodurch bei der Bildqualität größtenteils ein Gleichstand erreicht wird.
Treibereinstellungen: nVidia-Grafikkarten
Treibereinstellungen: ATi-Grafikkarten
VillageMark v1.20
Angaben in Bildern pro Sekunde (FPS)
|
FableMark v1.0
Angaben in Bildern pro Sekunde (FPS)
|
TempleMark v1.06
Angaben in Bildern pro Sekunde (FPS)
|
3DMark2001 SE
Angaben in Punkten
|
3DMark2001 SE
|