Nach der Präsentation der nVidia GeForce-7800-Serie [1] sah es lange Zeit trostlos für ATi aus. Die nVidia-GPU war nicht nur rasend schnell, sie bot dank des Transparency-AA auch eine gute Bildqualität; ein Feature, das ATi nicht anzubieten hatte. Zwar machten bereits kurz danach Gerüchte über den X850-Nachfolger die Runde, mehr als Spekulationen sollte man lange Zeit aber nicht von dem neuen „Wunderkind“ zu sehen bekommen. Im Oktober präsentierte ATi daraufhin mit einem Paukenschlag die X1000-Serie [2] und wollte durch ein aggressives Auftreten verlorenen Boden zurückgewinnen. Um dieses Ziel zu erreichen, setzte man auf eine neue Architektur (auch wenn diese logischerweise nicht komplett neu ist) sowie deutlich höhere Taktraten und eine winkelunabhängige Texturfilterung.
Das Ergebnis war nicht nur aus Sicht der Performance sehr gut, denn man überflügelte stellenweise recht deutlich den damaligen Platzhirsch, die GeForce 7800 GTX. Auch bezüglich der Bildqualität legten die Kanadier lobenswerterweise eine Schippe drauf, womit ATi die Konkurrenz überflügeln konnte (– hiermit möchten wir einen kleinen Appell an nVidia richten, in einem neuen Chip ebenfalls eine winkelunabhängige Texturfilterung einzusetzen. Denn dafür schnell genug sind die GPUs der Kalifornier allemal!)
Auf diesen Rückschlag war nVidia anscheinend vorbereitet und präsentierte einige Tage später das neue Flaggschiff, die GeForce 7800 GTX 512 [3]. Dieses setzt wie das Top-Modell der X1800-Reihe auf einen 512 MB großen VRAM und erhöht die Taktraten im Gegensatz zur Vorgängerversion exorbitant, weswegen man die Performancekrone mit einem kleinen Vorsprung erneut an sich reißen konnte – der Nachteil der schlechteren Bildqualität blieb aber weiterhin bestehen. Erneut nur relativ kurze Zeit später dreht sich das Entwicklungsrad bei ATi weiter und ein „neuer“ Chip steht vor der Tür: die Radeon-X1900-Serie. Jene möchte den Siegerpokal in den Geschwindigkeitsmessungen wieder zu ATi zurück holen. Erreicht werden soll dieses Ziel interessanterweise nicht durch deutlich höhere Taktraten, sondern aufgrund einiger Änderungen in der Chiparchitektur.
Der R580-Chip verfügt über drei Shader-Einheiten pro Pixel-Pipeline, weswegen dem neuen Stück Silizium bei 4 Pixel-Quads logischerweise 48 solcher ALUs zur Verfügung stehen. Der Vorgänger R520 musste dagegen noch mit einer ALU pro Pipeline auskommen. Weiterhin verbessert ATi kleinere Details im R580, auf welche wir im Technik-Abschnitt des Artikels näher eingehen werden. Von der neuen X1900-Serie wird es aktuell drei verschiedene Grafikkarten geben, die auf die Namen „Radeon X1900 XT“, „Radeon X1900 XTX“ sowie „Radeon X1900 CrossFire-Edition“ hören werden und nach Angaben der Kanadier ab dem heutigen Tag lieferbar sind.
Erfreulicherweise erreichte sowohl die Radeon X1900 XTX als auch die Radeon X1900 CrossFire-Edition unser Testlabor und es wird sich zeigen, ob die neuen High-End-Modelle gegen die nVidia GeForce 7800 GTX und deren SLI-Konfiguration Punkten können. Ebenfalls wird sich herausstellen, ob ATis vielgelobte Avivo-Technologie zur Verbesserung der Videoqualität beziehungsweise der Videobeschleunigung gegen nVidias „PureVideo“ bestehen kann. Mit von der Partie ist erstmals der „HQV-Benchmark“, mit welchem ein direkter Vergleich der DVD-Wiedergabe gewährleistet ist.
| GeForce 7800 GTX | GeForce 7800 GTX 512 | Radeon X1800 XT | Radeon X1900 XT (CF) | Radeon X1900 XTX | |
| Logo |
|
|
|
||
| Chip | G70 | G70 | R520 | R580 | R580 |
| Transistoren | ca. 303 Mio. | ca. 303 Mio. | ca. 321 Mio. | ca. 384 Mio. | ca. 384 Mio. |
| Fertigung | 0,11 µm | 0,11 µm | 90 nm | 90 nm | 90 nm |
| Chiptakt | 430 MHz | 550 MHz | 625 MHz | 625 | 650 |
| Pixel-Pipelines | 24 | 24 | 16 | 16 | 16 |
| Shader-Einheiten pro Pipeline (MADD) | 2 | 2 | 1 | 3 | 3 |
| ROPs | 16 | 16 | 16 | 16 | 16 |
| Pixelfüllrate | 6880 MPix/s | 8800 MPix/s | 10000 MPix/s | 10000 MPix/s | 10400 MPix/s |
| TMUs je Pixel-Pipeline | 1 | 1 | 1 | 1 | 1 |
| Texelfüllrate | 10320 MTex/s | 13200 MTex/s | 10000 MTex/s | 10000 MTex/s | 10400 MPix/s |
| Vertex-Pipelines | 8 | 8 | 8 | 8 | 8 |
| Dreiecksdurchsatz | 860 MV/s | 1100 MV/s | 1250 MV/s | 1250 MV/s | 1300 MV/s |
| Pixelshader | PS 3.0 | PS 3.0 | PS 3.0 | PS 3.0 | PS 3.0 |
| Vertexshader | VS 3.0 | VS 3.0 | VS 3.0 | VS 3.0 | VS 3.0 |
| Speichermenge | 256 GDDR3 | 512 GDDR3 | 512 GDDR3 | 512 GDDR3 | 512 GDDR3 |
| Speichertakt | 600 MHz | 850 MHz | 750 MHz | 725 MHz | 775 MHz |
| Speicherinterface | 256 Bit | 256 Bit | 256 Bit | 256 Bit | 256 Bit |
| Speicherbandbreite | 38400 MB/s | 54400 MB/s | 48000 MB/s | 46400 MB/s | 49600 MB/s |
| Präzision pro Kanal | FP32/FP16 | FP32/FP16 | FP32 | FP32 | FP32 |
| Interface | PCIe | PCIe | PCIe | PCIe | PCIe |
| SLI/CF-Unterstützung | Ja | Ja | Ja | Ja | Ja |
Auf den ersten Blick unterscheidet sich der neue R580-Chip von ATi gar nicht vom „altgedienten“ R520, der erst im Oktober des vergangenen Jahres präsentiert [1] wurde. So kommen in der X1900-Serie erneut 16 Pixel-Pipelines mit je einer Texture Mapping Unit (TMU) sowie einem Raster-Operation-Processor (ROP) zum Einsatz, womit man immer noch an der traditionellen Architektur, wie sie unter anderem beim G70-Konkurrent von nVidia eingesetzt wird – abgesehen von dessen Reduzierung der ROPs in Bezug auf die Anzahl der Pixel-Prozessoren – festhält. Auch das 256 Bit breite Speicherinterface inklusive des Ring-Bus-Memory-Controllers ist gleich geblieben. Der R580 setzt ebenfalls wie der Vorgänger auf acht Vertex-Shader, an deren Funktionsumfang sich nichts verändert hat – wo also liegt der Unterschied?
Natürlich fallen einem die leicht erhöhten Taktraten bei der XTX-Version ins Auge, der Unterschied ist jedoch so gering, dass er nur für einen geringen Performancegewinn zuständig sein wird. Einen tieferen Blick in das „Innenleben“ zeigt dann endlich den Grund, warum der R580-Chip, der erneut im 90-nm-Verfahren von TSMC gefertigt wird, zirka 384 Millionen Transistoren trägt, knapp 60 Millionen mehr als der R520. Der R580 verfügt über drei gleichwertige Shader-Einheiten pro Pipeline anstatt nur einer wie beim R520, weswegen eine X1900-Grafikkarten auf insgesamt 48 „Arithmetic Logical Units“, kurz ALU, zurückgreifen kann. Theoretisch hat sich die Shader-Rechenkraft bei gleichem Takt dementsprechend um den Faktor drei erhöht. Dieses 3:1-Verhältnis zwischen ALUs und Textureinheiten begründet ATi mit den immer anfordernderen Shaderanweisungen in modernen Spielen, während die Texturberechnungen eher auf einem Level stagnieren. Den Feldversuch hat ATi bereits mit dem RV530 in Form der Radeon X1600 gestartet, die mit eben jenem 3:1-Verhältnis ausgestattet ist.
Doch was macht überhaupt eine ALU? Eine ALU kann verschiedene (arithmetische) Rechenoperationen wie beispielsweise ADD- (Additionen), SUB- (Subtraktionen), NOT- (Negierungen) oder MUL-Anweisungen (Multiplikationen) durchführen, die für die Berechnungen des Shaders von Nöten sind. Im Vergleich dazu bietet nVidia in der GeForce-7800-Serie zwei Shader-Einheiten pro Pipeline an, die jeweils ein MADD (Multiply-ADD: Multiplikation und Addition) ausführen können. Damit weist der G70-Chip 48 ALUs bei 24 Pixel-Pipelines (GeForce 7800 GTX) und 40 ALUs bei 20 Pixel-Pipelines (GeForce 7800 GT) auf. Ein NV40 hat dagegen nur 16 ALUs, obwohl auf diesem prinzipiell zwei Shader-Einheiten verbaut sind. Die erste Shader-Einheit kann allerdings kein MADD sondern nur ein ADD berechnen. Somit fehlt dieser Shader-Einheit der MUL-Befehl und wird allgemein nicht als vollständige ALU angesehen. Ab wann eine ALU nun als eine „richtige“ Shader-Einheit bezeichnen werden kann, ist wie so oft leider unklar. Wir sprechen deshalb von einer vollständigen ALU, falls diese eine MADD-Funktion verarbeiten kann, da das derzeit die entscheidende Operation für die gebrachte Leistung ist.
Jede der 48 Shader-Einheiten im R580-Chip beherrscht folgende Rechenfunktionen:
Interessante Neuigkeiten gibt es über den „Dispatch-Prozessor“. Dieser teilt den Shader im R520 in einen 4x4 Pixel großen Block auf, weswegen nicht nur die Latenzen extrem gering gehalten werden, sondern zusätzlich das „Dynamic Branching“ (Sprunganweisung durch If- oder Else-Befehle in einem Shader) extrem schnell ausgeführt werden kann. Durch die höhere Anzahl der ALUs im RV530 (wie beim R580 ein 3:1 Verhältnis) werden die Shader in einen 4x12 großen Block geteilt, wodurch der Chip etwas ineffizienter arbeitet. Wie ATi uns auf Anfrage aber mitteilte, ist dies beim R580 nicht der Fall. Dieser benutzt weiterhin einen 4x4 Pixel großen Thread; die GPU rendert mit der identischen Effektivität wie der R520. Doch auch abseits der Shader-Einheiten gibt es Detail-Verbesserung. Der R580 kann gegenüber dem Vorgänger R520 mit einer verbesserten HierarchicalZ-Funktion aufwarten. HierarchicalZ ist die erste Stufe der Berechnung von nicht sichtbaren Pixeln.
Zuerst wird jeder Pixel in einen Block kleinerer Pixel unterteilt, die einzeln auf Sichtbarkeit untersucht werden. Während Blöcke, die komplett unsichtbar sind, direkt verworfen werden, werden komplett oder teils sichtbare Pixelblöcke weiter in die Pixel-Engine geleitet. Durch dieses Vorgehen kann unter anderem wichtige Speicherbandbreite gespart werden und höhere Auflösungen sind eher realisierbar. Für HierarchicalZ-Berechnungen wird ein On-Chip-Speicher benötigt, der aber recht klein ausfällt. Falls für extrem hohe Auflösungen dieser Speicher zu klein ist, arbeitet der vorgezogene Tiefentest deutlich langsamer. Um diesem Effekt entgegenzuwirken, verbauen die Kanadier auf dem R580 einen doppelt so großen On-Chip-Speicher, womit selbst in hohen Auflösungen wie 2560x1600 HierarchicalZ mit der vollen Effektivität arbeiten kann.
Die letzte nennenswerte Neuerung ist ein Feature namens „Fetch4“, welches bei Shadow-Maps zum Einsatz kommt. Shadow-Maps werden in vielen Spielen zur Darstellung von Schatten eingesetzt. Ein Nachteil dieser Methode sind die harten Kanten der Schatten, welche in einer realen Umgebung nicht vorkommen; dort sind die Schatten meistens weich. Um dieses Problem zu umgehen, kann die GPU eine gewisse Anzahl an Samples aus der Shadow-Map nehmen und diese im Pixel-Shader bilinear filtern. Somit erscheint der Schattenverlauf weicher. Diese Methode hat aber auch einen Nachteil, so sinkt die Performance bei zu vielen Samples in den Keller, da entsprechend viele Befehle ausgeführt werden müssen (pro Sample ein so genannter TEX-Befehl) . Nun kommt Fetch4 ins Spiel, was diesen Vorgang beschleunigt.
Der R580 nutzt bei Fetch4 den Umstand aus, dass jeder Farbwert aus vier Werten besteht – Rot, Grün, Blau sowie dem Alpha-Kanal (Transparentwert). Fetch4 kann nun jene Werte gleichzeitig in einem Durchgang samplen sowie berechnen und benötigt dafür nur einen TEX-Befehl; eine Shadow-Map kann deutlich schneller erstellt werden. Einen Nachteil besitzt Fetch4 allerdings, da die Shadow-Maps nicht gefiltert werden und dadurch des Öfteren unschöne Schatten produzieren. Zur Filterung müssen die Daten in den Pixel-Shader geschickt und dort verrechnet werden, was einige Rechenzeit in Anspruch nimmt. nVidias Verfahren namens PCF (Percentage Closer Filtering) geht einen Schritt weiter und filtert die Shadow-Map in einem Durchgang in der TMU. Fetch4 und PCF werden aktuell beispielsweise im 3DMark06 sowie den Spielen Far Cry, Battlefield 2 und Age of Empires 3 eingesetzt.
Der HQV-Benchmark [14] (Hollywood Quality Video) von Silicon Optix liegt auf einer handelsüblichen DVD vor und soll die Bildqualität des Abspielgerätes anhand verschiedener Bildsequenzen testen – ein perfekter Qualitätstest für die Avivo- und PureVideo-Technologie von ATi beziehungsweise nVidia. Es gibt insgesamt 18 Testbilder beziehungsweise Testvideos, die man selber mit maximal 10 Punkten bewerten soll und schlussendlich ergibt die Addition der erreichten Punkte das Gesamtergebnis. Somit ist der HQV-Benchmark logischerweise etwas Subjektiv, da ein menschliches Auge nicht dem Anderen gleicht. Nichtsdestotrotz gibt der HQV-Benchmark einen guten Eindruck in die Wiedergabequalitäten einer Grafikkarte.
Der erste Test hört auf den Namen „Color Bar/Vertical Detail“ und zeigt ein Standbild mit mehreren unterschiedlichen Farbstreifen. Dieser Test soll ermitteln, ob der Video-Prozessor ein stehendes Bild von einem bewegten Bild unterschieden kann, denn diese werden von dem integrierten De-Interlacer unterschiedlich behandelt. Falls der De-Interlacer das stehende Bild korrekt erkennt, werden alle Streifen detailliert dargestellt. Falls jedoch nicht, flackern diese Streifen oder verschwinden gar bis zur Unkenntlichkeit.
Der zweite Test nennt sich „Jaggies Pattern 1“ und soll erkenntlich machen, wie gut der Video-Prozessor bewegende Objekte erkennen kann. Diese Sequenz besteht aus einem Kreis mit einem Zeiger, der sich um 360 Grad dreht. Dabei beginnt der Zeiger je nach Winkel zu flackern. Umso eher dieser zum Flimmern neigt, desto schlechter arbeitet der Video-Prozessor. Dieser muss, um das Flackern zu mindern, einige Pixel bei einem bewegten Objekt verwerfen. Je nach dem, welche Pixel ausgesucht werden, verstärken oder vermindern sich die Fehler.
„Jaggies Pattern 2“ knüpft an den vorherigen Test an. Es bewegen sich drei nahe beieinander liegende Balken abwechselnd nach oben und nach unten. Da dieses erneut in einem Kreis geschieht, verändern sich sowohl die Richtung als auch die Geschwindigkeit und der Winkel der Zeiger. Der Video-Prozessor muss erneut die Pixel zum Verwerfen und hinzufügen erkennen, da die Balken ansonsten flimmern.
Der Test „Waving Flag“ beinhaltet eine – wer hätte es gedacht? – wehende amerikanische Flagge mit einem Gebäude im Hintergrund. Diese Sequenz soll zeigen, wie gut der Video-Prozessor mit einem bewegtem und gleichzeitig einem stehenden Objekt zurecht kommt. Die eigentliche Problematik entsteht durch die vielen Streifen, die sich gleichzeitig in unterschiedliche Richtungen und Winkeln bewegen. Falls es in der Bewegungsphase zu sichtbaren Bildfehlern in Form von Aliasing-Effekten kommt, weist der Video-Prozessor eine Schwäche auf.
Die Sequenz „Detail Enhancement“ zeigt ein Bild einer Landschaft mit einer Straße, einer hohen Treppe sowie einer Brücke und stellt somit eine komplizierte Herausforderung für das Wiedergabegerät dar, da alle Objekte detailliert dargestellt werden müssen. Diese müssen nicht nur in der richtigen Schärfe, sondern auch ohne Kanten- und Flimmer-Effekte auf den Bildschirm gebracht werden.
„Noise Reduction“ soll genau das aufzeigen, was der Name bereits sagt: Bildfehler, die größtenteils durch eine schlechte Kompression oder minderwertige Bearbeitung entstehen. Häufig tritt dieses Problem bei Bildern mit einem hohen Farbspektrum auf, weswegen man es „Farbrauschen“ nennt. Das Testergebnis wird aus verschiedenen Bildern wie einem Sonnenuntergang oder einer gelben Blume im hellen Tageslicht gewonnen.
Der nächste Abschnitt namens „Motion Adaptive Noise Reduction“ stellt verschiedene „Noise Reduction“-Techniken auf die Probe (beispielsweise „Temporal Noise Filtering“). Dieser Filter arbeitet nach dem Konzept, dass wechselnde Pixel in einem stehenden Bild mit Farbrauschen gleichzusetzen sind und deswegen bearbeitet werden müssen. Jedoch erzeugt ein bewegendes Objekt in einem stehenden Bild ebenfalls wechselnde Pixel und bei Bearbeitung durch den Noise-Reduction-Filer würde das Bild „verstümmelt“. Aus diesem Grund muss jeder guter Video-Prozessor den Unterschied zwischen beiden Zuständen erkennen können.
Der Test „3:2 Detection“ soll unter anderem Bildfehlern wie dem „Moiré-Effekt“ auf die Schliche kommen. Die meisten Fernsehfilme werden mit 24 Bildern pro Sekunde aufgenommen. Bei der Portierung des Filmmaterials auf beispielsweise eine DVD müssen die Daten vom aktuellen Format in das Format der DVD umgewandelt werden. Eine dieser möglichen Techniken nennt man „3:2 Pulldown“, bei der ein zusätzliches Frame wiederholt wird. Dadurch können allerdings Bildfehler entstehen, die ein qualitativ hochwertiger Video-Prozessor erkennen sowie entfernen muss.
„Film Cadence“ zeigt mehrere solcher Methoden wie „3:2 Pulldown“, die je nach Filmmaterial eingesetzt werden. Diese muss der Video-Prozessor genauso erkennen können, da es ansonsten zu Bildfehlern kommt.
Die letzte Sequenz „Mixed 3:2 Film with added Video titles“ erzeugt einen horizontal sowie vertikal verlaufenden Text. Falls beispielsweise ein Film mit 30 FPS aufgenommen und dann in handelsübliche 24 Bilder pro Sekunde mit der „3:2 Pulldown“-Technik umgewandelt wurde, kann es schnell zu Bildfehlern bei scrollendem Text kommen, die ein guter Video-Prozessor verhindern sollte.
Wir testen den HQV-Benchmark an einem LCD-TV, damit man eher die Fehler in der Darstellung erkennen und ein realistisches Ergebnis abgeben kann. Die Grafikkarten werden per DVI-Kabel sowie dem entsprechenden Adapter an den HDMI-Anschluss des Fernsehers angeschlossen. Als zusätzlichen Vergleich zu einem richtigen DVD-Player muss der Panasonic S97EG [15] herhalten, der ebenfalls über die HDMI-Buchse mit dem Anzeigegerät verbunden ist.
HQV-Benchmark Einzelergebnisse
Angaben in Punkten
|
HQV-Benchmark Gesamtergebnis
Angaben in Punkten
|
Wie der HQV-Benchmark beweist, hat ATi mit ihrer Avivo-Technologie nicht zu viel versprochen und präsentiert einen wirklich guten Video-Prozessor, der deutlich über der Videotechnologie des G70-Chips bezüglich der Bildqualität steht. nVidia hat dort noch einiges aufzuholen. Der Testdurchlauf beweist aber noch etwas anderes: Um an einem relativ großen Fernseher eine gute Wiedergabequalität zu erreichen, führt schlussendlich doch kein Schritt an einem „richtigen“ DVD-Player vorbei – der Panasonic weist die Videochips in den Grafikkarten in die Schranken. Nichtsdestotrotz zeigt ATi mit der Avivo-Technologie im R580, dass sich einiges zum Positiven gewandt hat und dass immer mehr Leute die Videofunktionen der modernen Grafikchips nutzen. Unterschiede zwischen dem R520 und dem R580 gibt es hingegen nicht. Das war jedoch auch nicht zu erwarten, da ATi keinerlei Verbesserungen am Avivo-Part angekündigt hat.
Den PureVideo-Decoder von nVidia haben wir bewusst außen vor gelassen, obwohl dieser eventuell eine Verbesserung erzielt hätte. Im Gegensatz zu Avivo ist PureVideo kostenpflichtig, weswegen der Avivo-Konkurrent nicht getestet wird.
Das Top-Modell mit dem neuen R580-Chip von ATi hört auf den Namen X1900 XTX und läutet somit ein neues Namenskürzel für ATi-Grafikkarten ein. Das Suffix XT-PE (Platinum Edition) für ein minimal höher getaktetes Flaggschiff scheint endgültig passé zu sein. Die Grafikkarte soll laut den Kanadiern ab dem heutigen Tag für 649 US-Dollar über die Ladentheke gehen, womit man sich nicht nur dem Niveau der GeForce 7800 GTX 512 anpasst, sondern auch einen neuen Rekordpreis für ATi-GPUs aufstellt. Das PCB erinnert stark an das der Radeon X1800 XT und ist in der Tat größtenteils identisch; nur einige Bauteile wurden ausgetauscht.
Die Karte misst 23 cm und passt in fast alle Gehäuse problemlos hinein. Der Dual-Slot-Kühler ist absolut identisch zur X1800 XT geblieben. Das Kühlsystem soll den R580 auf angenehme Temperaturen bringen, weswegen ein 6,5 cm großer Radiallüfter zum Einsatz kommt. Dieser arbeitet unter Windows angenehm leise, jedoch erzeugt der Propeller in einer 3D-Anwendung ein unangenehmes Geräuschsniveau, was von einem hochfrequenten Fiepen begleitet wird – hier ist noch Nachholbedarf angesagt, denn eine GeForce 7800 GTX 512 von nVidia arbeitet deutlich leiser!
Darüber hinaus fällt das hohe Gewicht der Grafikkarte auf, was durch eine große Kupferkühlplatte hervorgerufen wird, die an der GPU befestigt ist. Der Lüfter saugt die kühle Luft aus dem Gehäuse in das Kühlsystem, leitet diese über den Grafikkern, der damit heruntergekühlt wird, und pustet die erhitzte Luft wieder aus dem Tower hinaus. Die Spannungswandler werden von einem Passivkühlkörper vor der Überhitzung geschützt, während die Rückseite ohne jegliche Kühlung auskommen muss. Auf dem Slotblech werden wie gewohnt zwei Dual-Link-fähige DVI-Anschlüsse sowie einen HDTV-Ausgang, der über ViVo-Funktionen verfügt, verbaut.
Der R580-Chip auf der Radeon X1900 XTX taktet mit 650 MHz, was in Kombination mit den acht Vertex-Shadern eine sehr hohe Geometrieleistung erzeugt. Die Füllrate gegenüber der Radeon X1800 XT steigt nur gering an, da es an der Pipelinestruktur keinerlei Veränderungen gegeben hat. Die Shader-Leistung ist bei der X1900 XTX dagegen deutlich höher, da sie über die dreifache Anzahl an Shader-Einheiten pro Pipeline verfügt. Der 512 MB große GDDR3-Speicher stammt erneut von Samsung, ist aber mit einer Zugriffszeit von nur 1,1 ns ausgestattet – etwas verwunderlich, bei dem „niedrigen“ Speichertakt. Dementsprechend besteht noch viel Raum für eine großzügige Übertaktung. Die Speicherbandbreite ist deswegen deutlich geringer als bei einer GeForce 7800 GTX 512. Um im 2D-Modus zusätzlich Strom sparen zu können, taktet sich die Radeon X1900 XTX auf 500 MHz beziehungsweise 594 MHz herunter.
Die ATi Radeon X1900 CrossFire-Edition sieht wie ein Klon der X1900 XTX aus. Das Lüftersystem ist identisch, arbeitet aufgrund der zusätzlichen Grafikkarte aber logischerweise etwas lauter als mit nur einer Karte. Nichtsdestotrotz fallen die Propeller unter Windows nicht negativ auf, während der Lärmpegel in einer 3D-Anwendung stört. Obwohl die Temperaturwerte des CrossFire-Gespanns sehr hoch sind, konnten wir während den Belastungstests keinerlei Abstürze oder Bildfehler verzeichnen.
Die CrossFire-Edition arbeitet mit denselben Taktraten wie die X1900 XT, sprich mit 625 MHz für den Chip und 725 MHz beim Speicher. Falls die Grafikkarte mit einer X1900 XTX kombiniert wird, geht dementsprechend Leistung verloren, weswegen bei der geplanten Anschaffung eines Dual-GPU-Systems die billigere X1900 XT ausreicht. Apropos Preis, jener liegt bei einer unverbindlichen Preisempfehlung von 599 US-Dollar (549 US-Dollar bei einer herkömmlichen X1900 XT) und somit etwa 50 Dollar unter dem Niveau einer einzelnen X1900 XTX. Die Grafikkarte soll wie alle anderen Modelle der X1900-Serie ab sofort im Handel erhältlich sein. Auch auf der X1900 CF kommt ein 512 MB großer VRAM mit einer Zugriffszeit von 1,26 ns zum Einsatz. Um im 2D-Modus zusätzlich Strom sparen zu können, taktet sich die Radeon X1900 CrossFire-Edition auf 500 MHz beziehungsweise 594 MHz herunter.
Auf dem Slotblech befinden sich die gleichen Anschlüsse wie bei einer X1800 XT CrossFire-Edition, sprich ein normaler, Dual-Link-fähiger DVI-Ausgang und der CrossFire-Anschluss, an dem das CF-Kabel mit der Slave-Karte verbunden werden muss. Die Compositing-Engine, die die Bilder der zweiten Grafikkarte vermischt, ist identisch zur X1800 XT CF-Edition geblieben. Eine ausführliche Erklärung findet man im Artikel Club3D Radeon X1800 XT CrossFire-Edition [6].
Testsystem:
Folgende Benchmarks kamen während unseres Tests zum Einsatz:
Alle Benchmarks werden mit maximalen Details ausgeführt, damit die Grafikkarte möglichst hoch belastet wird. Als Einstellungen haben wir uns dabei für 1280x1024 und 1600x1200 entschieden. Damit zollen wir Tribut an die modernen High-End-Beschleuniger, die durch ihre Rechenkraft niedrigere Auflösungen als 1280x1024 CPU-limitiert werden lassen. Neben den reinen Auflösungen lassen wir den Benchmarkparcours auch mit 4-fachem Anti-Aliasing sowie 16-fachen anisotropen Filter durchlaufen, da dies oft vorkommende Qualitätseinstellungen sind.
Achtung: Nach sorgfältiger Überlegung und mehrfacher Analyse selbst aufgenommener Spielesequenzen sind wir zu dem Schluss gekommen, im ForceWare-Treiber für nVidia-Karten die Qualitätseinstellungen auf High Quality anzuheben, da man nur mit diesem Setting das Texturflimmern effektiv bekämpfen kann. Zudem ist dieser Modus vergleichbar mit der Einstellung „Catalyst A.I. Standard“ auf den ATi-Pendants, wodurch bei der Bildqualität größtenteils ein Gleichstand erreicht wird.
Treibereinstellungen: nVidia-Grafikkarten
Treibereinstellungen: ATi-Grafikkarten
Die Theorie ist ja schön und gut, nur was nutzt einem die deutlich höhere Shaderleistung, wenn die GPU diese nicht in eine höhere Performance umwandeln kann? Nichts! Aus diesem Grund haben wir die Radeon X1900 XTX auf das Taktniveau einer Radeon X1800 XT (625/750 MHz) heruntergeschraubt und wollen dementsprechend taktnormalisiert die R580- gegen die R520-GPU antreten lassen. Als Qualitätseinstellungen wird 1600x1200 und 1600x1200 mit 4-fachem Anti-Aliasing und 16-facher anisotroper Filterung verwendet, um so die beiden ATi-Grafikkarten möglichst hoch auszulasten.
Effizienztest 1600x1200
Angaben in Prozent
|
Effizienztest 1600x1200 Part 2
Angaben in Prozent
|
Wie man an den Diagrammen zweifellos feststellen kann, bringen die dreifache Anzahl der Shader-Einheiten in den meisten Spielen einen deutlichen Geschwindigkeitszuwachs – 25 Prozent Gewinn ist keine Seltenheit. Neben den beiden 3DMark-Programmen von Futuremark ist Battlefield 2 ein großer Gewinner, welches anscheinend auf mehr Shaderprogramme setzt, als man zuerst glauben mag. Einen gewaltigen Vorsprung kann sich die Radeon X1900 gegenüber der X1800 in Age of Empires 3 erkämpfen. Dies ist mit dem neuen Feature „Fetch4“ zu erklären, da so die kompletten Schatten nicht mehr im Pixel-Shader berechnet werden müssen. Wie nicht anders zu erwarten war, kann das ebenfalls shaderlastige Fear von den 48 ALUs einen Profit herausschlagen und ähnlich ergeht es auch Half-Life 2: Lost Coast. Auch die langsam in die Jahre gekommenen Kollegen Riddick und Splinter Cell 3 legen mit der X1900-Serie um einige Prozentpunkte zu. Texturlastige Benchmarks wie beispielsweise Aquamark 3 können logischerweise von den Verbesserungen im R580-Chip nicht profitieren.
Effizienztest 1600x1200
Angaben in Prozent
|
Effizienztest 1600x1200 4xAA/16xAF
Angaben in Prozent
|
Fillrate Tester
VillageMark
VillageMark v1.20
Angaben in Bildern pro Sekunde (FPS)
|
Fablemark
FableMark v1.0
Angaben in Bildern pro Sekunde (FPS)
|
Templemark
TempleMark v1.06
Angaben in Bildern pro Sekunde (FPS)
|
ShaderMark
3DMark05
|