Einleitung
ATi musste mit der Radeon-HD-2000-Serie eine lange Durststrecke überstehen. Man schaffte es weder im High-End-, noch im Mid-Range-Markt Fuß mit den 3D-Beschleunigern zu fassen. Einzig mit den Radeon-HD-2400-Modellen konnte man im OEM-Markt einige gewinnbringende Verträge abschließen. Doch nicht nur die Leistungsdaten machten der Radeon HD 2000 zu schaffen, die Karten kamen zu allem Überfluss auch viel zu spät.
Mit der folgenden Radeon-HD-3000-Reihe, die immer noch auf dieselbe Architektur setzte (allerdings mit einigen kleinen, dafür aber feinen Verbesserungen aufwartete), hat man dann viele Fehler aus der Welt geschaffen. Ein erweitertes (und bisher uneingeholtes) Featureset mit Direct3D 10.1, einem effektiven Stromsparmechanismus, einem für die Leistung sehr günstigen Preis und der durchgängigen Unterstützung des Unified Video Decoders, kurz UVD, konnten ebenfalls neues Leben in die Grafikkartensparte von AMD einhauchen. Ein Problem blieb aber immer noch bestehen: Die Leistung machte nur einen kleinen Schritt nach vorne – auf Nvidia aufzuholen vermochte man spürbar nur mit dem Doppel-Kern-Modell Radeon HD 3870 X2.
Ein echtes Aufholmanöver verspricht ATi nun mit der Radeon-HD-4000-Serie, die die 9000er-Serie von Nvidia gar überholen soll. Zwei Grafikkarten wird es zu Beginn geben, die Radeon HD 4850 sowie die Radeon HD 4870, wobei das Topmodell erstmals mit GDDR5-Speicher an den Start gehen wird. Mit den beiden Probanden möchte ATi einen neuen Preis-Leistung-Champion (HD 4850) in die Händlerregale stellen und gleichzeitig das Flaggschiff der GeForce-9000-Serie hinter sich lassen (HD 4870). Zwar hat man gegen die GeForce-GTX-200-Karten noch keinen richtigen Gegenspieler, jedoch soll dieser im Laufe des zweiten Halbjahrs, wahrscheinlich im dritten Quartal, in Form einer R700-Karte (2x RV770) vorgestellt werden.
AMD konnte uns freundlicher Weise ein Exemplar der Radeon HD 4850 für einen Test zur Verfügung stellen, wobei wir darüber hinaus eine erste Serienkarte von MSI bereit gestellt bekommen haben - CrossFire-Tests sind somit möglich. Doch auch Nvidia blieb überraschenderweise nicht untätig: Mit der GeForce 9800 GTX+ möchte man die Radeon HD 4850 kurzfristig in Schach halten. Und auch diese Karte testen wir – samt SLI.
Auf den letzten Drücker: Kurz vor Redaktionsschluss erreichte uns ein erstes Sample der ATi Radeon HD 4870 von PowerColor, das wir aus Zeitgründen nicht mehr durch unseren gesamten Parcours jagen konnten. Am Ende des Artikels widmen wir dem neuen Spitzenmodell dennoch einen ersten, eigenen Abschnitt.
Technische Daten
Bevor wir uns mit der RV770-GPU und ihrer Architektur im Detail beschäftigen, möchten wir mit den obligatorischen Spezifikationen des neuen Chips starten.
| Radeon HD 3870 |
Radeon HD 4850 |
Radeon HD 4870 |
GeForce 9800 GTX |
GeForce 9800 GTX+ |
|
|---|---|---|---|---|---|
| Logo | |||||
| Chip | RV670 | RV770 | RV770 | G92 | G92b |
| Transistoren | ca. 666 Mio. | ca. 965 Mio. | ca. 965 Mio. | ca. 754 Mio. | ca. 754 Mio. |
| Fertigung | 55 nm | 55 nm | 55 nm | 65 nm | 55 nm |
| Chiptakt | 775 MHz | 625 MHz | 750 MHz | 675 MHz | 738 MHz |
| Shadertakt | 775 MHz | 625 MHz | 750 MHz | 1.675 MHz | 1.836 MHz |
| Shader-Einheiten (MADD) |
64 (5D) | 160 (5D) | 160 (5D) | 128 (1D)* | 128 (1D)* |
| FLOPs (MADD/ADD) | 496 GFLOPs | 1000 GFLOPs | 1200 GFLOP/s | 643 GFLOPs* | 705 GFLOPs* |
| ROPs | 16 | 16 | 16 | 16 | 16 |
| Pixelfüllrate | 12400 MPix/s | 10000 MPix/s | 12000 MPix/s | 10800 MPix/s | 11808 MPix/s |
| TMUs | 16 | 40 | 40 | 64 | 64 |
| TAUs | 32 | 40 | 40 | 64 | 64 |
| Texelfüllrate | 12400 MTex/s | 25000 MTex/s | 30000 MTex/s | 43200 MTex/s | 47232 MTex/s |
| Shader-Model | SM 4.1 | SM 4.1 | SM 4.1 | SM 4 | SM 4 |
| Hybrid-CF/-SLI | X | X | X | √ | √ |
| effektive Windows Stromsparfunktion |
√ | √ | √ | X | X |
| Speichermenge | 512 MB GDDR4 | 512 MB GDDR3 | 512 MB GDDR5 | 512 MB GDDR3 | 512 MB GDDR3 |
| Speichertakt | 1125 MHz | 993 MHz | 1800 MHz | 1100 MHz | 1100 MHz |
| Speicherinterface | 256 Bit | 256 Bit | 256 Bit | 256 Bit | 256 Bit |
| Speicherbandbreite | 72000 MB/s | 63552 MB/s | 115200 MB/s | 70400 MB/s | 70400 MB/s |
*Die von uns angegebenen GFLOP-Zahlen der G80/G92-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.
Technik im Detail Part 1
Allgemeines:
Mit der ursprünglichen R600-Architektur hat sich ATi sicherlich keinen großen Gefallen getan. Der auf der Radeon HD 2900 XT eingesetzte Chip war nicht nur sehr groß, leistungshungrig sowie kompliziert zu fertigen, zu allem Übel war er auch noch relativ langsam. Einen Schritt weiter ging der RV670, obwohl sich an dem eigentlichen Aufbau nicht viel geändert hat.
Nun geht es mit dem RV770 einen weiteren Schritt nach vorne, der im Vergleich R600 vs. RV670 allerdings eher als Sprung bezeichnet werden darf. Die eigentliche Architektur ist zwar immer noch identisch mit der des R600, jedoch hat man viele Details verändert, weswegen der Chip nun spürbar schneller als der Vorgänger werden soll. Dabei setzt der RV770 immer noch auf den 55-nm-Prozess bei TSMC (wobei man bedenken sollte, dass 55-nm-Prozess nicht gleich 55-nm-Prozess ist; so gibt es alleine bei TSMC zwei verschiedene 55-nm-Prozesse), die Anzahl der Transistoren ist aber auf 965 Millionen Schalter und die Chip-Fläche von 193 mm² auf 260 mm² gestiegen. Der RV670 gab sich noch mit 666 Millionen Transistoren zufrieden.
Die nackten Daten des RV770 hören sich viel versprechend an: 160 5D-Shadereinheiten (RV670: 64), 40 vollwertige Textureinheiten (RV670: 16), 16 stark verbesserte ROPs (RV670: 16), ein nochmals effizienteres 256-Bit-Speicherinterface und vieles mehr hat sich in der RV770-Architektur geändert. Die Direct3D-10.1-API wird natürlich weiterhin von der Radeon-HD-4800-Serie, so der Name der ersten Produktreihe mit dem neuen Rechenkern, unterstützt und selbst die bis jetzt noch nie verwendete Tessellations-Einheit (die nun völlig kompatibel zu Direct3D 10.1 ist) hat wieder Einzug gefunden.
Bevor wir uns die einzelnen Einheiten und Veränderungen im RV770 anschauen, stellen wir uns eine Frage, die sicherlich viele Leser interessieren wird. Wie kann man mehr als doppelt so viele ALUs und Textureinheiten verbauen, ohne dass die DIE-Größe und die Anzahl der Transistoren um das Doppelte in die Höhe schnellt? Erst kürzlich hat Nvidias GT200-Chip eindrucksvoll gezeigt, dass solch ein Vorhaben nur bedingt möglich ist.
Wie Eric Demers, Senior Architect bei ATi, uns gegenüber in einem Gespräch verriet, ist der nur unterproportional größere DIE primär auf die höhere Anzahl der ALUs zurückzuführen. Auf der anderen Seite hat ATi vor allem Shader-ALUs sowie die GPR-Stacks (General Purpose Register) überarbeitet, sodass diese nun 40 Prozent weniger Platz als auf einem RV670 einnehmen. Zusätzlich fallen die ROPs kleiner aus und man konnte die Größe sämtlicher anderer Einheiten um fünf bis 20 Prozent verringern.
Stream-Processing-Units (SPU):
Die Ansteuerung der ALUs im RV770 hat sich nicht geändert. Den Anfang macht die so genannte „Setup Engine“, die die Bits für die Berechnungen in den Stream Processing Units vorbereitet. Je nach Art der Berechnung, die ansteht (Pixel–, Vertex-, oder Geometry-Programm), wird die Kalkulation von einer bestimmten Einheit durchgeführt, wobei alle fertigen Berechnungen anschließend wieder gemeinsam in den „Ultra-Threaded Dispatch Processor“ (UTDP) gelangen. Dieser „Verteilerprozessor“ sorgt dafür, dass die ALUs optimal (möglichst hoch) ausgelastet werden und keine „Blasen“, sprich Leerläufe der ALUs, auftreten.
Der UTDP erstellt einzelne Threads, die aus mehreren Befehlen bestehen. Dabei werden mehrere Threads gesammelt, damit die Shaderprogramme in der bestmöglichen Reihenfolge bearbeitet werden können. Die ALUs bauen sich aus zehn SIMD-Blöcken zusammen (Single Instruction, Multiple Data; also auf mehrere Daten kann zeitgleich ein und dieselbe Instruktion angewendet werden), die über jeweils 16 einzelne Shaderkerne sowie einen Textur-Cluster verfügen.
Jeder Shaderkern kann auf einen 16 KB großen Local Data Share zugreifen, um die Daten untereinander schnell auszutauschen zu können weshalb es nicht mehr nötig ist, diese wieder von der CPU anzufordern, falls bereits berechnete Daten erneut gebraucht werden. Vor allem bei GPU-Computing-Berechnungen kann sich solch' eine Art Zwischenspeicher positiv bemerkbar machen. Pro SIMD-Block wird eine Steuereinheit eingesetzt, die die einzelnen ALUs mit einzelnen Threads versorgen kann. Genau Angabe über die Anzahl der Threads macht ATi leider nicht.
Eine Besonderheit der SIMD-Blöcke sollte man noch erwähnen: Jeder SIMD-Block kann mit einem anderen seiner Art mittels eines 16 KB großen „Global Data Share“ kommunizieren. Schon fertiggestellte Daten können also untereinander ausgetauscht werden, ohne dass diese von einem SIMD-Block erneut berechnet werden müssen. Ein Shaderkern ist exakt so aufgebaut wie bei der R600-Generation. Jeder einzelne Kern setzt sich aus fünf einzelnen skalaren ALUs zusammen, die pro Takt jeweils ein MADD berechnen können. Dadurch lassen sich schnell 800 einzelne skalare Shadereinheiten zählen, wobei wir aber lieber von 160 5D-Vektoreinheiten (RGBA, Rot Grün, Blau, den Alphawert und noch eine einzelnes Skalar) sprechen, da die Shaderkerne nicht wie wirkliche Skalareinheiten angesprochen werden können.
Zwar kann jeder Shaderkern die 5D-Einheiten in 1D+1D+1D+1D+1D aufgeteilen, womit man prinzipiell Vektoreinheiten hat, die wie Scalar-Units agieren - dafür müssen die Berechnungen aber komplett unabhängig voneinander sein. Sind diese dagegen abhängig, können längst nicht immer alle ALUs ausgelastet werden und ein Leerlauf entsteht. Eine Aufgabe des Thread-Schedulers ist es, genau diesen Leerlauf so gering wie möglich zu halten. Auf dem Schaubild der ALUs erkennt man, dass eine der fünf Einheiten dicker als die restlichen ist. Die ALU agiert zusätzlich als Special Function Unit (SFU) und berechnet mathematische Operationen wie Sinus-, Kosinus- und Logarithmus-Anweisungen. Zusätzlich ist in einem Shaderkern eine „Branch Execution Unit“ verbaut. Dynamic Branching (Sprunganweisung im Shadercode zum Beispiel durch einen if-/when-Befehl) blockiert also nicht eine MADD-Einheit, sondern wird in einer gesonderten Funktionseinheit berechnet.
Verbessert hat ATi die Rechenleistung jeder ALU was „Bit Shift“-Operationen angeht. Die Leistung wurde um den Faktor 12,5 erhöht. Die Geometryshader-Performance soll einen weiteren guten Schritt nach vorne gemacht haben. Interessanterweise verneinte Eric Demers explizit, dass es im RV770 eine eigene Shaderdomäne mit einem höheren Takt gibt. Die ALUs werden mit derselben Frequenz wie die restlichen Einheiten angesprochen, was laut dem ATi-Ingenieur auch beim R600 und RV670 der Fall sein soll. Bei letzterem ging man bis jetzt davon aus, dass die ALUs leicht schneller angesteuert werden.
Textureinheiten:
Eng mit den ALUs sind in der RV770-Architektur die Textureinheiten verwandt, da jede einzelne SIMD-Einheit einen Textur-Cluster beinhaltet. Deaktiviert oder entfernt man einen SIMD-Block, gehen einem also auch Textureinheiten verloren. Jeder einzelne Texturcluster setzt sich aus vier einzelnen, vollwertigen Textureinheiten zusammen, womit der RV770 also auf insgesamt 40 TMUs (Texture Mapping Units) zurückgreifen kann. Diese haben sich gegenüber den Vorgängern aber etwas geändert. So können pro Texturcluster zwar weiterhin vier Pixel bilinear texturiert, aber nur noch vier Pixel adressiert werden. Auf einem R600/RV670 war es noch möglich, doppelt so viele Pixel zu adressieren wie zu texturieren.
Da einem Texturcluster nun vier Texture Adressing Units (TAU) fehlen, sinkt auch die Zahl der „Texture Samplers“. Anstatt 20 pro Cluster gibt es deren jetzt nur noch 16. Dies ist aber durchaus zu verschmerzen, da die Texture Samplers zu einem Großteil ihrer Zeit wohl eh ohne Arbeit dastanden. Wie beim R600 kann jeder Texturcluster weiterhin auf einen L1- und einen L2-Cache zurückgreifen. Die Kommunikation des L2- mit dem L1-Cache wird durch den altbekannten Crossbar realisiert. Somit kann jeder Zwischenspeicher ohne Umwege auf jeden anderen seiner Art zugreifen. Modifiziert hat ATi die Bandbreite des Texture Cache, der nun doppelt so schnell wie auf der Vorgänger GPU arbeiten soll. Darüber hinaus konnte man die 32-Bit- (Faktor 2,5) und die 64-Bit-Filterrate (Faktor 1,25) steigern.
Technik im Detail Part 2
Raster Operation Processor (ROP):
Deutlich verbessern konnte man die Raster Operation Processors (ROPs, von ATi gerne Render Back Ends genannt), die einen großen Schritt gegenüber denen im RV670 gemacht haben sollen. Das Wichtigste vorweg: Ja, die herkömmlichen Box-Filter-Anti-Aliasing-Modi werden auf dem RV770 wieder vollständig in den ROPs und nicht mehr teilweise (MSAA-Resolve) in den Shadereinheiten ausgeführt, wie uns Eric Demers mitteilte. Dadurch soll die Performance bei der Kantenglättung auf dem RV770 stark ansteigen, was wir in gleich folgenden Messungen untersuchen werden.
Die Custom-Filter-AA-Modi mit einem anderen Filter (Narrow-Tent, Wide-Tent und Edge-Detect) werden logischerweise weiterhin zu einem Teil in den ALUs berechnen, da den ROPs dazu die nötige Flexibilität fehlt. Die Performance des CFAA will ATi auf dem RV770 dennoch stark erhöht haben. Auf der neuen GPU werden erneut 16 ROPs in vier einzelnen ROP-Partitions verbaut, die pro Takt 16 Pixel fertigstellen können. Verbessert hat man die Performance bei reinen Z-Berechnungen (Tiefentests zur Sichtbarkeitsprüfungen, die entscheiden, ob ein Pixel überhaupt gerendert werden muss).
Anstatt 32 Z-Tests kann der RV770 nun 64 Z-Tests durchführen, es gibt also nicht mehr nur zwei, sondern vier Z-Einheiten pro ROP. Damit hat man einen weiteren Engpass der R600-Architektur behoben oder zumindest vermindert. Ebenfalls einen Schritt nach vorne hat die ROP-Performance beim Anti-Aliasing gemacht. So konnten die ROPs im R600/RV670 bei zwei- oder vier-fachem Anti-Aliasing nur noch acht Pixel pro Takt fertigstellen, die Hälfte der eigentlichen Durchsatzrate. Beim RV770 werden nun „Single-Cycle-ROPs“ für bis zu 4xAA verwendet, die dann pro Takt auch 16 Pixel berechnen können. Bei acht-fachem Multi-Sampling-AA halbiert sich die Anzahl auf acht Pixel. Es spielt keine Rolle mehr, ob 32-Bit- oder 64-Bit-Texturen gefiltert werden müssen. Auf einem RV670 können die ROPs bei 64-Bit-Texturen (FP16) ohne MSAA nur acht Pixel pro Takt fertigstellen. Beim RV770 gibt es die Limitierung nicht mehr.
Speicherinterface:
Das Speicherinterface auf dem RV770 ist weiterhin 256 Bit breit und setzt sich aus vier einzelnen 64-Bit-Controllern zusammen. An diesen werden jeweils zwei Speicherbausteine mit einer Busbreite von 32 Bit angeschlossen. Den Memorycontroller hat man auf dem RV770 allerdings runderneuert, wobei man von dem seit der R520-GPU bekannten Ring-Bus etwas Abstand genommen hat, ohne auf eine klassische Crossbar (eine Punkt-zu-Punkt-Verbindung) zu setzt. Eine Crossbar gibt es auf dem RV770 nur zwischen den „Low Bandwith Clients“ wie dem PCIe-Interface oder dem UVD.
Stattdessen ist jeder der vier Speichercontroller (die mit einer ROP-Partition und einem L2-Cache verbunden sind) an einen einzelnen lokalen Memorycontroller angeschlossen, den ATi Hub nennt. Der Hub soll ziemlich identisch mit den Ring-Bus-Hubs in der R600-Architektur sein. Die Verbindung zwischen den vier einzelnen Memorycontroller soll wie der bekannte Ring-Bus arbeiten, wobei kein Ring-Bus-Protokoll mehr genutzt wird. Die Effizienz der Speicherbandbreite soll durch das neue Design gesteigert worden sein.
Ein interessantes Details am Speichercontroller ist ein so genannter „CrossFire X Interconnect“, der auf dem RV770 neu hinzugekommen ist. Eric Demers wollte sich zu diesem Thema leider nicht äußern und so können wir nur spekulieren, was der neue Anschluss macht. Definitiv fest steht, dass der Interconnect nicht beim klassischen CrossFire-Verbund aus zwei, drei oder vier diskreten Grafikkarten zum Einsatz kommt. Stattdessen wird der CrossFire X Interconnect nur beim R700 eingesetzt werden, der noch nicht vorgestellten High-End-Karte mit zwei RV770-GPUs auf einem PCB.
So ist es denkbar, dass durch den Interconnect beide GPUs miteinander kommunizieren und sich erstmals den auf der Platine verbauten Speicher teilen können. Normalerweise muss jede GPU auf dieselben Daten im Speicher zugreifen können, weswegen man den Speicher bei CrossFire nicht addieren kann. Falls durch den Interconnect nun eine Art „Shared Memory“ realisiert werden könnte, würde diese störende Limitierung wahrscheinlich der Vergangenheit angehören. Sicher sind wir uns aber nicht, zumal ATi angedeutet hat, dass der Interconncect eher eine andere Funktion haben wird. Neben GDDR3 und GDDR4 kann der Speichercontroller im RV770 zusätzlich modernen GDDR5-Speicher ansprechen, der erstmals auf der Radeon HD 4870 Premiere feiert.
Double Precision (DP):
In Zeiten von GPU-Computing spielt die „doppelte Präzision“ eine immer größer werdende Rolle. Anstatt mit einer Genauigkeit von 32 Bit wird bei Double Precision jeder Datenwert mit einer 64-Bit-Präzision berechnet. DP kann von den 800 MADD-Einheiten aber nicht so ohne weiteres Ausgeführt werden, da dazu entweder dedizierte DP-Einheiten notwendig sind. ATi geht beim RV670 sowie beim RV770 dagegen einen anderen Weg und lässt bei Double Precision die fünf MADD-ALUs eines Stream Processors an einer Operation rechnen, wobei die fünfte ALU die „Akkumulierung“, also die Zwischenspeicherung, übernimmt.
Pro Takt wird also ein DP-Wert fertig gestellt, der aber nicht nur eine sondern fünf ALUs blockiert. Die theoretische DP-Shaderleistung fünftelt sich also. Die Radeon HD 4850 bietet zum Beispiel eine theoretische Rechenleistung von 1000 GFLOP/s bei Single-Precision. Bei einer 64-Bit-Präzision ständen dem Kunden dann also nur noch 200 GFLOP/s zur Verfügung, was aber immer noch deutlich mehr als bei einer High-End-Quad-Core-CPU wäre. Einen direkten Vergleich zu den diskreten DP-Einheiten auf dem GT200 von Nvidia wollen wir nicht ziehen, da wir uns nicht ganz sicher sind, was die Einheiten alles für Berechnungen in einem Takt ausführen können.
Unified Video Decoder (UVD):
Ein alter Bekannter hat erneut Einzug in den RV770 gefunden, der Unified Video Decoder, kurz UVD, zur Beschleunigung von HD-Videos im MPEG2-, H.264- und VC-1-Codec. Der UVD liegt auf dem RV770 in der zweiten Generation vor, ist größtenteils aber identisch zu dem auf dem RV670 geblieben. Neu hinzu gekommen ist die „Picture-in-Picture“-Funktion, durch die zwei HD-Videos zur selben Zeit abgespielt werden können. Dabei soll die CPU-Auslastung nur minimal ansteigen. Der UVD2 kann über den DVI-Ausgang (alternativ HDMI oder DisplayPort) 7.1-Audio mit einer Datenrate von bis zu 6.144 Mbit/s bei 192 KHz/24-Bit ausgeben.
Während auf den alten Radeon-HD-3000-Karten nur Dolby Digital sowie DTS als Bitstream ausgegeben werden konnten, sind mit dem UVD2 nun auch Dolby Digital+, Dolby True HD sowie DTS HD möglich. Der HDMI-Standard entspricht der aktuellen Variante 1.3. Verbesserungen in der Bildqualität hat es im RV770 ebenfalls gegeben: So kann die GPU auf das HD-Bild einen dynamischen Kontrast anwenden, der die Farben verstärken soll. Auf Wunsch kann man das Feature im Treiber deaktivieren.
Stromsparmechanismus:
PowerPlay, ein effektiver Stromsparmechanismus, der seit dem RV670 von ATi auf Desktop-GPUs eingesetzt wird, wird auf dem RV770 natürlich erneut genutzt und soll gar verbessert worden sein. So gibt es einen speziellen Mikrocontroller auf dem PCB, der mit speziellen Monitor-Programmen ausgestattet ist, die die Temperatursensoren, die Auslastung einzelner GPU-Blöcke und den Datenverkehr über den PCIe-Bus ständig kontrolliert. Falls der Datenverkehr gering ist, kann der Chip die Taktraten nicht nur massiv senken, ebenso werden die Spannungen reduziert und es wird Clock-Gating betrieben. Die Effizienz von PowerPlay soll sich auf dem RV770 um den Faktor 2 gegenüber der Implementierung auf dem RV670 gesteigert haben.
Bildqualität:
In Sachen Bildqualität hat sich auf dem RV770 nichts getan. Sowohl der anisotrope Filter als auch das Anti-Aliasing arbeiten auf ein und demselben Niveau wie auf einem RV670, weswegen unsere Beobachtungen beim Launch-Review zur GeForce GTX 280 immer noch gelten [1]. Der RV770 ist mit dem RV670 völlig gleichzusetzen. Zwar wurde in den Textureinheiten die Präzision leicht erhöht, jedoch soll das keinen (oder eher nur einen theoretischen) Einfluss auf die Qualität des anisotropen Filters haben.
AA- und AF-Skalierung
Wie genau die Unterschiede durch die Verbesserung der ROPs zwischen RV670 und RV770 ausfallen, wollen wir in diesem Abschnitt untersuchen. Wir testen die GPU-Skalierung der aktuell vier wichtigsten GPUs (G92, GT200, RV670 und RV770) in verschiedenen Auflösungen sowie Anti-Aliasing- und Anisotropic-Filtering-Stufen.
AA-Skalierung 19x12 – F.E.A.R.
Angaben in Prozent
|
AA-SKalierung 19x12 – Oblivion
Angaben in Prozent
|
AA-Skalierung 1680x1050 – UT3
Angaben in Prozent
|
Und in der Tat, die modifizierten ROPs zeigen in allen drei Testspielen ihre Wirkung. So sinkt der prozentuale Performanceverlust des RV770 in F.E.A.R. mit vier-facher Kantenglättung von 46 Prozent auf nur noch 39 Prozent. Auch bei der qualitativ hochwertigen acht-fachen Glättung sieht es ähnlich aus: Nur 59 Prozent langsamer als mit 4xAA rendert der RV770, während der RV670 noch 66 Prozent seiner Leistung einbüßt. Die Custom-Filter-Varianten haben ebenso einen Performanceschub erlebt.
In Oblivion kann der RV770 ähnlich glänzen und schafft es, bei herkömmlichen 4xMSAA nur ein kaum bemerkbares Prozent Geschwindigkeit einzubüßen. Der RV670 benötigt dazu gut sieben Prozent der Rechenleistung, der GT200 liegt mit einer Differenz von 15 Prozent weit dahinter. Mit 8xAA wird der Geschwindigkeitsverlust zwar größer, hält sich mit 20 Prozent auf dem RV770 aber noch in Maßen. Der RV670 agiert dann 30 Prozent langsamer, während der GT200 gleich 34 Prozent verliert. Auch in Oblivion zeigt sich die gestiegene Leistung mit dem Custom-Filter-Anti-Aliasing.
Etwas widerspenstig ist dagegen Unreal Tournament 3, in dem es nur minimale Unterschiede zwischen dem RV670 sowie dem RV770 gibt. Erst bei 8xMSAA sowie bei den CFAA-Modi kann der RV770 auftrumpfen und reagiert deutlich gelassener auf die vier weiteren AA-Samples als der RV670. Der GT200 hat in UT3 dagegen seine Sternstunde und verliert weniger Performance als der RV770 – solange man das acht-fache Anti-Aliasing meidet. Dann liegt der RV770 wieder klar vorn. Was die Geschwindigkeit der Kantenglättung betrifft, gibt es zur zeit also keine effektivere GPU als den RV770 von ATi.
AF-SKalierung 12x10 – Crysis
Angaben in Prozent
|
AF-Skalierung 19x12 – Gothic 3
Angaben in Prozent
|
AF-Skalierung 19x12 – Stalker
Angaben in Prozent
|
Der RV670 hatte eine große Schwäche: Aufgrund der geringen Anzahl der Textureinheiten und der damit verbundenen niedrigen Texturfüllrate bricht die GPU bei Aktivierung der anisotropen Texturfilterung je nach Anwendung immens ein. So verrichtet der RV670 bei 16-facher anisotroper Filterung in Crysis satte 66 Prozent, in Gothic 3 37 Prozent und in Stalker 55 Prozent langsamer seine Arbeit als ohne die bessere Texturfilterung. Der GT200 hat in genau dieser Disziplin aufgrund der immens höheren Texelfüllrate seine Stärken und verliert meistens nur marginal an Leistung.
Der RV770 macht diesbezüglich nun einen großen Schritt nach vorne, auch wenn man es noch lange nicht vermag, den GT200 oder den G92 einzuholen. Nichtsdestotrotz ist die auf dem RV770 vorhandene Texturleistung eine regelrechte Wohltat für den Kunden, da der Leistungsverlust bei der anisotropen Filterung nun um einiges kleiner als auf dem RV670 ausfällt. So sinkt die Geschwindigkeit in Crysis nur noch um 34 Prozent, in Gothic 3 um zwölf Prozent und in Stalker um 28 Prozent. Der G92 sowie der GT200 liegen zwar immer noch unangefochten vorne, aber dennoch ist die Entwicklung ein wichtiger Schritt in die richtige Richtung.
Auflösungsskalierung – CoH
Angaben in Prozent
|
Auflösungsskalierung – Crysis
Angaben in Prozent
|
Auflösungsskalierung – F.E.A.R.
Angaben in Prozent
|
Da beim RV770 primär die ROPs verbessert und die Anzahl der Textureinheiten erhöht worden sind, fallen die Leistungssteigerung bei der reinen Auflösungsskalierung ohne Anti-Aliasing sowie anisotroper Filterung deutlich geringer als in den vorherigen Testsituationen aus. Zwar kann sich der RV770 aufgrund der höheren Rohleistung durchgängig vor den RV670 setzen, von den Werten eines GT200 ist die GPU aber noch weit entfernt.
Impressionen
MSI Radeon HD 4850
Die in Feuerrot gehaltene MSI-Platine misst eine Länge von nicht ganz 24 cm, womit das PCB einige Millimeter länger als das einer Radeon HD 3850 ist. Nichtsdestotrotz sollte es beim Einbau in ein handelsübliches Gehäuse zu keinerlei Problemen kommen.
Vergleicht man die Platinen der Radeon HD 4850 mit der der Radeon HD 3850, fallen diverse Übereinstimmungen auf. Einige Bauteile sind identisch und stehen an derselben Position, andere wurden wiederum ersetzt, während manche gar neu hinzugekommen sind. Dass beide Modelle noch eng miteinander verwandt sind, ist aber kaum zu übersehen. Die maximale Leistungsaufnahme der Radeon HD 4850 liegt bei etwa 110 Watt. Dadurch gibt sich der 3D-Beschleuniger mit einem zusätzlichen Sechs-Pin-Stromanschluss zufrieden.
Als Kühlsystem vertraut MSI auf die Referenz-Single-Slot-Variante, die ebenfalls beinahe komplett identisch zu dem System auf der Radeon HD 3850 ist. So wird ein Großteil des PCBs von dem Kühlsystem bedeckt, das als Basis eine große Kupferkühlplatte nutzt. Auf dieser Platte sind diverse, recht grobe Kühllammellen positioniert, die die Kühleroberfläche vergrößern. Neben dem VRAM bedeckt der Kühler auch die Spannungswandler.
Als Lüfter vertraut MSI auf ein nur 55 Millimeter großes Radialexemplar, das im Gegensatz zur Radeon-HD-3850-Variante aber über deutlich mehr Lüfterblätter verfügt. Trotzdem weiß der Propeller zu überzeugen. In keiner Situation lässt sich das Kühlsystem komplett aus der Ruhe bringen – mehr dazu im Abschnitt Lautstärke.
Der 512 MB große VRAM auf der Radeon HD 4850 wird von Qimonda mit einer Zugriffszeit von einer Nanosekunde produziert. Auf dem Slotblech der MSI Radeon HD 4850 findet man zwei HDCP-geschützte Dual-Link-DVI-Ausgänge vor, die selbst bei einer Dual-Link-Auflösung wie beispielsweise 2560x1600 den Kopierschutz anwenden können. Darüber hinaus ist der obligatorische HDTV-Ausgang verbaut. Jeder Radeon HD 4850 liegt ein DVI-zu-HDMI-Adapter bei, mit dem es möglich ist, Video- und Audio-Signale über den DVI-Ausgang wiederzugeben. Dabei ist der Adapter mit dem HDMI-1.3-Standard kompatibel, womit eine Dolby-Digital-, Dolby-Digital-Plus, Dolby-TrueHD-, DTS- sowie DTS-HD-Tonspur von einer DVD, Blu-ray oder HD-DVD ausgegeben werden kann.
Die Ausstattung von MSI kann man höchstens als durchschnittlich bezeichnen. Mehr als einen DVI-auf-D-SUB-, DVI-auf-HDMI-, einen S-Video-auf-YUV-Adapter sowie eine CrossFire-Bridge findet der Käufer nicht in dem Karton vor.
PowerColor Radeon HD 4870
Die ATi Radeon HD 4870 von PowerColor erreichte uns leider erst wenige Stunden vor Redaktionsschluss, so dass wir im Rahmen dieses Artikels nur einen kleinen Einblick in die Leistung der Karte präsentieren können. Die ersten Messungen der Karte finden sich im Abschnitt „Radeon HD 4870 Vorschau“ am Ende des Tests. Ein ausführlicher Artikel folgt in Kürze.
Nvidia GeForce 9800 GTX+
Nach der Präsentation der Radeon HD 3850 hatte Nvidia ein großes Problem: Es gab keinen echten Gegenspieler zur günstigen, aber dennoch schnellen Grafikkarte aus dem Hause ATi. Ein Umstand, der sich so schnell auch nicht ändern sollte. Damit den Kaliforniern bei der Radeon HD 4850 nicht dasselbe passiert, schickt man überraschend eine leicht verbesserte GeForce 9800 GTX ins Rennen, die auf den Namen GeForce 9800 GTX+ hören wird. Ab Juli soll die Grafikkarte für etwa 190 Euro über die Ladentheke wandern und dabei die GeForce 9800 GTX als schnellste GeForce-9000-Karte ablösen. Es ist zu hoffen, dass die Karte auch wirklich in Stückzahlen in den Handel kommt, und nicht nur für ein besseres Bild zur Präsentation der Konkurrenz dienen soll.
Abgesehen von einem bisher noch nie genutzten Namenskürzel wird auf der GeForce 9800 GTX+ auch ein neues Bauteil seine Premiere feiern: Die G92b-GPU, die völlig identisch zum G92-Vorgänger ist, aber nicht mehr im 65-nm-, sondern im modernen 55-nm-Prozess hergestellt wird. Dadurch sinkt die DIE-Größe um ein gutes Stück und Nvidia kann mehr Chips auf einem 300-mm-Wafer produzieren lassen, was bei einer guten Yield-Rate (Ausbeute an fehlerfreien Chips pro Wafer) die Produktionskosten senkt. Für den Kunden ergeben sich potentiell weitere Vorteile im Bereich der Leistungsaufnahme, der Temperatur und der Übertaktbarkeit.
Auf der GeForce 9800 GTX+ taktet die TMU-Domäne der G92b-GPU mit 738 MHz, was ein Plus von etwa 63 MHz gegenüber der GeForce 9800 GTX bedeutet. Die Shaderdomäne arbeitet mit 1.836 MHz gleich um 161 MHz schneller, während der 512 MB große GDDR3-Speicher, der von Hynix mit einer Zugriffszeit von 0,83 Nanosekunden hergestellt wird, weiterhin mit 1.100 MHz angesteuert wird. Das Kühlsystem der GeForce 9800 GTX+ kommt vielen sicherlich bekannt vor. Es ist identisch mit dem Exemplar der GeForce 9800 GTX, und auch die Platinen der beiden 3D-Beschleuniger sind absolut gleich.
Darüber hinaus wird die GeForce 9800 GTX+ neben der herkömmlichen GeForce 9800 GTX sowie der GeForce GTX 280 und der GeForce GTX 260 eines der ersten GeForce-Modelle sein, auf denen die CUDA-Implementierung der Physikbeschleunigung PhysX aktiviert ist. Durch den Treiber GeForce 177.39 wird diese Fähigkeit den Grafikkarten hinzugefügt, wobei sämtliche GeForce-9- und GeForce-8-Produkte im Laufe des Julis folgen sollen. Derzeit können der zweite CPU-Test im 3DMark Vantage sowie einige spezielle „Physik-Levels“ in Unreal Tournament 3 von der PhysX-Implementierung profitieren. Weitere Applikationen werden demnächst folgen.
Testsystem
Testsystem:
- Prozessor
- Intel Core 2 Extreme QX9770 (übertaktet per Multiplikator auf 4 GHz, Quad-Core)
- CPU-Kühler
- Noctua NH-U12P
- Motherboard
- Asus P5E3 Deluxe WiFi-AP (Intel X38, BIOS-Version: 1104) Haupt-Testplatine und für CrossFire-Systeme
- XFX nForce 790i Ultra (Nvidia nForce 790i, BIOS-Version: 811N1P01_Beta) für SLI-Systeme
- Arbeitsspeicher
- 2x 1024 MB G.Skill DDR3-1600 (7-7-7-18)
- 2x 1024 MB Patriot DDR3-1600 (7-7-7-18)
- Grafikkarten
- MSI Radeon HD 4850 (625/993), 512 MB
- ATi Radeon HD 3870 X2 (825/900), 2x 512 MB
- ATi Radeon HD 3870 (775/1.125), 512 MB
- ATi Radeon HD 3850 (668/828), 512 MB
- ATi Radeon HD 3850 (668/828), 256 MB
- ATi Radeon HD 3650 (725/800), 512 MB
- Nvidia GeForce GTX 280 (602/1.296/1.107), 1.024 MB
- Nvidia GeForce 9800 GX2 (600/1.512/1.000), 2x 512 MB
- Nvidia GeForce 9800 GTX+ (738/1.836/1.100), 512 MB
- Nvidia GeForce 9800 GTX (675/1.675/1.100), 512 MB
- Nvidia GeForce 9600 GT (650/1.625/900), 512 MB
- Nvidia GeForce 9600 GSO (555/1.350/800), 384 MB
- Nvidia GeForce 8800 Ultra (612/1.512/1080), 768 MB
- Nvidia GeForce 8800 GTX (575/1.350/900), 768 MB
- Nvidia GeForce 8800 GTS 512 (650/1.625/970), 512 MB
- Nvidia GeForce 8800 GT (600/1.512/900), 512 MB
- Nvidia GeForce 8600 GTS (675/1.450/1.000), 256 MB
- Nvidia GeForce 8600 GT (540/1.190/700), 256 MB
- Netzteil
- Coolermaster M850 Real Power Pro Modular (850 Watt)
- Peripherie
- Toshiba SD-H802A HD-DVD-Laufwerk
- Pioneer BDC-202BK SATA Blu-ray-Laufwerk
- Samsung SpinPoint F1 SATA2-HDD mit 750 GB und 32 MB Cache
- Gehäuse
- Coolermaster Stacker 832
- Treiberversionen
- Nvidia ForceWare 174.16
- Nvidia ForceWare 174.53 (9800 GX2, 9800 GTX)
- Nvidia ForceWare 175.16 (9600 GSO)
- Nvidia GeForce 177.34 (GTX 280)
- Nvidia GeForce 177.39 (9800 GTX+)
- ATi Catalyst 8.3
- ATi Catalyst 8.6 (Radeon HD 4850)
- Software
- Microsoft Windows Vista x64 SP1
- Microsoft DirectX 9.0c
- Microsoft Direct3D 10
Benchmarks
Folgende Benchmarks kamen während unseres Tests zum Einsatz:
- Synthetische Benchmarks:
- 3DMark06 Version 1.0.2
- 3DMark Vantage 1.0
- Spielebenchmarks:
- Assassin's Creed, D3D10(.1), Vollversion, Version 1.0
- Bioshock, D3D10, Vollversion, Version 1.1
- Call of Duty 4, Vollversion, Version 1.5
- Call of Juarez, D3D10, Vollversion, Version 1.1.0.0
- Clive Barker's Jericho, Demo
- Company of Heroes, D3D10, Vollversion, Version 1.71
- Crysis, Vollversion, Version 1.21
- F.E.A.R., Vollversion, Version 1.08
- Gothic 3, Vollversion, Version 1.12
- Lost Planet, D3D10, Vollversion
- Rainbow Six Vegas, Vollversion, Version 1.06
- Stalker, Vollversion, Version 1.0005
- Unreal Tournament 3, Vollversion, Patch 1.2
- World in Conflict, D3D10, Vollversion, Patch 1007
Alle Benchmarks werden mit maximalen Details ausgeführt, damit die Grafikkarte möglichst hoch belastet wird. Als Einstellungen haben wir uns dabei für 1280x1024 und 1600x1200 (sowie 2560x1600 bei Grafikkarten mit 512 MB oder mehr und einer entsprechenden Leistung) entschieden. Damit zollen wir den modernen High-End-Beschleuniger Tribut, die durch ihre Rechenkraft niedrigere Auflösungen als 1280x1024 CPU-limitiert werden lassen. Neben den reinen Auflösungen lassen wir den Benchmarkparcours auch mit 4-fachem (und falls möglich acht-fachem) Anti-Aliasing sowie 16-fachen anisotropen Filter durchlaufen. TSSAA (Nvidia) oder AAA (ATi) zur Glättung von Alpha-Test-Texturen nutzen wir aufgrund von Kompatibilitätsproblemen nicht mehr in unserem Benchmarkparcours.
Nach sorgfältiger Überlegung und mehrfacher Analyse selbst aufgenommener Spielesequenzen sind wir zu dem Schluss gekommen, dass die Qualität der Texturfilterung auf aktuellen ATi- und Nvidia-Grafikkarten in der Standard-Einstellung in etwa vergleichbar sind (mit leichten Vorteilen für die GeForce-Produkte). Bei Nvidia verändern wir somit keinerlei Einstellungen und im ATi-Treiber belassen wir die A.I.-Funktion auf „Standard“.
Treibereinstellungen: Nvidia-Grafikkarten (G8x, G9x, GT200)
- Texturfilterung: Qualität
- Vertikale Synchronisierung: Aus
- MipMaps erzwingen: keine
- Trilineare Optimierung: Ein
- Anisotrope Muster-Optimierung: Aus
- Negativer LOD-Bias: Clamp
- Gamma-angepasstes AA: Ein
- AA-Modus: 1xAA, 4xAA, 8xQAA
- Transparenz AA: Aus
Treibereinstellungen: ATi-Grafikkarten (R(V)6x0, RV770)
- Catalyst A.I.: Standard
- Mipmap Detail Level: High Quality
- Wait for vertical refresh: Always off
- AA-Modus: 1xAA, 4xAA, 8xAA
- Adaptive Anti-Aliasing: Off
Theoretische Benchmarks
Fillrate Tester
- Dieses nützliche kleine Programm dient dazu, die Füllraten einer Grafikkarte zu messen. Im Gegensatz zu den bzw. im 3DMark integrierten Füllraten-Tests, die im Fall von Single-Texturing vornehmlich die Bandbreite messen, kann dieses Programm recht differenzierten Aufschluss über verschiedene Arten von Füllrate geben, unter anderem auch die Pixelshader-Füllraten, welche wir hier betrachten wollen.
Getestet wurde in 1024x768 in 32Bit mit 24Bit Z- und 8Bit Stencilbuffer und 60 Hz Refreshrate. - Download: Fillrate Tester [2]
Fablemark
- Der Fablemark wurde, wie auch der nachfolgende Templemark, von PowerVR entwickelt und dient trotz eines sehr hohen Anteils an Overdraw der Zurschaustellung der Stärken des Kyro-Chips was den Stencil-Buffer angeht.
Natürlich wird auch auf allen anderen Karten die Stencil-Performance stark gefordert, so dass dieser Test ein Indiz für kommende Spiele sein kann, die vor dem eigentlichen Rendering einen Z-/Stencil-only Pass einlegen, um vorab jeglichen Overdraw zu vermeiden.
Getestet wurde mit folgender Kommandozeile: [InstallDir]\D3DFablemark.exe -benchmark=1 -width=xxxx -height=xxxx -bpp=32" - Weitere Informationen: PowerVR.com [3]
- Download: PowerVR.com [4]
Fablemark – 1920x1200
Angaben in Bildern pro Sekunde (FPS)
|
ShaderMark
- Der ShaderMark liegt zur Zeit in der aktuellen Version 2.1 vor und wurde von Tommti-Systems [5] entwickelt. Dank zahlreichen Updates befindet sich der Benchmark immer noch auf der Höhe der Zeit und misst die Performance der Shader-Einheiten moderner Grafikkarten. Dabei unterstützt das Programm auch das Shader-Model 3.0, weswegen es sich gut zu einem Vergleich aktueller Architekturen eignet. Getestet werden dabei bis zu 25 unterschiedliche Shader-Anweisungen unter der Auflösung 1920x1200, die allesamt in der Hochsprache HLSL (High Level Shader Language) geschrieben sind.
- Download: ShaderMark.de [6]
D3DRighmark Beta 4 und D3D10-Version
- Auch wenn theoretische Benchmarks, weil diese keine „reale“ 3D-Umgebung darstellen, suboptimal für die Bestimmung der allgemeinen Performance sind, so zeigen solche Programme sehr gut, wie schnell oder langsam eine Grafikkarte in einem gewissen Teilbereich ist. Der „D3DRightmark“ in der Version „Beta 4“, der gleich mehrere dieser Teilbereiche untersucht, gehört derselben Kategorie an. Es wird nicht nur die Vertex-Shader-3.0-Performance, sondern ebenfalls mit Hilfe von unterschiedlichem Shader-Code, der in HLSL geschrieben ist und FP32-Genauigkeit vorsieht, die Pixel Shader 3.0 gemessen. Darüber hinaus wird zusätzlich ein Test der „Hidden Surface Removal“-Mechanismen durchgeführt, ebenso ein Pixel-Filling- und Point-Sprites-Test. Als Auflösung verwenden wir 1920x1200 ohne Kantenglättung und Texturfilterung. Da das Diagramm für die Ergebnisse des D3DRightmark sehr lang ist, haben wir die Werte in einem Klapptext versteckt. Ein einfaches Draufklicken genügt, um die Benchmarks sehen zu können. Seit einiger Zeit gibt es darüber hinaus eine Direct3D-10-Version des Benchmarks, die verschiedene Shaderinstruktionen (Pixel, Geometry und Vertex) testet. Diese machen wir uns zu Nutze, um die theoretische Performance der neuen Microsoft-API auf den 3D-Beschleunigern zu messen.
- Download: D3DRightmark Beta 4 [7]
D3DRightmark – 1920x1200
Angaben in Bildern pro Sekunde (FPS)
|
D3DRightmark D3D10 – 1920x1200
Angaben in Bildern pro Sekunde (FPS)
|
Synthetische Benchmarks
3DMark06
Die allseits bekannte Benchmarkserie von Futuremark ist mittlerweile in der Version 2006 erschienen und hört dementsprechend auf die Bezeichnung „3DMark06“. Von den sechs Testszenen messen vier Sequenzen die Performance der Grafikkarte und zeigen eine Grafikpracht, die ihresgleichen sucht. Um jene zu erreichen setzen die Finnen auf modernste 3D-Technologie, weswegen nicht nur massiv das Shader-Model 3.0 verwendet wird – auch extrem aufwendige Texturen, spektakuläre Partikeleffekte, komplexe Schattenberechnungen und als weiteres Highlight „High Dynamic Range Rendering“ – kurz HDRR – werden eingesetzt. Dabei setzt Futuremark auf FP16-HDR, das die derzeit Best mögliche Bildqualität liefert, aber auch aufwendig zu berechnen ist. Weitere Details zu diesem Programm gibt es in einem unserer ausführlichen Artikel. [8]
3DMark06 – 1280x1024
Angaben in Punkten
|
3DMark06 – 1600x1200
Angaben in Punkten
|
3DMark06 – 2560x1600
Angaben in Punkten
|
3DMark Vantage + GPU-PhysX
Nachdem der altgediente 3DMark06 schon einige Jahre auf dem Buckel hat und somit nicht nur die Grafik mittlerweile etwas angestaubt wirkt sondern darüber hinaus das CPU-Limit bei schnellen Grafikkarten immer mehr bemerkbar wird, wurde es höchste Zeit für einen Nachfolger. Der finnische Hersteller Futuremark hat dementsprechend nach einer langen Wartezeit den 3DMark Vantage auf den Markt gebracht, der von vornherein für die Direct3D-10-API programmiert worden ist. Grafisch bieten die zwei Spieletests dementsprechend viel fürs Auge, wobei vor allem der zweite Test Glanzpunkte setzen kann. Mit FP16-HDR, Tiefenunschärfe, Parallax Occlusion Mapping, einer physikalische Simulation auf der GPU, diversen Shadereffekten und noch vielem mehr bringt der 3DMark Vantage die 3D-Hardware problemlos ans Leistungslimit. Wir testen das Programm (falls die Grafikkarten es zulassen) im Performance-, High- und Extreme-Preset. Weitere Details zu diesem Programm gibt es in einem unserer ausführlichen Artikel. [9]
3DMark Vantage – 1280x1024
Angaben in Punkten
|
3DMark Vantage – 1680x1050
Angaben in Punkten
|
3DMark Vantage – 1920x1200
Angaben in Punkten
|
3DMark Vantage Performance – PhysX
Angaben in Punkten
|
3DMark Vantage High – PhysX
Angaben in Punkten
|
3DMark Vantage Extreme – PhysX
Angaben in Punkten
|
Direct3D-9-Benchmarks
Call of Duty 4
Der neueste Spross aus der bekannten „Call of Duty“-Reihe ist erstmals nicht im zweiten Weltkrieg angesiedelt, sondern einige Jahrzehnte später in der Zukunft. Dem Spielspaß tut dies aber keinen Abbruch, ganz im Gegenteil sogar. Die Atmosphäre ist in Call of Duty 4 dermaßen realistisch, dass man ohne Probleme in die Spielwelt eintauchen kann. Doch nicht nur spielerisch weiß der First-Person-Shooter zu gefallen, auch technisch macht man im Gegensatz zum (PC)-Vorgänger Call of Duty 2 einen großen Schritt nach vorne – und das, obwohl man immer noch dieselbe Grafikengine benutzt. Optisch liegt Call of Duty 4 jedoch auf einem vollkommen anderen Niveau: Schicke Shadereffekte sowie ein intelligenter Parallax-Mapping-Einsatz vertuschen die teils etwas schwachen Texturen. Schon Call of Duty 2 konnte beim Erscheinen mit einer einzigartigen Rauchdarstellung punkten; der Nachfolger steht dem zweiten Teil der Serie diesbezüglich in nichts nach und kommt mit einer Rauchpräsentation daher, die zu beeindrucken weiß. Auf Direct3D-10-Unterstützung muss man aber verzichten: Call of Duty 4 setzt noch alleinig auf den Vorgänger Direct3D 9.
Call of Duty 4 – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Call of Duty 4 – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Call of Duty 4 – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Clive Barker's Jericho
Spielerisch oder technisch bemerkenswerte Spiele geraten normalerweise schnell ins Blickfeld der Presse und werden auch von den Spielern meistens sehnlich erwartet. Anders war dies merkwürdigerweise bei „Clive Barker’ Jericho“, dessen Demo mehr oder weniger aus dem Nichts aufgetaucht ist. Spielerisch wird die Vollversion zwar erst noch beweisen müssen, ob Jericho auf Dauer wird überzeugen können, technisch macht die Demo aber bereits eines klar: Die Grafikengine ist auf der Höhe der Zeit und braucht sich vor keinem anderen Konkurrenten zu verstecken. Nicht nur die Technik an sich kann mit qualitativ hochwertigen Texturen, diversen Shader- sowie Partikeleffekten und FP16-High-Dynamic-Range-Rendering punkten, auch der Grafikcontent selber, sprich die künstlerische Gestaltung, zeugt von Originalität. Da die GeForce-7-Serie von Nvidia bekannterweise kein Multi-Sampling-Anti-Aliasing auf ein FP16-Rendertarget anwenden kann, muss die alte Grafikkartengeneration aus Kalifornien bei den Qualitätseinstellungen außen vor bleiben.
Clive Barker's Jericho – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Clive Barker's Jericho – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Clive Barker's Jericho – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
F.E.A.R.
Doom 3 bekommt Konkurrenz – und was für Eine! Die Programmierer des Gruselshooters F.E.A.R. scheinen sich Doom 3 als großes Vorbild ausgesucht zu haben – wobei man allerdings fast alles besser zu machen scheint. Unter anderem wird die sehr beklemmende Atmosphäre durch eine Grafikqualität erreicht, die ihresgleichen sucht. Shadereffekte in Massen, wunderschönes Bump-Mapping, sehr spektakuläre Schattenwürfe, detaillierte Texturen sowie hübsch aussehende Partikeleffekte und noch vieles mehr bekommt der Spieler zu Gesicht. Keine Frage, F.E.A.R. ist bereits Pflicht für einen guten Benchmark-Parcours geworden. Wir verwenden für diese Zwecke die Vollversion, die über eine integrierte Benchmarkfunktion verfügt. Jene zeigt ein Gefecht sowie eine größere Explosion, die durch eine frei bewegte Kamera aufgenommen wurden. Die Details sind, mit Ausnahme der Soft-Shadows, auf das Maximum gesetzt.
F.E.A.R. – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
F.E.A.R. – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
F.E.A.R. – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Gothic 3
Das wohl zweifellos meisterwartete Rollenspiel im Jahre 2006 hört auf den Namen „Gothic 3“, was mit den beiden beliebten Vorgängern begründet ist. Auch wenn das Spiel – selbst nach einigen Patches – immer noch fehlerhaft ist, so erfreut es sich einer großen Beliebtheit in Deutschland, wie man gut an den Verkaufscharts erkennen kann. Doch neben dem eigentlichen Spielinhalt kann Gothic 3 zudem mit seiner Grafikengine punkten, die den Entwicklern sehr gut gelungen ist. So ist nicht nur die Weitsicht beeindruckend, auch die kleinen, liebevollen Details an Figuren und Gegenständen machen die Grafik zu etwas Besonderem. Dass die Engine damit nicht nur gut aussieht, sondern auch die Hardware sehr fordert, war bereits vor der Veröffentlichung klar. Allerdings bietet das Grafikgrundgerüst einen entscheidenden Nachteil: So kann derzeit kein Anti-Aliasing angewendet werden, weswegen das Feature in den Qualitätseinstellungen nicht aktiv ist; dort ist nur der anisotrope Filter im Einsatz.
Gothic 3 – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Gothic 3 – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Gothic 3 – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Rainbow Six Vegas
Die „Rainbow Six“-Reihe umfasst schon etliche Titel und ist eine der größten PC-Spiele-Serien weltweit. Die neueste Kreation hört auf den simplen Namen „Vegas“ und verdeutlich damit bereits, wo die Spezialeinheit diesmal im Einsatz ist. Und das die Stadt Las Vegas zu den farbenfrohesten Städten überhaupt gezählt werden kann, bezweifeln wohl nur die wenigsten. Dementsprechend bunt, aber auch sehr detailliert, ist die Grafikengine von Vegas, die zeitgleich nicht irgendeine, sondern wohlbekannt ist: Die Unreal Engine 3, die seit Ende des Jahres 2007 in „Unreal Tournament 3“ zum Einsatz kommt. Obwohl die Version in Vegas der in UT3 um einiges nachhinkt, so weiß die Grafik zu überzeugen. Sehr viele Details werden dargestellt, die man bis jetzt in keinem Spiel entdecken konnte; detaillierte Animationen runden das Ergebnis ab. Doch die Unreal Engine 3 hat einen großen Nachteil: So kommt „Deferred Shading“ (die Unreal Engine 3 an sich ist kein reiner Deffered Renderer, einzig der Schattenpart besitzt einen speziellen Algorithmus) zum Einsatz, das mit einer flotten Schatten- und Lichtberechnung zwar einige Vorteile bietet, aber unter der Direct3D-9-API Anti-Aliasing verhindert. Erst mit Direct3D 10 ist Deferred Shading und Kantenglättung möglich. Aktuelle Nvidia-Treiber ermöglichen, in dem Spiel aufgrund eines „Treiber-Hacks“ dennoch die Kantenglättung zu aktivieren.
Rainbow Six Vegas – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Rainbow Six Vegas – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Rainbow Six Vegas – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Stalker
„Stalker“ – neben Duke Nukem Forever wohl der Inbegriff des Wartens. Nach einer langen Zeit hat es der ukrainische First-Person-Shooter aber dennoch in die Regale geschafft und weiß trotz der schier ewigen Entwicklungszeit zu gefallen. Nicht nur spielerisch punktet das Spiel mit netten Ideen, auch die Atmosphäre kann sich sehen, beziehungsweise spüren lassen. Darüber hinaus ist die Grafikengine, die einen „Deferred Shading“-Algorithmus verwendet, gut gelungen. Das Spiel überzeugt vor allem mit schicken Wettereffekten und kann detaillierte Texturen aufweisen. Shader-Model-3.0-Effekte kommen zum Einsatz, ebenso hochwertiges FP16-HDR-Rendering, das für ein realitätsnahes Farbenspektrum sorgt. Ein weiteres Highlight sind die zahlreichen hochwertigen Licht- und Schatteneffekte, die man in dieser Form bis jetzt noch nicht zu sehen bekommen hat. Dies ist der Vorteil von Deferred Shading: Licht- und Schattenberechnungen können sehr schnell ausgeführt werden. Ein großer Nachteil ist jedoch, dass Direct3D-9-Beschleuniger deswegen kein Multi-Sampling-Anti-Aliasing ausführen können. Dazu benötigt es nicht nur eine D3D10-Grafikkarte, auch das Spiel muss mit der neuen API ausgestattet sein.
Stalker – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Stalker – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Stalker – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Unreal Tournament 3
Klassische First-Person-Shooter sind in der heutigen Zeit selten geworden. Während es diese vor einigen Jahren noch in schieren Massen gab, ist ein „reinrassiger Ballerspaß“ mittlerweile etwas aus der Mode gekommen. Nichtsdestotrotz gibt es einige wenige Spiele, die dies mit großem Erfolg ignorieren und auf das alte Erfolgskonzept setzen. Eine dieser Serien hört auf den Namen „Unreal Tournament“, die von Epic, einer der bekanntesten Spieleschmieden, programmiert wird. Der neueste Spross hört auf den Namen Unreal Tournament 3, der im Gegensatz zu seinen Vorgängern spielerisch wieder mehr an das originale Unreal Tournament erinnert. Als technisches Grundgerüst kommt die Unreal Engine 3 zum Einsatz, die derzeit bereits in einigen anderen Spielen zu gefallen weiß. Dies ist auch in Unreal Tournament 3 nicht anders: Schicke und abwechslungsreiche Texturen, gute Partikeleffekte, ein sinnvolles (wenn auch manchmal etwas übertriebenes) Shading, High-Dynamic-Range-Rendering und noch vieles mehr machen aus „UT3“ eines der schönsten Spiele auf dem Markt. Noch nicht implementiert ist (obwohl die Unreal Engine 3 dazu durchaus in der Lage ist) die Unterstützung der Direct3D-10-API. Da die Unreal Engine 3 Deferred Shading benutzt, funktioniert kein Anti-Aliasing, weswegen die meisten Grafikkarten keine Kantenglättung nutzen können. Da die Direct3D-10-Hardware dazu aber in der Lage ist, hat Nvidia für die entsprechenden Grafikkarten einen kleinen Trick im Treiber angewendet, der Anti-Aliasing möglich macht. Dies machen wir uns zunutze und testen die GeForce-8-Karten ebenfalls mit aktivierter Kantenglättung. Als Benchmarksequenz verwenden wir die integrierte Flyby-Funktion der Karte „Gateway“. Diese erzeugt sehr hohe FPS-Werte, die im richtigen Spielgeschehen zu keiner Zeit auch nur annähernd erreicht werden – deswegen kann man von unseren Benchmarks nur bedingt auf das Spiel schließen.
Unreal Tournament 3 – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Unreal Tournament 3 – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Unreal Tournament 3 – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Direct3D-10-Benchmarks
Assassin's Creed
Was passiert, wenn ein Konsolentitel erfolgreich ist? Man portiert ihn natürlich für den PC! Und dies ist UbiSoft mit Assassin's Creed wohl auch ohne Zweifel gelungen, da man es nicht nur bei einer reinen 1:1-Umsetzung gelassen, sondern darüber hinaus noch einige weitere Spielinhalte eingefügt hat. Doch worum geht es in Assassin's Creed überhaupt? Man spielt den Auftragsmörder Altair, der neben seinem eigentlichen Hauptberuf gerne mit Pferden reitet, Passanten umschubst, spektakuläre Kämpfe ausübt und sich vor allem gerne in schwindelerregenden Höhen, also auf sämtlichen Dächern der verschiedenen Städte, herumtreibt. Und was braucht man dazu? Eine potente Grafikengine, die Assassin's Creed auch durchaus hat. Ein Highlight sind die Charakteranimationen, die einwandfrei umgesetzt sind. Zudem gibt es noch schicke Texturen, sehr schöne Licht- und Schatten-Spiele, eine gut hervorgehobene Weitsicht und noch so einiges mehr, das Assassin's Creed zu einem Fest für die Augen macht. UbiSoft hat es sich nicht nehmen lassen, einen Direct3D-10-Renderer für die PC-Version einzubauen. Dieser soll die Performance bei gleicher Qualität gegenüber der Direct3D-9-Version erhöhen und zudem die Grafikqualität ein wenig verbessern. Dies fällt vor allem bei den Schatten auf, die in der Direct3D-9-Grafik ziemlich „verfranzt“ aussehen.
Assassin's Creed – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Assassin's Creed – 1680x1050
Angaben in Prozent
|
Assassin's Creed – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Bioshock
„Bioshock“, mehr oder weniger der inoffizielle Nachfolger von „System Shock 2“, hatte es bei seinem Erscheinen wahrlich nicht leicht. Die Erwartungen waren dermaßen hoch, dass es nahezu unmöglich schien, diese allesamt zu erfüllen. Im Vorfeld sprach man davon bereits als „bestes Spiel aller Zeiten“. Mittlerweile ist BioShock erschienen – ob es tatsächlich das beste Spiel aller Zeiten ist, kann man wohl noch ewig diskutieren. Eines ist aber eindeutig: Technisch ist Bioshock nicht nur sehr weit vorne, sondern wohl derzeit allen anderen Titeln voraus. Grund dafür ist die Unreal Engine 3, die die Entwickler modifiziert haben, um diese auf die eigenen Ansprüche anzupassen. Herausgekommen ist ein Direct3D-10-Renderer, der mit bisher noch nie dagewesenen Wassereffekten punkten kann. So interagiert das Wasser physikalisch korrekt mit dem Spieler, wenn dieser beispielsweise durch einen überfluteten Raum läuft. Darüber hinaus bietet Bioshock viele weitere optische Schmankerl: Schicke Partikeleffekte, spektakuläre Feuerdarstellung, realistische Schatten, schöne Oberflächen, Physikinteraktionen mit den Gegnern sowie der Umwelt und noch vieles mehr machen Bioshock grafisch zu einem Leckerbissen. Mit der Direct3D-10-API funktioniert bisher kein Anti-Aliasing, wie zuvor bereits mehrfach erwähnt wurde. Aktuelle Nvidia-Treiber ermöglichen in dem Spiel aufgrund eines „Treiber-Hacks“, dennoch die Kantenglättung im D3D-10-Modus zu aktivieren.
Bioshock – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Bioshock – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Bioshock – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Call of Juarez
Auch wenn der First-Person-Shooter „Call of Juarez“ ohne John Wayne auskommen muss, so ist das Programm zweifellos eines der wenigen Western-Spiele, die große Aufmerksamkeit auf sich ziehen konnten. Eine gut erzählte Story, zwei interessante Charaktere, die unterschiedlicher nicht sein könnten, viele Pistolen-Duelle und eine Grafik, die sich vor der gesamten Konkurrenz nicht zu verstecken braucht. Wir testen das Spiel in der aktuellen Version, die mit Direct3D-10-Unterstützung daherkommt. Die Vegetation ist um 30 Prozent dichter, es gibt 30 Prozent mehr Partikeleffekte, eine um 25 Prozent gestiegene Sichtweite, höher aufgelöste Texturen, höher aufgelöste Shadowmaps, Relief-Mapping wird eingesetzt und noch vieles mehr. Wie man bereits bemerkt, ist die Anforderung an die Grafikkarte ein gutes Stück weiter gestiegen, und das, obwohl das Spiel von Grund auf eigentlich für die ältere Direct3D-9-Schnittstelle programmiert worden ist. Nichtsdestotrotz hat das Spiel noch mit einem Problem zu kämpfen: So werden Teile der Vegetation nicht richtig dargestellt, was laut Techland am Alpha-to-Coverage-Verfahren liegt. Als Testsequenz nutzen wir die aktualisierte Vollversion und einen eigenen Spielstand.
Call of Juarez – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Call of Juarez – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Call of Juarez – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Company of Heroes
Auf den Patch 1.70 von Company of Heroes haben sicherlich viele Spieler gewartet, denn so bringt die aktuelle Version des Strategietitels nicht nur einige weitere Fehlerbeseitigungen mit sich, sondern führt auch die Unterstützung von Direct3D 10 ein. Die neue API kann man bei einer entsprechenden Grafikkarte im Spielmenü auswählen und schon erscheinen alle Levels in neuem Glanz. Darüber hinaus kann man die Terraindetails nun eine Stufe höher auf „Ultra“ schrauben, was einige Bodendetails hinzufügt und die Texturen sichtbar verbessert. Die Direct3D-10-Version bietet dem Spieler eine pixelgenaue Beleuchtung, Percentage Closer Filtering für die Soft Shadows auf allen D3D10-Beschleunigern, schönere Partikeleffekte sowie Alpha to Coverage für alle Bäume und Sträucher, die somit auch von herkömmlichen MSAA erfasst und bearbeitet werden. Als Benchmarksequenz verwenden wir den integrierten Benchmark.
Company of Heroes – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Company of Heroes – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Company of Heroes – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Crysis
Crysis – alleine der Name sagt wohl schon alles. Kaum ein anderes Spiel hat bereits vor der Veröffentlichung so viel Aufmerksamkeit erhalten wie der First-Person-Shooter von Crytek, der als inoffizieller Nachfolger zum Actionhit Far Cry betrachtet wird. Far Cry sagt eigentlich auch schon alles: Denn kaum ein anderes Spiel lässt Spieler sofort an einen sonnigen Strand und an große Palmen denken. Und genau diesen (und noch viel mehr) sieht man in Crysis wieder – selbst wenn man ihn kaum wiedererkennen wird. Denn wie Far Cry setzt Crysis neue Maßstäbe in Sachen Grafik und hebt die Messlatte dabei gleich dermaßen hoch an, dass es wohl noch einige Zeit dauern wird, bis ein anderes Spiel der grafische Qualität von Crysis Paroli bieten wird. Die Direct3D-10-API, High-Dynamic-Range-Rendering, Parallax Occlusion Mapping, Soft Shadows, Motion Blur, Depth of Field, Soft Particles und noch eine Menge mehr bekommt man bei Crysis geboten. Dementsprechend hoch fallen die Hardwareanforderungen aus, die selbst den schnellsten Rechner problemlos ins Schwitzen bringen. Als Benchmark verwenden wir nicht den integrierten Benchmark, sondern setzen auf eine eigens erstellte Timedemo in dem grafiklastigen Level „Ice“. Wir testen die auf Version 1.21 aktualisierte Vollversion des Spiels. Auch wenn die Einstellung „Very High“ für viele (vor allem günstigere) Grafikkarten unspielbar ist, haben wir uns dennoch für die höchste Qualitätsstufe entschieden, um selbst mit zukünftigen Grafikkarten keine CPU-Limitierung bei gewährleisteter Vergleichbarkeit zu schaffen.
Crysis – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Crysis – 1680x1050
Angaben in Bildern pro Sekunde (FPS)
|
Crysis – 1920x1200
Angaben in Bildern pro Sekunde (FPS)
|
Lost Planet
Das Actionspiel „Lost Planet“ gibt es in zwei verschiedenen Versionen: Eine Direct3D-9- und eine Direct3D-10-Variante; Letztere hat es in unseren Parcours geschafft. Das Spiel kann technisch nicht nur durch die D3D-10-Erweiterung und somit der Nutzung des Shader-Model 4 inklusive des neuen Geometry-Shaders glänzen, auch abseits der API weiß Lost Planet zu gefallen. Mit Soft Shadows (diese sind in Lost Planet zwar an die D3D10-Version gekoppelt, mit Direct3D 10 hat diese Schattenvariante aber nichts zu tun), FP16-High-Dynamic-Range-Rendering, detaillierten Texturen, massig Partikeleffekten und noch vielem mehr ist das technisch weit fortgeschrittene Spiel ein regelrechter Augenschmaus. Dass Lost Planet dabei noch eine Menge Spaß macht, könnte man fast schon als nebensächlich bezeichnen. Die Demoversion des Spiels bietet praktischerweise eine integrierte Benchmarksequenz, die einen Kameraflug aus der Sicht des Spielers durch zwei verschiedene Levels zeigt.
Lost Planet – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Lost Planet – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Lost Planet – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
World in Conflict
Mittlerweile sehen Strategiespiele zwar deutlich besser aus als noch vor einigen Jahren – so recht gelingen will es den Programmen aber nur selten, in die grafische Königsklasse, die meist von First-Person-Shootern besetzt wird, vorzudringen. Den Entwicklern von World in Conflict scheint dies nicht gereicht zu haben und man entwickelte eine Grafikengine, die sich vor keinem anderen Spiel zu verstecken braucht. World in Conflicht unterstützt die Direct3D-10-API und hat keine Schwierigkeiten, Kantenglättung unter der neuen Programmierschnittstelle anzuwenden. Schicke Shadereffekte zieren das Spiel (so wirft die Sonne beispielsweise Lichtstrahlen durch die Wolken, welche die Umgebung darunter beleuchten), ebenso detaillierte Texturen und eine realistische Schattendarstellung. Die Animationen der Spielcharaktere sind gut gelungen, was in Kombination mit einem kinoreifen Schnitt Kinoatmosphäre in den Zwischensequenzen aufkommen lässt. Als Testsequenz benutzen wir nicht die integrierte Benchmarkfunktion, da sich diese mitunter wenig berechenbar verhält. Stattdessen verwenden wir die Introsequenz zur dritten Mission der ersten Kampagne.
World in Conflict – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
World in Conflict – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
World in Conflict – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Performancerating
Kommen wir nun abschließend zum Performancerating. Dadurch soll es erleichtert werden, alle Ergebnisse auf einen Blick zusammengefasst zu bekommen. Da die synthetischen Benchmarks in dem Testparcours (sprich der 3DMark06 sowie der 3DMark Vantage) über keine Spiele-Engine verfügen und somit keine realistische Aussagen über die Geschwindigkeit in 3D-Titeln wiedergeben, haben wir diese Applikationen aus dem Rating herausgenommen. Da in 2560x1600 mit acht-fachem Anti-Aliasing beinahe ausschließlich nur unspielbare FPS-Raten erreicht werden und dazu viele Grafikkarten in einigen Spielen gerne abstürzen, haben wir uns dazu entschlossen, das Rating in einem Klapptext zu verstecken. Wir bitten, diese Ergebnisse nur mit äußerster Vorsicht zu beachten.
Performancerating – 1280x1024
Angaben in Prozent
|
Performancerating – 1600x1200
Angaben in Prozent
|
Performancerating – 2560x1600
Angaben in Prozent
|
Performancerating Qualität
Rating – 1280x1024 4xAA/16xAF
Angaben in Prozent
|
Rating – 1280x1024 8xAA/16xAF
Angaben in Prozent
|
Rating – 1600x1200 4xAA/16xAF
Angaben in Prozent
|
Rating – 1600x1200 8xAA/16xAF
Angaben in Prozent
|
Rating – 2560x1600 4xAA/16xAF
Angaben in Prozent
|
Rating – 2560x1600 8xAA/16xAF
Angaben in Prozent
|
GPU-Computing
Nachdem Grafikkarten seit Anbeginn ihrer Zeit eher dazu da waren, die Arbeit zu verrichten, nach denen die Hardware benannt worden ist (nämlich ein 2D/3D-Bild auf den Monitor wiederzugeben), sind die Aufgaben einer modernen GPU in jünster Vergangenheit deutlich vielschichtiger – GPGPU und GPU-Computing sei Dank. Vor allem Nvidia prescht nach der industrieweit implementierten Videobeschleunigung nun mit einer C-ähnlichen Programmiersprache namens CUDA voran, durch die es einfacher werden soll, Programme auf der GPU berechnen zu können. Nachdem man mit der Tesla-Serie im letzten Jahr den ersten Schritt im Profi-Segment gewagt hat, wird nun vermehrt die Mainstream-Käuferschaft angesprochen.
Die zwei ersten CUDA-Programme sind das bekannte Folding@Home (für das es mittlerweile einen gemeinsamen ATi- und Nvidia-Client gibt, den wir in dem Testvergleich verwenden) und der BadaBOOM Media Converter, mit dessen Hilfe man schnell MPEG2-Videos in ein anderes Format (zum Beispiel für den Apple iPod oder das iPhone) umwandeln kann. BadaBOOM ist jedoch (noch) nicht öffentlich verfügbar und wird darüber hinaus nur auf CUDA-fähigen Grafikkarten lauffähig sein – ATi-Grafikkarten werden also, zumindest vorerst, ausgeschlossen.
Doch auch ATi ist bei GPGPU und GPU-Computing nicht untätig und arbeitet ebenfalls im professionellen sowie im Mainstream-Bereich mit diversen Softwareentwicklern zusammen, damit auch ihre Karten mehr als nur 3D-Grafik wiedergeben können. Der nächste Schritt für ATi und Nvidia wird sein, die 3D-Beschleuniger fit für KI-Berechnungen zu machen. Sowohl ATi als auch Nvidia haben diesbezüglich bereits erste Programme gezeigt, wobei ATi gar eine RV770-Techdemo im Angebot hat, dessen Massen-KI vollständig auf der Grafikkarte berechnet wird.
Folding@Home
Angaben in Punkten
|
Im aktuellen Folding@Home-Client haben ATi-Grafikkarten nichts zu lachen, wobei man aber anmerken muss, dass die Software anscheinend noch nicht optimal an die ATi-Hardware angepasst worden ist. Vor allem die Radeon HD 4850 erzeugt ein merkwürdiges Ergebnis. Sie ist gar schlechter die Radeon HD 3870, was eigentlich aber gar nicht sein kann. Wie ATi uns auf Anfrage mitteilte, liegt das schlechte Ergebnis im aktuellen Folding@Home-Client begründet, der die Radeon HD 4850 wie eine Radeon-HD-3800-Karte ansteuert. Und somit verteilt die Software nur die Daten für 320 MADD-ALUs, weswegen mehr als die Hälfte der RV770-GPU arbeitslos ist.
An die Spitze setzen kann sich dabei die GeForce GTX 280, die die Moleküle 15 Prozent schneller berechnen kann als der kleinere Bruder GeForce GTX 260. Interessanterweise arbeitet die GeForce 9800+ exakt gleich schnell wie die „kleine“ GeForce-GTX-200-Karte, und das, obwohl wir davon ausgegangen sind, dass die GT200-GPU Vorteile beim GPU-Computing zeigen würde. Ein Quad-Core-Prozessor von Intel liegt selbst mit vier Gigahertz weit abgeschlagen hinter den GPUs zurück.
BadaBOOM Media Converter
Angaben in Minuten, Sekunden
|
Ein ähnliches Ergebnis zeigt sich beim Transcodieren eines MPEG2-Videos mit dem BadaBOOM Media Converter. Während die CPU nicht den Hauch einer Chance hat, auch wenn es nicht mehr ganz so negativ ausgeht wie bei Folding@Home, kann die GeForce GTX 280 das Video innerhalb von 21 Sekunden am schnellsten umwandeln. Die GeForce GTX 260 benötigt dazu drei Sekunden länger (14 Prozent Differenz) und kann sich so erneut nicht von der GeForce 9800 GTX+ absetzen. Vor allem der sehr hohe Shadertakt bringt letzterer sicherlich einen großen Vorteil.
Sonstiges
Lautstärke
Da quasi alle aktuellen Modelle über eine herstellerseitige Lüftersteuerung verfügen, unterscheiden wir bei den Messungen den 2D- und den 3D-Betrieb. Für die Last-Messungen wird der Benchmark zu Unreal Tournament 3 in einer Endlosschleife ausgeführt und nach dreißig Minuten die Lautstärke notiert. Beide Messungen werden im Abstand von 15 cm zur Grafikkarte durchgeführt. Die Messung erfolgt für das gesamte Testsystem.
Lautstärke
Angaben in Dezibel
|
Unter Windows hat ATi beim Kühlsystem der Radeon HD 4850 einfach alles richtig gemacht. Direkt nach dem Einschalten des Rechner braust der Lüfter zwar noch mit der maximal möglichen Leistung und ist somit sehr laut, doch nach wenigen Sekundenbruchteilen sinkt der Lärmpegel auf ein angenehmes Surren, um nur kurze Zeit später vollständig zu verschwinden. Selbst wenn man das Ohr direkt an den Rechner hält, ist die Grafikkarte nicht von den restlichen Komponenten zu unterscheiden. Unsere Messungen bestätigen dies: Mit 43,5 Dezibel ist das System mit Grafikkarte nicht lauter als ohne.
Unter Last wird die Radeon HD 4850 dann deutlich lauter, wobei sich das Kühlsystem aber immer noch zurück hält und nicht allzu unangenehm auffällt. Der 3D-Beschleuniger schafft es auf 49 Dezibel, dasselbe Ergebnis wie mit einer GeForce 8800 GTX. Beim Spielen kann man den Lüfter aus einem geschlossenen Gehäuse heraushören. Ohne Zweifel, unter Last gibt es bessere Kühlsysteme, die Radeon HD 4850 schafft aber dennoch ein akzeptables Ergebnis. Im Vergleich verrichtet beispielsweise eine Radeon HD 3870 um einiges leiser ihren Dienst. Für einen Silent-PC ist die Radeon HD 4850 somit nur bedingt (unter Windows) geeignet.
Die GeForce 9800 GTX+ kann man unter Windows ebenfalls als flüsterleise bei 43,5 dB bezeichnen, während die Karte unter Last nochmals zwei Dezibel lauter als die Radeon HD 4850 agiert.
Temperatur
Ähnlich den Messungen zur Lautstärke werden auch die Temperaturmessungen durchgeführt. Fast alle aktuellen Grafikkarten besitzen Sensoren, die per Treiber oder Hersteller-Tool ausgelesen werden können. Die Kern-Temperatur wird dabei im Ruhezustand im Windows-Desktop und unter Last nach dreißig Minuten Unreal Tournament 3 abgelesen. Zudem messen wir mit Hilfe eines Infrarot-Thermometers die Chiptemperatur auf der Rückseite der Grafikkarte.
Temperatur
Angaben in °C
|
Während die Radeon HD 4850 in der Disziplin der Lautstärke noch zu gefallen weiß, geht es bei der Temperatur im wahrsten Sinne des Wortes um einiges heißer zu. Der neue 3D-Beschleuniger aus dem Hause ATi gehört zu den wärmsten Produkten, die wir jemals in unserem Testlabor hatten. So wird die Radeon HD 4850 unter Windows satte 76 Grad Celsius warm, was gleich 13 Grad mehr als die bisher wärmste Grafikkarte, die GeForce 8800 Ultra, ist.
Warum die GPU sich derartig unter Windows aufheizt, ist uns unklar. An einem zu schwachen Kühlsystem kann es eigentlich nicht liegen, selbst wenn der Lüfter lautlos vor sich hin arbeitet. Eine Überprüfung zeigt: Der 3D-Beschleuniger taktet sich standesgemäß herunter, daran sollte es somit auch nicht liegen (allerdings kann man nicht ausschließen, dass die Stromsparmechanismen noch nicht vollständig funktionieren – später dazu mehr).
Unter Last erhöht sich die Temperatur dann auf 86 Grad Celsius, womit man gleich auf mit der alten Radeon HD 3850 liegt. Auf der Chiprückseite messen wir bis zu 73 Grad Celsius. Ein weiterer Rekordwert, den die Radeon HD 4850 ohne mit der Wimper zu zucken aufstellt.
Leistungsaufnahme
Für die Messungen der Leistungsaufnahme wird ein handelsüblicher Verbrauchs-Monitor, den man sich auch beim örtlichen Stromversorger ausleihen kann, genutzt. Gemessen wird die Gesamt-Leistungsaufnahme des Testsystems. Auch hier gilt die Teilung zwischen Idle- und Last-Betrieb. Letzterer wird durch Verwendung von Unreal Tournament 3 unter der Auflösung 2560x1600 simuliert.
Leistungsaufnahme
Angaben in Watt (W)
|
Die Radeon-HD-3000-Serie wusste in der Leistungsaufnahme aufgrund von PowerPlay 2.0 durchaus zu gefallen und konnte sich in dieser Disziplin immer einen Pluspunkt einheimsen. Bei der Radeon HD 4850 sieht es dagegen etwas schlechter aus, wobei wir (wie bei den Temperaturmessungen) aber nicht ausschließen können, dass die Stromsparmechanismen in dem von uns verwendeten Treiber noch nicht einwandfrei funktionieren. So taktet sich die Radeon HD 4850 nachgewiesenerweise zwar auf 160 MHz beziehungsweise 500 MHz herunter, jedoch gibt es Berichte, nach denen es keine Spannungsregulierung gibt. Laut ATi sollte dies jedoch der Fall sein. Wir stehen diesbezüglich mit dem Hersteller in Kontakt und hoffen, bald eine klärende Antwort zu erhalten.
Unter Windows zieht die Radeon HD 4850 (gemeint ist hier der ganze PC) 157 Watt aus der Leitung, was auf ein und demselben Niveau mit einer GeForce GTX 280 liegt. Im Vergleich dazu benötigt die Radeon HD 3870 nur 136 Watt. Unter Last steigt die Leistungsaufnahme auf 290 Watt, was den Verbrauch mit dem einer GeForce 9800 GTX gleich setzt. Zwar nicht das beste, aber dennoch ein akzeptables Ergebnis, da die Leistung der Radeon HD 4850 über der einer GeForce 9800 GTX liegt. Die Idle-Messwerte wollen wir noch nicht abschließend kommentieren und noch abwarten, ob es sich tatsächlich um einen Fehler handelt.
Übertaktbarkeit
Vielen dort draußen wird die gerade neu gekaufte Grafikkarte noch nicht schnell genug sein. Ein probates Mittel, dieses Bedürfnis nach noch mehr Geschwindigkeit zu befriedigen, ist die Hardware zu übertakten. Als kleine Stabilitätsprobe ließen wir den 3DMark06, der besonders grafiklastig ist, laufen und testeten nachfolgend den höchsten Takt mit Hilfe von Company of Heroes, Jericho und World in Conflict. Jedoch muss man vor den Messungen anmerken, dass sich die Ergebnisse nicht auf jede Karte desselben Typs übertragen lassen, da die Güte von Chip zu Chip unterschiedlich ist.
Übertaktbarkeit
Angaben in Bildern pro Sekunde (FPS)
|
Das Übertaktungspotenzial der RV770-GPU auf unserem Exemplar ist als ordentlich zu bezeichnen. Wir konnten die Chipfrequenz von 625 MHz auf 680 MHz anheben, was ein Plus von 55 MHz bedeutet. Der 512 MB große GDDR3-Speicher war dagegen recht schnell am Ende angelangt. Nur ein Plus von 37 MHz und somit ein Takt von 1.030 MHz war möglich, bevor erste Abstürze auftraten.
VC-1-/H.264-Wiedergabe
Noch vor einigen Jahren standen sämtliche PCs vor der damals komplizierten Aufgabe, ein DVD-Video zu decodieren. Nachdem damals zuerst die CPU alleine ackern musste, und diese des Öfteren damit überfordert war, kam es bei den Grafikchipspezialisten in die Mode, ihre 3D-Beschleuniger mit speziellen Funktionen auszustatten, um dem Prozessor die Hauptarbeit des Dekodierens abzunehmen. Ein netter Nebeneffekt war, dass die Grafikkarten mit speziellen Algorithmen arbeiten konnten, der die Bildqualität ohne einen großen Leistungsaufwand verbessern konnte. DVDs sind mittlerweile schon längst keine Herausforderung mehr. Ein moderner PC steht mittlerweile vor deutlich schwereren Aufgaben: Das Decodieren von im VC-1- oder H.264-Codec befindlichen HD-Videos, die auf einer Blu-ray oder einer HD DVD aufgenommen worden sind (HD-Trailer haben zwar dieselben Codecs sowie eine identische Bildqualität, allerdings sind diese nicht verschlüsselt, weswegen die CPU-Auslastung um einiges geringer ausfällt). Wir haben uns als Film für „I am Legend“ (1080p, 24 Bilder pro Sekunde) entschieden, der im VC-1-Codec auf einer Blu-ray vorliegt. Wir messen sekündlich die CPU-Auslastung ab dem dritten Kapitel des Films und bilden jede fünfte Sekunde in einem Verlaufsdiagramm ab. Als Vertreter der H.264-Fraktion muss der Actionfilm „X-Men 3“ herhalten (1080p, 24 Bilder pro Sekunde). Für die Messungen haben wir die CPU auf 2,4 GHz heruntergetaktet sowie nur einen einzelnen CPU-Kern aktiv gelassen.
H.264-Wiedergabe
Angaben in Prozent
|
Auch wenn es am Unified Video Decoder des RV770 einige Veränderungen gegeben hat, sollte es in Sachen CPU-Auslastung während der Wiedergabe eines HD-Videos eigentlich keine Unterschiede geben. Beim H.264-Codec können wir dennoch Differenzen messen – und zwar zu Gunsten der alten RV670-GPU. Diese agiert durch die Bank etwas gelassener und erzeugt bessere Messwerte als die Radeon HD 4850. Diese kann sich dennoch, wenn auch nur knapp, vor die GeForce 9800 GTX setzen. Wir können nicht ausschließen (und vermuten es sogar), dass die Unterschiede zwischen dem RV670 und dem RV770 nur durch den Treiber entstehen.
Beim VC-1-Video gibt es zwischen den beiden Generationen dagegen keine oder nur noch minimale Unterschiede. Beide Grafikkarten arbeiten quasi auf ein und demselben Niveau, während die GeForce 9800 GTX weit zurück liegt. Schwierigkeiten während des Abspielens gab es bei keinem der Testprobanden.
VC-1-Wiedergabe
Angaben in Prozent
|
Preis-Leistung-Verhältnis
Neben der Leistung, der Bildqualität und den sonstigen Eigenschaften einer modernen Grafikkarte spielt der Preis für die meisten Käufer eine entscheidende Rolle. Denn was nützt einem die schnellste GPU, wenn sie schlicht unbezahlbar ist? Aus diesem Grund haben wir ein Diagramm mit allen 3D-Beschleunigern aus dem Testparcours zusammengestellt und die günstigsten Preise bei Geizhals [10] heraus gesucht. Dabei wird der Preisindex nicht nur nach dem günstigsten Preis erstellen, die Hardware muss auch erhältlich sein. Wir weisen darauf hin, dass sich der Preis der bevorzugten 3D-Karte täglich ändern kann, weswegen eine dauerhafte Korrektheit nicht garantiert werden kann. (Stand der Preise: 27.6.2008)
Preistabelle
Angaben in Euro
|
Derzeit befinden sich erste Radeon-HD-4850-Exemplare für etwa 150 Euro (lieferbar) im Handel, bereits mit einer Tendenz in Richtung 140 Euro. Die neu auserkorene Konkurrenz aus dem Hause Nvidia wird dagegen für etwa 190 Euro den Besitzer wechseln - so der Hersteller. Die Verfügbarkeit wird wahrscheinlich innerhalb der ersten Juli-Woche gegeben sein.
Im Folgenden wird nun das Preis-Leistung-Verhältnis der im Test vertretenen Karten bestimmt. Dabei wird das Performance-Rating durch den Preis dividiert und mit 1000 Multipliziert. Das Ergebnis repräsentiert die Leistung, die man kaufmännisch gerundet für einen Euro erhält. Das Preis-Leistung-Verhältnis wurde für verschiedene Auflösungen und Qualitätseinstellungen ermittelt.
Preis/Leistung 1600x1200 4xAA/16xAF
Angaben in Prozent
|
Preis/Leistung 1280x1024
Angaben in Prozent
|
Preis/Leistung 1280x1024 4xAA/16xAF
Angaben in Prozent
|
Preis/Leistung 1280x1024 8xAA/16xAF
Angaben in Prozent
|
Preis/Leistung 1600x1200
Angaben in Prozent
|
Preis/Leistung 1600x1200 8xAA/16xAF
Angaben in Prozent
|
Preis/Leistung 2560x1600
Angaben in Prozent
|
Preis/Leistung 2560x1600 4xAA/16xAF
Angaben in Prozent
|
Preis/Leistung 2560x1600 8xAA/16xAF
Angaben in Prozent
|
Radeon HD 4870 Vorschau
Manchmal kann es ganz schön eng werden. Wie in diesem Fall mit unserem frühen Sample der Radeon HD 4870 von PowerColor, das uns noch nicht einmal 24 Stunden vor der Vorstellung erreichte. Wir bitten deswegen um Verständnis, dass wir unseren umfangreichen Benchmarkparcours noch nicht mit dem neuen ATi-Flaggschiff durchführen konnten. Stattdessen wird die Radeon HD 4870 demnächst einen eigenen Artikel bekommen, in dem der 3D-Beschleuniger zeigen muss, ob sich der Aufpreis zur Radeon HD 4850 lohnen wird. Bis dahin möchten wir unseren Lesern erste unkommentierte Benchmarks der PowerColor-Karte anbieten.
ATi Radeon HD 4870
Angaben in Bildern pro Sekunde (FPS)
|
Beurteilung
Schon am vergangenen Donnerstag durften wir unseren Lesern erste Benchmarks der Radeon HD 4850 zur Verfügung stellen [11] und die Grafikkarte konnte in der Disziplin Leistung in allen Situationen überzeugen. Heute nun ist die Sperrfrist für die Radeon-HD-4800-Serie vollends abgelaufen und an unserem Ersteindruck hat sich nichts geändert. Die Radeon HD 4850 ist eine sehr gute Grafikkarte, die dank des niedrigen Preises zu einem neuen Preis-Leistung-Champion werden könnte – daran ändert auch die GeForce 9800 GTX+ kaum etwas.
Ohne Anti-Aliasing sowie die anisotrope Filterung befindet sich die ATi Radeon HD 4850 auf Augenhöhe mit der GeForce 9800 GTX. Zwar muss man sich gegen die GeForce 9800 GTX+ mit einer Differenz von 13 Prozent geschlagen geben, jedoch spielt die Grafikkarte mit den angesetzten 190 Euro voraussichtlich auch in einer leicht höheren Preisklasse. In 1600x1200 ändert sich an der Situation nicht viel und auch in 2560x1600 scheint das Bild bekannt. Die Unterschiede variieren hier lediglich zwischen einem und zwei Prozent.
Anders sieht es dagegen nach dem Hinzuschalten der qualitätssteigernden Features aus. Während sich die Radeon-HD-3000-Karten in diesem Fall immer gegen die GeForce-Karten haben geschlagen geben müssen, dreht die Radeon HD 4850 je nach Einstellung die Situation gar um!
In 1280x1024 agiert die neue ATi-Karte noch gleich schnell wie die GeForce 9800 GTX, der Rückstand zur GeForce 9800 GTX+ schrumpft aber auf zehn Prozent. In 1600x1200 kommen dann so langsam die Stärken der RV770-Architektur ans Tageslicht. Die Radeon HD 4850 kann sich um fünf Prozent von der GeForce 9800 GTX absetzen und kommt auf bis zu fünf Prozent an die neue GeForce 9800 GTX+ heran. In 2560x1600 lässt die Radeon HD 4850 die Konkurrenz dann erstmals alt aussehen. Der 3D-Beschleuniger verrichtet um 26 Prozent schneller seine Arbeit als die GeForce 9800 GTX und selbst die teurere GeForce 9800 GTX+ hat mit einem Rückstand von 16 Prozent keine Chance.
Acht-faches Anti-Aliasing ist bereits bei den RV670-Karten eine Spezialität, die der RV770 weiter verfeinert. Schon in 1280x1024 kann sich die Radeon HD 4850 um 17 Prozent von der GeForce 9800 GTX absetzen und hält die GeForce 9800 GTX+ mit einer Differenz von sieben Prozent noch in Schach. In 1600x1200, in vielen Anwendungen durchaus mit einer Radeon HD 4850 noch spielbar, hat der Radeon-HD-4800-Beschleuniger dann seine Sternstunde. 43 Prozent schneller laufen die Spiele im Durchschnitt als mit einer GeForce 9800 GTX+. Der Vorsprung zur GeForce 9800 GTX beträgt satte 70 Prozent.
Noch einige Arbeit muss ATi allerdings in den CrossFire-Modus für die neue Serie im aktuellen Treiber stecken, denn dieser funktioniert mit einer Radeon HD 3870 X2 beziehungsweise einem älteren Treiber in den meisten Fällen noch besser. Mit dem Catalyst 8.6 läuft CrossFire auf der neuen Serie in einigen Spielen gar nicht, obwohl es mit einem älteren Versionen noch der Fall gewesen ist. In manchen Spielen skalieren die Grafikkarten in einigen Qualitätseinstellungen noch nicht richtig und Stalker startet erst gar nicht. Bevor der R700 bestehend aus zwei RV770-GPUs an den Start gehen wird, ist es für ATi auf jeden Fall noch dringend notwendig, CrossFire zu verbessern.
Zu gefallen weiß hingegen das Kühlsystem der Radeon HD 4850 unter Windows. Die Grafikkarte ist selbst im CrossFire-Verbund nicht von den restlichen Komponenten zu unterscheiden. Diesbezüglich hat ATi eine sehr gute Arbeit geleistet. Lauter wird der 3D-Beschleuniger dann unter Last. Der Geräuschpegel ist während des Spielens nicht für jedermann störend, allerdings könnte das Referenzdesign für den einen oder anderen Käufer zu laut sein. Aufgrund der sehr hohen Temperaturwerte unter Last sehen wir keine Möglichkeit, den Lüfter manuell etwas herunter zu regeln.
Etwas Kritik gefallen lassen muss sich ATi bei der Leistungsaufnahme. Nach den sehr guten Ergebnissen der Radeon-HD-3800-Serie kann die Radeon HD 4850 nicht an das Niveau des Vorgängers anknüpfen. Der RV770-Beschleuniger zieht gleich viel Leistung aus der Leitung wie eine GeForce GTX 280, wobei man aber noch nicht ausschließen kann, dass der PowerPlay-Mechanismus mit dem Testtreiber nicht einwandfrei funktioniert hat. Wir werden der Sache aber nachgehen. Unter Last liegt der 3D-Beschleuniger dann gleich auf mit der GeForce 9800 GTX. Aufgrund der Leistungssteigerung ist der Wert akzeptabel.
Fazit
Auch nachdem wir uns nun ein vollständiges Bild der Radeon HD 4850 machen konnten, geht von unserem im Preview-Artikel ausgesprochenen Lob nicht viel verloren. Die Leistungssteigerung gegenüber der Radeon HD 3870 ist durchgängig gut und die Performance damit gleich auf oder sogar höher als bei einer leicht teureren GeForce 9800 GTX. Insbesondere Käufer, die gerne eine hochwertige Kantenglättung verwenden, finden für das angesetzte Geld von 150 Euro derzeit keine bessere Hardware.
Daran ändert auch die GeForce 9800 GTX+ nichts, die zwar selbst für die angesetzten 190 Euro eine gute Grafikkarte ist, bei der Preis-Leistungs-Betrachtung aber nicht an die ATi-Karte heran kommt. Darüber hinaus ist die Karte zurzeit noch nicht im Handel verfügbar, das Duell also eher fiktiv als real.
Abseits der Performance wissen die Lautstärke der Radeon HD 4850 unter Windows sowie die angebotenen Features mit der Direct3D-10.1-API sowie der Unified Video Decoder in der zweiten Version zu gefallen. Leider wird der 3D-Beschleuniger unter Last hörbar lauter, was dem ein oder anderem Kunden sicherlich zu viel werden wird. Punkten kann der 3D-Beschleuniger mit den jetzigen Treibern auch bei der Leistungsaufnahme noch nicht.
Wer eine schnelle Grafikkarte mit modernen Features und einer guten Bildqualität möchte, macht mit der ATi Radeon HD 4850 sicherlich nichts falsch. Für den derzeitigen Preis von 150 Euro bietet der 3D-Beschleuniger ein sehr gutes Preis-Leistung-Verhältnis, das von der Konkurrenz erst einmal geschlagen werden muss. Die ähnlich teure GeForce 9800 GTX ist keine echte Alternative und auch bei der GeForce 9800 GTX+ ist noch fraglich, ob der 3D-Beschleuniger in die entsprechende Preisregion wird vorrücken können.
Ein Fazit zur ATi Radeon HD 4870 wollen wir hingegen erst in einem folgenden Artikel ziehen, der dann den kompletten ComputerBase-Testparcours mit allen Benchmarks und Messungen beinhalten wird.
Verwandte Artikel
- Nvidia GeForce GTX 280 (SLI) [12]
- Nvidia GeForce 9800 GX2 [13]
- Nvidia GeForce 9800 GTX (SLI) [14]
- Nvidia GeForce 9600 GT (SLI) [15]
- Nvidia GeForce 9600 GSO [16]
- Nvidia GeForce 8800 GTS 512 [17]
- Nvidia GeForce 8800 GT [18]
- ATi Radeon HD 3870 X2 [19]
- ATi Radeon HD 3870 [20]
- ATi Radeon HD 3850 [21]
- ATi Radeon HD 3650 [22]
- S3 Chrome 430 GT [23]
- ATi CrossFire X vs. Nvidia Quad-SLI [24]
- Nvidia 3-Way-SLI (Tripple-SLI) [25]
- Wieviel Grafikkartenspeicher muss sein? [26]
- Avivo HD und PureVideo HD im Vergleich [27]



















































































