Nach dem Fehlgriff mit der Radeon-HD-2000-Serie geht es für ATi seit Veröffentlichung der Radeon-HD-3000-Karten endlich wieder aufwärts. Man hat innerhalb der zur Verfügung stehenden Zeit zwar nicht sämtliche Fehler und Schwachstellen der 2000er-GPU-Serie beseitigen, aber wenigstens einige gravierende Nachteile ausbessern können. Und gleichzeitig wurden einige gern gesehene Features wie die Unterstützung der API Direct3D 10.1 sowie der PowerPlay-Stromsparmechanismus hinzugefügt. Gegen Nvidias schnelle Single-GPU-Karten kann man damit zwar weiterhin in Sachen Leistung nicht bestehen, aber dafür bieten sämtliche im Portfolio vorhandenen 3D-Beschleuniger ein gutes Preis-Leistung-Verhältnis.
Dieses war sogar so gut, dass Nvidia gezwungen wurde, auf einen Preiskampf einzugehen und seitdem erleben wir beinahe wöchentlich neue Rekordtiefpreise. So viel Leistung für so wenig Geld gab es selten (oder noch nie) zuvor. Doch auch die Enthusiasten möchte ATi nicht enttäuschen und hat dafür die Multi-GPU-Karte Radeon HD 3870 X2 auf den Markt gebracht, die auf zwei der RV670-GPUs setzt. Die Karte hat durchaus eine hohe Leistung, bringt aber gleichzeitig ein Problem mit sich: Den Preis. So ist die Lücke zwischen der Radeon HD 3870 und der Radeon HD 3870 X2, sowohl was die Leistung als auch was den Preis betrifft, sehr groß.
ATi selbst hat derzeit keine GPU in petto, um diese Lücke zu schließen oder zumindest zu verkleinern. Doch gleichzeitig hat Nvidia genau in der Preisklasse einige sehr interessante Grafikkarten im Angebot, was zumindest dem Boardpartner Asus nicht gefallen zu haben scheint. So hat der bekannte Hersteller mit der Unterstützung von ATi eine weitere Dual-GPU-Karte hergestellt, die die Preis- und Leistungslücke schließen soll. Asus EAH3850 X2 1GB ist der Name des 3D-Beschleunigers, der wie der größere Bruder auf zwei RV670-Chips setzt.
Asus konnte uns freundlicherweise ein frühes Exemplar der EAH3850 X2 1GB für einen Test zur Verfügung stellen. Dabei wird es nicht nur interessant zu sehen sein, wie sich die Grafikkarte zwischen die vorhandenen Modellen platziert, sondern ebenfalls, ob sich die Radeon HD 3850 X2 gegen die Single-GPU-Karten von Nvidia behaupten kann.
| Radeon HD 3870 | Radeon HD 3870 X2 | Asus Radeon HD 3850 X2 | GeForce 9800 GTX | |
| Logo |
|
|
|
GeForce 9800 GTX
|
| Chip | RV670 | R680 (2x RV670) | R680 (2x RV670) | G92 |
| Transistoren | ca. 666 Mio. | ca. 2x 666 Mio. | a. 2x 666 Mio. | ca. 754 Mio. |
| Fertigung | 55 nm | 55 nm | 55 nm | 65 nm |
| Chiptakt | 775MHz | 825 MHz | 668 MHz | 675 MHz |
| Shadertakt | 775MHz | 828 MHz | 668 MHz | 1675 MHz |
| Shader-Einheiten (MADD) | 64 (5D) | 2x 64 (5D) | 2x 64 (5D) | 128 (1D) |
| FLOPs (MADD/ADD) | 496 GFLOPs | 2x 528 GFLOPs | 2x 428 GFLOP/s | 643 GFLOPs* |
| ROPs | 16 | 2x 16 | 2x 16 | 16 |
| Pixelfüllrate | 12400 MPix/s | 2x 13200 MPix/s | 2x 10688 MPix/s | 10800 MPix/s |
| TMUs | 16 | 2x 16 | 2x 16 | 64 |
| TAUs | 32 | 2x 32 | 2x 32 | 64 |
| Texelfüllrate | 12400 MTex/s | 2x 12400 MTex/s | 2x 10688 MTex/s | 43200 MTex/s |
| Shader-Model | SM 4.1 | SM 4.1 | SM 4.1 | SM 4 |
| Hybrid-CF/-SLI | X | X | X | √ |
| effektive Windows Stromsparfunktion | √ | √ | √ | X |
| Speichermenge | 512 GDDR4 | 2x 512 GDDR3 | 2x 512 GDDR3 | 512 GDDR3 |
| Speichertakt | 1125 MHz | 900 MHz | 828 MHz | 1100 MHz |
| Speicherinterface | 256 Bit | 2x 256 Bit | 2x 256 Bit | 256 Bit |
| Speicherbandbreite | 72000 MB/s | 2x 57600 MB/s | 2x 52992 MB/s | 70400 MB/s |
Die Asus Radeon HD 3850 X2 basiert auf zwei vollwertigen RV670-GPUs, die im 55-nm-Prozess bei TSMC gefertigt werden. Pro GPU stehen jeweils 64 5D-Vektorshadereinheiten zur Verfügung, die sich im Verhältnis 1:1:1:1:1 aufsplitten können (wobei sie sich dann wie Skalarshader verhalten), jedoch müssen die Operationen dafür vollkommen unabhängig voneinander sein. Sind sie hingegen voneinander abhängig, warten einige ALUs auf die Ergebnisse der anderen und stehen still. Der Thread-Scheduler versucht dies zu verhindern und die ALUs mit anderweitigen Aufgaben zu belegen, doch ist dazu eine Menge Treiberoptimierung von Nöten. Jede ALU kann auf einem RV670 eine MADD-Operation (Multiply-ADD) pro Takt durchführen. Darüber hinaus setzt die Asus Radeon HD 3850 X2 auf zwei mal 16 Textureinheiten, die pro Takt jeweils 16 Pixel texturieren und 32 Pixel adressieren können.
Die Anzahl der ROPs liegt ebenfalls bei 16 pro Chip. Pro Takt können 32 Z-Operationen (Sichtbarkeitsprüfungen von Pixel, die je nach Ergebnis gar nicht erst gerendert werden) ausgeführt werden. Der Chiptakt beträgt auf der Multi-GPU-Karte 668 MHz und entspricht somit den Referenzvorgaben von ATi für eine Radeon HD 3850. Das gleiche gilt für den Speicher, der mit 828 MHz angesprochen wird. Beiden GPUs steht je ein 512 MB großer VRAM zur Verfügung, wobei jeder Rechenkern auf dieselben Daten zugreifen können müssen. Darum kann man nicht von einem 1.024-MB-Speicher sprechen, auch wenn es der Name der Karte genau so sieht. Jeder VRAM wird mittels eines 256 Bit breiten Speicherinterfaces an eine GPU angebunden.
Damit die beiden RV670-Chips im CrossFire-Modus miteinander kommunizieren können, verbaut Asus auf der Radeon HD 3850 X2 einen PCIe-Switch von PLX, der auf den Namen „PEX 8547“ hört. Dieser PCIe-Switch verfügt über insgesamt 48 PCIe-Lanes. 16 Lanes werden für die Ankopplung der Grafikkarte an den PCIe-Slot und jeweils 16 Lanes für die Anbindung der GPUs an den Switch verwendet. Jede einzelne GPU kann also auf die maximale Bandbreite des PCIe-Bus' zurückgreifen, ohne durch eine Auftrennung in zwei Mal acht Leiterbahnen ausgebremst zu werden. Da der PEX 8547 ein PCIe-1.1-Switch ist, ist die Radeon HD 3850 X2 allerdings nur zum älteren PCIe-1.1-Standard kompatibel, obwohl die RV670-Chips durchaus PCIe 2.0 unterstützen. Der Switch ist derselbe wie auf einer Radeon HD 3870 X2.
Wer mehr über die Realisierung einer Multi-GPU-Karte auf Basis von ATis CrossFire-Technologie erfahren möchte, dem empfehlen wir unser Launch-Review zur Radeon HD 3870 X2 [1].
*Die von uns angegebenen GFLOP-Zahlen der G80-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.
Mit der eigens kreierten Radeon HD 3850 X2 möchte Asus die Preis- und Leistungslücke zwischen der Radeon HD 3870 und der Radeon HD 3870 X2 schließen. Nicht genug, dass diese allein schon gerade zu riesig ist. Darüber hinaus hat Nvidia in dem Preissegment einige interessante Karten im Angebot, gegen die es eben keinen Gegenspieler von ATi gibt. Wann genau und für welchen Preis die Grafikkarte im Handel erscheinen wird, konnte uns Asus jedoch noch nicht mitteilen. Eine reine Machbarkeitsstudie, ähnlich wie anno dazumal die Radeon HD 2600 XT Dual von Sapphire [2], soll der 3D-Beschleuniger aber nicht sein. Er soll auf den Markt kommen, versprach uns der Hersteller.
Das PCB der Radeon HD 3850 X2, die den etwas kryptischen Namen „EAH3850 X2 1GB“ trägt, kommt ATi-typisch in roter Farbe daher und misst eine Gesamtlänge von 28 cm. Damit ist die Grafikkarte gleich lang wie die schnellsten Modelle der beiden großen Chiphersteller und sollte in fast alle im Handel erhältlichen Gehäuse ohne größere Schwierigkeiten eingebaut werden können. Aufpassen muss man aufgrund der Länge allerdings bei den Festplattenkäfigen, da es sein kann, dass diese etwas unglücklich platziert sind und der SATA-Stecker mit dem Ende der Platine kollidiert.
Die Platine hat nichts mit der Ausführung auf der schnelleren Radeon HD 3870 X2 gemeinsam, sondern wurde von Asus völlig neu entworfen. Das gesamte PCB ist sowohl auf der Vorder- als auch auf der Rückseite mit diversen Bauteilen bestückt, Freiräume gibt es kaum. Auch auf der Radeon HD 3850 X2 werden zwei Stromanschlüsse benötigt, ein Sechs-Pin- und einen Acht-Pin-Anschluss. Letzterer ist aber nur optional für das Übertakten im Treibermenü (Overdrive) notwendig, alternativ reicht ein Sechs-Pin-Exemplar aus. Ein CrossFire-Anschluss ist vorhanden, durch den man eine weitere Radeon HD 3850 X2 (oder eine andere ATi-Grafikkarte der Radeon-HD-3800-Serie) parallel zur Dual-Karte betreiben kann.
Asus verbaut auf der Multi-GPU-Karte ein großes Dual-Slot-Kühlsystem, das die gesamte Vorderseite belegt. Es besteht aus zwei Kupferkühlplatten, die die beiden RV670-GPUs und die Spannungswandler bedecken. Zwei Heatpipes pro Rechenkern sind mit einer Kühleinheit bestehend aus mehreren Aluminiumlamellen verbunden. Auf den Lamellen sind zwei flache, 70 mm messende Axiallüfter montiert, die bei uns im Betrieb allerdings nicht im Ansatz überzeugen konnten (mehr dazu im Abschnitt Lautstärke). Interessanterweise verzichtet Asus bei der Radeon HD 3850 X2 auf eine Kühlung des PCIe-Switch, durch den die beiden GPUs miteinander kommunizieren können. Auf dem Referenzdesign der Radeon HD 3870 X2 wurde der Switch von einem Kühlkörper auf niedrigeren Temperaturen gehalten.
Ein Großteil des Kühlsystems wird durch eine schwarze Ummantelung verdeckt, die aber wahrscheinlich mehr für die Optik als zur Effizienzverbesserung gedacht ist. Die beiden Lüfter saugen die kühle Luft aus dem Gehäuse an, pusten diese über die Alulamellen, die somit an Temperatur verlieren, und anschließend wird die erhitze Luft – im wahrsten Sinne des Wortes – in alle Richtungen verstreut. Eine einheitliche Richtung gibt es nicht, da die Luft nicht nur durch die Öffnungen aus dem Slotblech, sondern ebenso wieder ins Gehäuse entweichen kann.
Der insgesamt 1.024 MB große GDDR3-Speicher (jede GPU kann auf 512 MB zugreifen) wird von Qimonda mit einer Zugriffszeit von einer Nanosekunde hergestellt. Es gibt also rein von den Chips her noch ein großes Taktpotenzial, da das theoretische Maximum erst bei 1.000 MHz erreicht ist. Dank der PowerPlay-Funktion takten sich die GPUs der Asus Radeon HD 3850 X2 unter Windows auf 300 MHz herunter, der Speicher arbeitet aber weiterhin unverändert mit 828 MHz. Auf dem Slotblech montiert der Hersteller die üblichen zwei Dual-Link-DVI-Ausgänge, die auf der R680-Karte auch bei einer Dual-Link-Auflösung wie 2560x1600 den HDCP-Kopierschutz anwenden können. Zudem steht ein HDTV-Ausgang zur Verfügung.
Die Kabelausstattung ist Asus auf der Radeon HD 3850 X2 gut gelungen. Mit einem Sechs-Pin-Stromadapter, einer S-Video-auf-YUV-Kabelpeitsche, einem DVI-auf-D-SUB-, einem DVI-auf-HDMI-Adapter sowie einer CrossFire-Bridge werden eigentlich alle nötigen Kabel mitgeliefert. Durch den HDMI-Adapter ist es möglich ist, Video- und Audio-Signale über den DVI-Ausgang wiederzugeben. Dabei ist der Adapter mit dem HDMI-1.2-Standard kompatibel, womit eine Dolby-Digital- sowie DTS-Tonspur von einer DVD, Blu-ray oder HD-DVD ausgegeben werden können. Die neuen Tonformate Dolby Digital Plus, Dolby TrueHD sowie DTS-HD bleiben jedoch außen vor.
Das Softwarepaket ist dagegen nur bedingt als solches zu bezeichnen. Mehr als eine Treiber-CD sowie einen Datenträger mit den Asus-eigenen Tools gibt es nicht. Als Ausgleich dafür ist die von Asus bekannte CD-Mappe vorhanden.
Testsystem:
Folgende Benchmarks kamen während unseres Tests zum Einsatz:
Alle Benchmarks werden mit maximalen Details ausgeführt, damit die Grafikkarte möglichst hoch belastet wird. Als Einstellungen haben wir uns dabei für 1280x1024 und 1600x1200 (sowie 2560x1600 bei Grafikkarten mit 512 MB oder mehr und einer entsprechenden Leistung) entschieden. Damit zollen wir den modernen High-End-Beschleuniger Tribut, die durch ihre Rechenkraft niedrigere Auflösungen als 1280x1024 CPU-limitiert werden lassen. Neben den reinen Auflösungen lassen wir den Benchmarkparcours auch mit 4-fachem (und falls möglich acht-fachem) Anti-Aliasing sowie 16-fachen anisotropen Filter durchlaufen. TSSAA (Nvidia) oder AAA (ATi) zur Glättung von Alpha-Test-Texturen nutzen wir aufgrund von Kompatibilitätsproblemen nicht mehr in unserem Benchmarkparcours.
Nach sorgfältiger Überlegung und mehrfacher Analyse selbst aufgenommener Spielesequenzen sind wir zu dem Schluss gekommen, dass die Qualität der Texturfilterung auf aktuellen ATi- und Nvidia-Grafikkarten in der Standard-Einstellung in etwa vergleichbar sind (mit leichten Vorteilen für die GeForce-Produkte). Bei Nvidia verändern wir somit keinerlei Einstellungen und im ATi-Treiber belassen wir die A.I.-Funktion auf „Standard“.
Treibereinstellungen: Nvidia-Grafikkarten (G8x, G9x)
Treibereinstellungen: ATi-Grafikkarten (R(V)6x0)
Fillrate Tester
Fablemark
Fablemark – 1920x1200
Angaben in Bildern pro Sekunde (FPS)
|
ShaderMark
D3DRighmark Beta 4 und D3D10-Version
Die allseits bekannte Benchmarkserie von Futuremark ist mittlerweile in der Version 2006 erschienen und hört dementsprechend auf die Bezeichnung „3DMark06“. Von den sechs Testszenen messen vier Sequenzen die Performance der Grafikkarte und zeigen eine Grafikpracht, die ihres gleichen sucht. Um jene zu erreichen setzen die Finnen auf modernste 3D-Technologie, weswegen nicht nur massiv das Shader-Model 3.0 verwendet wird, auch extrem aufwendige Texturen, spektakuläre Partikeleffekte, komplexe Schattenberechnungen und als weiteres Highlight „High Dynamic Range Rendering“ – kurz HDRR – werden eingesetzt. Dabei setzt Futuremark auf FP16-HDR, das die derzeit Best mögliche Bildqualität liefert, aber auch aufwendig zu berechnen ist. Weitere Details zu diesem Programm gibt es in einem unserer ausführlichen Artikel. [9]
3DMark 06 – 1280x1024
Angaben in Punkten
|
3DMark06 – 1600x1200
Angaben in Punkten
|
3DMark06 – 2560x1600
|