Einleitung
In gewisser Hinsicht, und das mag seltsam klingen, ähneln Grafikkarten Autos. Denn wer schaut sich nicht gerne jene Fahrzeuge an, die preislich viel zu weit weg für das eigene Budget liegen, einen aber dennoch in den Bann ziehen und mit denen man gerne einige Runden drehen würde? Ähnlich schaut es bei Grafikkarten aus, denn eine GeForce 8800 Ultra ist sicherlich von der Leistung her für die meisten Spieler interessant, aber längst nicht alle haben solch ein Kaliber im eigenen Rechner verbaut. Dennoch ist das so genannte „Enthusiasten-Segment“, das bereit ist für eine hohe Leistung viel Geld auszugeben, bei Grafikkarten dann doch wiederum eindeutig größer als bei Automobilen, stellt eine Nvidia GeForce 8800 Ultra doch eine wesentlich geringere Hürde dar (im Gegensatz zu den Luxusautos sind schnelle 3D-Beschleuniger für mehr Kunden sicherlich des Öfteren bezahlbar).
Wenn es noch etwas mehr Leistung sein darf, greift man am besten gleich zu zwei Modellen, denn im SLI-Modus bieten zwei Grafikkarten eine spürbar bessere Leistung als eine einzige. Bis vor kurzem war, falls dies immer noch nicht die gewünschte Leistung erbrachte, dann aber Schicht im Schacht. Die einzige Möglichkeit, die einem blieb, war neben einem Übertaktungsversuch das Warten auf die nächste Grafikkartengeneration beziehungsweise ein Refresh-Produkt.
Einige Leser mögen sich jetzt sicherlich fragen, wer überhaupt solch eine brachiale Rechenleistung benötigt? Worin besteht seine Daseinsberechtigung? Doch wer einen 30-Zoll-TFT mit einer dazugehörigen Auflösung von 2560x1600 Pixeln besitzt und nicht auf Kantenglättung (die trotz gegenläufiger Meinungen auch in dieser Auflösung noch von Nöten ist) verzichten möchte, wird selbst mit zwei GeForce-8800-Ultra-Karten längst nicht immer glücklich. Schon gar nicht in allen modernen Direct3D-10-Spielen. Irgendwo im Niemandsland zwischen eine Grafikkarte reicht und zwei Grafikkarten reichen nicht mehr gibt es also durchaus genug Einsatzzwecke für SLI bzw. CrossFire.
Für alle, denen selbst die von zwei High-End-Beschleunigern gesteckten Grenzen noch zu eng sind, hat Nvidia mittlerweile reagiert und für diese Zielgruppe eine Alternative im Produktportfolio, die wir heute genauer betrachten wollen: „3-Way-SLI“. Wie man anhand des Namens schon vermuten kann, nutzt 3-Way-SLI nicht nur zwei 3D-Beschleuniger wie ein herkömmliches SLI-System, sondern derer drei. Die erste Einschränkung der Technik folgt allerdings auf dem Fuß, denn 3-Way-SLI ist derzeit nur mit zwei Nvidia-Grafikkarten-Modellen möglich: der GeForce 8800 GTX sowie der GeForce 8800 Ultra. Allen andern Varianten fehlt der zweite für 3-Way-SLI benötige SLI-Anschluss.
Nachdem mit Quad-SLI ein kleiner Abstecher mit vier GPUs [1], der zu viele Einschränkungen und Probleme auf sich vereinte, von den Kaliforniern schnell wieder beendet worden ist, scheint man mit 3-Way-SLI nun durchaus eine bessere Technik realisiert zu haben. Denn die Kompatibilität hat Nvidia deutlich verbessern können.
Da man einzig und allein mit einer starken Grafikleistung nichts anrichten kann, müssen die restlichen Komponenten natürlich demselben hohen Leistungsniveau entsprechen. Aus diesem Grund testen wir 3-Way-SLI in einem speziell zusammengestellten Komplettsystem von Atelco, das es wahrlich in sich hat. Neben Intels neuer Quad-Core-CPU auf Penryn-Basis (Codename Yorkfield) ist ein Mainboard mit dem neuen nForce-780i-Chipsatz von Nvidia das Highlight des Rechners. Dabei achten wir nicht nur auf die Performance des Rechners, sondern ebenfalls auf die Kompatibilität von 3-Way-SLI und untersuchen zusätzlich ein generelles Multi-GPU-Problem. Dieses betrifft dementsprechend nicht nur Nvidias SLI-Technologie, sondern ebenso ATis CrossFire-Pendant.
Lesezeichen
- Nvidia GeForce 8800 Ultra [2]
- Nvidia GeForce 8800 GTX SLI [3]
- Nvidia GeForce 8800 GTX [4]
- Nvidia GeForce 8800 GTS 512 [5]
- Nvidia GeForce 8800 GT [6]
- Nvidia GeForce 8800 GTS (SLI) [7]
- Nvidia GeForce 8800 GTS 320 [8]
- Nvidia GeForce 8600 GTS (SLI) und 8600 GT [9]
- ATi Radeon HD 3870 [10]
- ATi Radeon HD 3850 [11]
- ATi Radeon HD 2900 XT CrossFire [12]
- ATi Radeon HD 2900 XT [13]
- Sapphire Radeon HD 2600 XT X2 [14]
- ATi Radeon HD 2400 XT und HD 2600 XT [15]
- Avivo HD und PureVideo HD im Vergleich [16]
Die Technik hinter 3-Way-SLI
Erinnert sich noch jemand an Quad-SLI, Nvidias ersten Versuch im Jahr 2006, mehr als zwei Grafikkerne in einem SLI-Verbund zu vereinen? Möglich wurde dies durch die Nutzung zweier GeForce-7950-GX2-Karten (ComputerBase-Test [17]), die wiederum mit zwei G71-Chips von Nvidia bestückt waren. Theoretisch hörte sich die vierfache GPU-Leistung beeindruckend an, jedoch war Quad-SLI mit einigen extrem großen Nachteile ins Leben gerufen worden, die in der Summe dermaßen gewaltig waren, dass sich die Technik für mehr oder weniger kein Spiel eignete. So konnte man beispielsweise nur unter OpenGL die maximale Leistung der vier GPUs abfragen, unter Direct3D durfte man schon froh sein, wenn man die Leistung wenigstens ein klein Wenig über das Niveau einer einzelnen GeForce 7950 GX2 heben konnte.
Der Grund war damals wie heute in der Direct3D-API (Version 9) selber zu suchen: So erlaubt die Direct3D-9-Spezifikation Befehle für maximal drei Bilder im Voraus (bevor diese auf dem Monitor angezeigt werden) anzunehmen, die dann an die Grafikkarten weitergegeben werden können. Um im effektiven AFR-Modus (Alternate Frame Rendering) arbeiten zu können, sind bei Quad-SLI aber die Befehle für vier Bilder notwendig, um alle GPUs mit Daten versorgen zu können. Da dies nicht möglich war, blieb Nvidia einzig 4-Way-SFR (Split Frame Rendering) oder ein Mischmodus namens AFR of SFR übrig, die beide aber mehr schlecht als recht funktionierten. (Als kleine Anmerkung nebenbei: Direct3D 10 erlaubt Renderbefehle für mehr als drei Bilder im Voraus anzunehmen. Dadurch wäre unter Direct3D 10 4-Way-AFR ohne größere Probleme möglich.) Darüber hinaus waren Karten vom Typ GeForce 7950 GX2 gegenüber ihren Chip-Kollegen deutlich niedriger getaktet, was Quad-SLI weiter an Potential nahm.
3-Way-SLI erlaubt nun maximal drei Grafikkarten, gleichzeitig Rechenarbeit zu übernehmen, womit man das Direct3D-9-Problem geschickt umgeht. Somit ist 3-Way-AFR zumindest theoretisch ohne Schwierigkeiten möglich, da man mehr als die Renderbefehle für drei Bilder gleichzeitig nicht braucht. Doch ganz so einfach war die Realisierung von 3-Way-SLI laut Nvidia dennoch nicht, da die SLI-Profile für drei Grafikkarten wohl nicht so einfach zu erstellen sind und viel Feinarbeit benötigen. Sind die Profile erstellt, nutzt 3-Way-SLI übrigens durchgängig den 3-Way-AFR-Modus.
3-Way-AFR unterscheidet sich quasi nicht vom herkömmlichen Alternate Frame Rendering, außer dass eine dritte Grafikkarte mit einbezogen wird. Jede der drei GPUs rendert an einem eigenen Frame, ohne das Frame der anderen Grafikkarten zu benutzen. Durch 3-Way-AFR ist eine theoretische Leistungssteigerung von 100 Prozent pro Karte möglich, da prinzipiell sämtliche Bildinhalte (inklusive Geometrie) beschleunigt werden können. In der Praxis wird ein solcher Wert aber quasi nie erreicht. Insgesamt bieten drei GeForce-8800-Ultra-Grafikkarten eine Shaderleistung von (je nach Zählweise) realistischen 1161 GFLOPs bis schier wahnsinnigen 1743 GFLOPs und eine Texelfüllrate von 117504 MTex pro Sekunde. Mit einer einzelnen GPU werden wir solche Werte wohl noch für längere Zeit nicht erreichen.
Bei 3-Way-AFR kann man theoretisch auch die verfügbare Speicherbandbreite verdreifachen, da jeder Chip von seinem eigenen Speicher gefüttert wird. Hier gelten allerdings ebenfalls einige Ausnahmen, weswegen die Skalierung selbst keine theoretischen 100 Prozent erreicht. In noch viel größerem Ausmaß betrifft das den VRAM der Grafikkarten. Auch wenn viele Marketingabteilungen bei drei vollwertigen G80-Grafikkarten sicherlich gerne von einem 2,3 Gigabyte großen Speicher reden, mehr nutzen als effektiv 768 MB, die maximale Größe eines einzelnen 3D-Beschleunigers, kann man zu keiner Zeit. Der Grund ist in der aktuellen Multi-GPU-Technik zu suchen, bei der jede GPU auf dieselben Daten zugreifen können muss. Hier sehen wir für SLI sowie CrossFire in Zukunft den wichtigsten Optimierungspunkt, da man ansonsten den Speicher auf jeder Grafikkarte sehr groß halten muss.
Für 3-Way-SLI ist im Gegensatz zum herkömmlichen SLI nicht mehr nur ein SLI-Kontakt auf den Grafikkarten nötig, sondern deren zwei. Nun ergeben auch endlich die zwei SLI-Kontakte auf der GeForce 8800 GTX und der GeForce 8800 Ultra einen Sinn, während man vorher nur vermuten konnte, wozu der zweite Kontakt gebraucht werden könnte. Dies lässt aber gleichzeitig auch nur die beiden genannten Grafikkarten für 3-Way-SLI zu. Alle anderen Modelle (inklusive der neuen Modelle GeForce 8800 GT und GeForce 8800 GTS 512) sind also nicht zu 3-Way-SLI kompatibel. Der Grund dafür, dass zwei Brücken zum Einsatz kommen müssen, ist laut Nvidia in dem höheren Kommunikationsaufwand bei 3-Way-SLI zu suchen. Dieser wird bei drei Grafikkarten größtenteils über die neue Bridge geführt. Die Kommunikation über den PCIe-Bus soll nicht allzu hoch ausfallen, weswegen es selbst bei nur acht PCIe-Lanes zu keinem allzu großen Performanceverlust kommen sollte. Eine Begründung dafür, warum man aber nicht auch kleineren Karten zwei Anschlüsse spendiert hat, liefert diese Erklärung selbstverständlich nicht.
Für 3-Way-SLI hat Nvidia eine neue SLI-Bridge entwickelt, auf der gleich sechs SLI-Stecker montiert sind. Sie ist intern so geschaltet, dass alle Grafikkarten untereinander Kontakt aufnehmen können. Falls man die neue Bridge nicht besitzt und diese auch nicht kaufen möchte (alternativ liegt die Bridge jedem nForce-780i/a-Mainboard bei), kann man die Verschaltung auch mit drei einzelnen, flexiblen Brücken erledigen. Dazu muss man die Karten so verbinden, dass alle möglichen Kommunikationswege abgedeckt sind (1+2, 2+3, 1+3).
Die neue SLI-Technik setzt als Mainboard entweder ein nForce-680i- oder ein nForce-780i-Mainboard voraus. Falls eine AMD-CPU verwendet werden soll, muss man zu einer nForce-780a-Platine von Nvidia greifen. Eine der größten Einschränkungen von 3-Way-SLI stellt indes zugleich auch eine der am wenigsten nachvollziehbaren dar: 3-Way-SLI funktioniert nur unter Windows Vista und eine Windows-XP-Implementierung ist auch nicht geplant.
Testrechner von Atelco
Selbst drei Grafikkarten vom Typ einer GeForce 8800 GTX oder GeForce 8800 Ultra nutzen einem nichts, wenn der restliche Rechner nicht auf die Grafikleistung angepasst ist. Wenn die CPU limitiert, was bei 3-Way-SLI in niedrigeren Auflösungen mit niedrigeren Qualitätseinstellungen schnell der Fall sein kann, können die drei Grafikkarten nicht ihre volle Leistung entfalten. Um dem zu entgehen, stecken im Atelco-PC Komponenten, die es in sich haben und zeigen, was mit der aktuellen Technik alles möglich ist.
Als Grundgerüst nutzt Atelco das bekannte Stacker-Gehäuse von Coolermaster in der Nvidia-Edition. Für genügend Platz für Bastelarbeiten und eine ausreichende Kühlung (1x 120 mm vorne, 1x 120 mm hinten, 2x 120 mm ab der Seite) ist also gesorgt.
Das Herzstück bilden die drei Nvidia-Grafikkarten vom Typ GeForce 8800 Ultra. Sie stammen von XFX und werden mit den Referenztaktraten (612/1512/1080 MHz) gefahren. Als CPU verwendet Atelco einen Intel Core 2 Extreme QX9650 auf Basis der neuen Penryn-Architektur. Die Quad-Core-CPU arbeitet mit einer Frequenz von 3 GHz, wobei wir sie für die Geschwindigkeitsmessungen auf 3,67 GHz übertaktet haben, indem der Multiplikator von neun auf elf angehoben wurde. Die nächsthöhere Stufe war leider selbst mit einer Spannung von 1,55 Volt nicht mehr stabil möglich.
Verbaut wird die komplette Hardware auf einem Referenzmainboard (wahrscheinlich ebenfalls von XFX) mit dem neuen nForce-780i-Chipsatz von Nvidia. Damit werden sämtliche drei Grafikkarten mit vollen 16 PCIe-Lanes angesteuert. Als Speicher kommen zwei jeweils ein Gigabyte große DDR2-Riegel von Cellshock zum Einsatz, die mit 1000 MHz sowie den Timings von 4-4-4-4 betrieben werden. Als Kritikpunkt kann man an dieser Stelle, vor allem aufgrund der niedrigen Preise, die Größe des Speichers ansehen. Die Aufstockung auf vier Gigabyte wäre nicht wirklich teuer, aber gut für die Zukunft gewesen. Dann hätte man aber logischerweise auf die 64-Bit-Version von Windows Vista umsteigen müssen.
Als Massenspeicher setzt der Versandhandel auf drei Raptor-Festplatten von Western Digital mit einer Kapazität von 150 Gigabyte pro Stück. Die Platten agieren mit flotten 10.000 Umdrehungen pro Minute, weshalb sie aus dem PC gut heraus zu hören sind. Die drei HDDs sind im RAID5-Verbund konfiguriert, womit die maximale Festplattengröße 280 Gigabyte beträgt. Die Performance ist spürbar besser als die einer herkömmlich Konfiguration von Einzelplatten. Neben einem DVD-Brenner von LG ist in dem Computer auch das Combo-Laufwerk „GDRH20N“ (ebenfalls von LG) verbaut, das nicht nur Blu-ray-Discs, sondern auch HD DVDs wiedergeben kann.
Testsystem
Testsystem:
- Prozessor
- Intel Core 2 Extreme QX9650 (übertaktet auf 3,67 GHz, Quad-Core)
- Motherboard
- XFX nForce 780i (Nvidia nForce 780i)
- Arbeitsspeicher
- 2 x 1024 MB Cellshock PC2-8000U CL4-4-4-12 (DDR2-1000)
- Grafikkarten
- 3 x XFX GeForce 8800 Ultra (612/1512/1080), 768 MB
- Peripherie
- LG GSA-H66N DVD-ROM SATA
- LG GDRH20N SATA (Blu-ray/HD DVD)
- 3x Western Digital Raptor 150 GB SATA, RAID5
- Treiberversionen
- Nvidia ForceWare 169.25
- Software
- Microsoft Windows Vista x86 Build 6000
- Microsoft DirectX 9.0c
- Microsoft Direct3D 10
Benchmarks
Folgende Benchmarks kamen während unseres Tests zum Einsatz:
- Synthetische Benchmarks:
- 3DMark06 Version 1.0.2
- Spielebenchmarks:
- Anno 1701 Demo
- Bioshock D3D10
- Call of Juarez D3D10
- Clive Barker's Jericho
- Colin Mcrae Dirt Demo
- Company of Heroes D3D10
- Crysis
- F.E.A.R.
- Gothic 3
- Lost Planet D3D10-Demo mit Patch für D3D10-Optimierung
- Oblivion
- Prey
- Rainbow Six Vegas
- Stalker
- Unreal Tournament 3
- World in Conflict D3D10
Alle Benchmarks werden mit maximalen Details ausgeführt, damit die Grafikkarte möglichst hoch belastet wird. Als Einstellungen haben wir uns dabei für 1280x1024 und 1600x1200 (sowie 2560x1600 bei Grafikkarten mit 512 MB oder mehr und einer entsprechenden Leistung) entschieden. Damit zollen wir den modernen High-End-Beschleuniger Tribut, die durch ihre Rechenkraft niedrigere Auflösungen als 1280x1024 CPU-limitiert werden lassen. Neben den reinen Auflösungen lassen wir den Benchmarkparcours auch mit 4-fachem (und falls möglich acht-fachem) Anti-Aliasing sowie 16-fachen anisotropen Filter durchlaufen. TSSAA (Nvidia) oder AAA (ATi) zur Glättung von Alpha-Test-Texturen nutzen wir aufgrund von Kompatibilitätsproblemen nicht mehr in unserem Benchmarkparcours.
Achtung: Moderne SLI- und CrossFire-Systeme bieten dem Kunden eine dermaßen gewaltige Rechenleistung, dass selbst der schnellste Prozessor damit hoffnungslos überfordert ist und demzufolge beinahe alle Spiele CPU-limitiert sind, was bei immer schneller werdenden 3D-Beschleunigern ein großes Problem darstellt. Aus diesem Grund lassen wir Testläufe ohne Anti-Aliasing sowie dem anisotropen Filter komplett weg, da diese Qualitätseinstellung für zwei Grafikkarten keine Herausforderung mehr ist. Somit werden die Tests ausschließlich mit 4xAA (beziehungsweise 8xAA) sowie 16xAF in 1280x1024, 1600x1200 und 2560x1600 durchgeführt.
Nach sorgfältiger Überlegung und mehrfacher Analyse selbst aufgenommener Spielesequenzen sind wir zu dem Schluss gekommen, im ForceWare-Treiber für Nvidia-Karten die Qualitätseinstellungen auf High Quality anzuheben, da man nur mit diesem Setting das Texturflimmern effektiv bekämpfen kann – dies trifft aber nur auf die G7x-Generation zu, die G8x-GPUs werden mit den Standardeinstellungen des Treibers getestet, weil die Bildqualität stark zugenommen hat. Zudem ist dieser Modus vergleichbar mit der Einstellung „Catalyst A.I. Standard“ auf den ATi-Pendants, wodurch bei der Bildqualität größtenteils ein Gleichstand erreicht wird.
Treibereinstellungen: Nvidia-Grafikkarten (G7x)
- Systemleistung: Hohe Qualität
- Vertikale Synchronisierung: Aus
- MipMaps erzwingen: keine
- Trilineare Optimierung: Aus
- Anisotrope Mip-Filter-Optimierung: Aus
- Optimierung des anisotropen Musters: Aus
- Negativer LOD-Bias: Clamp
- Gamma-angepasstes AA: Ein
- AA-Modus: 1xAA, 4xAA
- Transparenz AA: Aus
Treibereinstellungen: Nvidia-Grafikkarten (G8x, G9x)
- Texturfilterung: Qualität
- Vertikale Synchronisierung: Aus
- MipMaps erzwingen: keine
- Trilineare Optimierung: Ein
- Anisotrope Muster-Optimierung: Aus
- Negativer LOD-Bias: Clamp
- Gamma-angepasstes AA: Ein
- AA-Modus: 1xAA, 4xAA, 8xQAA
- Transparenz AA: Aus
Treibereinstellungen: ATi-Grafikkarten (R(V)5x0)
- Catalyst A.I.: Standard
- Mipmap Detail Level: High Quality
- Wait for vertical refresh: Always off
- AA-Modus: 1xAA, 4xAA
- Adaptive Anti-Aliasing: Off
- High Quality AF: Off
Treibereinstellungen: ATi-Grafikkarten (R(V)6x0)
- Catalyst A.I.: Standard
- Mipmap Detail Level: High Quality
- Wait for vertical refresh: Always off
- AA-Modus: 1xAA, 4xAA, 8xAA
- Adaptive Anti-Aliasing: Off
Prozessorskalierung
Ohne einen flotten Prozessor nutzen einem drei Grafikkarten gar nichts, oder doch? Es wäre schön, wenn ja, denn schließlich sind nicht alle Käufer, die bereit sind so viel Geld für drei GeForce-8800-GTX- oder GeForce-8800-Ultra-Grafikkarten auszugeben, auch ebenso gewillt, eine starke (und teure) CPU wie zum Beispiel einen Intel Core 2 Extreme QX9650 anzuschaffen. „In für 3-Way-SLI typischen Auflösungen limitieren meistens sowieso die GPUs,“ ist einer der meistgenutzten Argumente.
Doch stimmt dies wirklich? Wir wollen es anhand einiger Spiele überprüfen und simulieren mit Hilfe des Core 2 Extreme QX9650 höher sowie niedriger getaktete Prozessoren und zusätzlich eine Dual-Core-CPU. Da für viele 3-Way-SLI-Besitzer die Auflösung 2560x1600 kein unüberwindbares Hindernis darstellen sollte, nutzen wir diese inklusive Anti-Aliasing (falls möglich) und der anisotropen Filterung.
CPU-Skalierung 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Wie man an den Diagrammen sehen kann, ist man selbst mit drei GeForce-8800-Ultra-Grafikkarten in 2560x1600 in der Tat zumeist GPU-limitiert - der Prozessor spielt, so er denn eine gewisse „Basisleistung“ mit sich bringt, kaum eine Rolle. Vollkommen unbeeindruckt von der verwendeten CPU zeigt sich World in Conflict, das selbst mit nur zwei aktiven Kernen überhaupt keine Unterschiede zeigt. Ähnliches gilt für Bioshock, auch wenn dort die Geschwindigkeit immerhin um drei Bilder pro Sekunde fällt, wenn man nur zwei Kerne einsetzt. Ebenfalls marginal, aber schon etwas besser, fällt die CPU-Skalierung in Unreal Tournament 3 aus. Dort bringt ein Quad-Core-Prozessor zwar absolut keine Mehrleistung, aber immerhin gibt es kleine Differenzen in den FPS-Werten zwischen den unterschiedlich getakteten Core-2-Prozessoren. Die Differenz zwischen einem Penryn mit 2,66 GHz und 3,67 GHz liegt aber trotzdem nur bei nicht spürbaren drei Prozent.
Eine wichtigere Rolle spielt der Prozessor in Company of Heroes (DX10) sowie dem mittlerweile etwas angestaubten Oblivion, wobei beide Spiel gleich gut skalieren. In Oblivion arbeitet die 2,66-GHz-CPU sechs Prozent langsamer als das 3-GHz-Pendant, während dieses sieben Prozent langsamer seine Arbeit verrichtet als der 3,67-GHz-Kollege. Eine Quad-Core-CPU erbrachte eine Geschwindigkeitssteigerung von fünf Prozent. Ähnliches zeigt sich in Company of Heroes, wobei der Quad-Core-Prozessor kein Prozent schneller rendert als die Dual-Core-Variante. Die 3-GHz-CPU ist drei Prozent schneller als der auf 2,66 GHz heruntergetaktete Core 2 Extreme QX9650, aber gleich 11 Prozent langsamer als das 3,67-GHz-Modell.
Warum die Zunahme von 3,00 auf 3,33 GHz größer ausfällt als die von 2,66 auf 3,00 GHz, obwohl der Taktunterschied genau das Gegenteil suggeriert, können wir uns übrigens nicht erklären. Einzig vorstellen können wir uns, dass Berechnungen bei dem am niedrigsten getakteten Prozessor nicht innerhalb der vorhandenen Taktzyklen fertig werden und diese somit einen kompletten weiteren Zyklus durchlaufen müssen, bis die Berechnungen vollendet sind.
Zwischenfazit: Natürlich spielt gerade bei 3-Way-SLI eine starke CPU eine wichtige Rolle. Vor allem in niedrigeren Auflösungen als 2560x1600, da dort die Grafikkarten weniger Einfluss haben und die CPU-Geschwindigkeit an Wichtigkeit gewinnt. Aber auch bei dieser brachialen Grafikrechenkraft gilt immer noch, dass in Spielen meistens die Grafikkarte limitiert. Dennoch empfehlen wir, bei solch' einem Rechner nicht zu sehr am Prozessor zu sparen. Gerade bei 3-Way-SLI wäre es schade, die gewaltige Grafikkartenleistung aufgrund eines deutlich zu langsamen Prozessors zu vergeuden.
Verlaufsdiagramme
Aktuelle Benchmarks oder das beliebte Tool „Fraps“ zeigen einem normalerweise drei verschiedene Ergebnisse an: Die höchste Anzahl an Bildern pro Sekunde, die niedrigste und einen Durchschnittswert. Wir verwenden generell die Durchschnitts-FPS-Werte, da dies unserer Meinung nach der sinnvollste Messwert ist. Die anderen beiden, vor allem die Minimum-FPS, haben zwar durchaus ihre Vorteile, jedoch ebenso einige gravierende Nachteile. Das Optimum wäre es, den Lesern eine Art „Frameverlauf“ zur Verfügung zu stellen, sprich sämtliche FPS-Werte innerhalb eines gewissen Zeitintervalls in einem Diagramm darzustellen. Allerdings ist damit ein immenser Zeit- und Arbeitsaufwand verbunden, weswegen wir diese Methode nur in wenigen Artikeln verwenden.
In diesem Artikel haben wir die zusätzliche Arbeit auf uns genommen und für fünf Spiele einen Frameverlauf erstellt. Dabei bilden wir in den Diagrammen für ein Zeitintervall von 30 Sekunden für jede Sekunde den aktuellen FPS-Wert ab.
Company of Heroes – FPS
Angaben in Bildern pro Sekunde (FPS)
|
Crysis 1.1 – FPS
Angaben in Bildern pro Sekunde (FPS)
|
F.E.A.R. – FPS
Angaben in Bildern pro Sekunde (FPS)
|
Lost Planet – FPS
Angaben in Bildern pro Sekunde (FPS)
|
Unreal Tournament 3 – FPS
Angaben in Bildern pro Sekunde (FPS)
|
Wie man gut an den Diagrammen erkennen kann, ist die Skalierung von SLI und 3-Way-SLI in den ausgesuchten Spielen durch die Bank weg als gut zu bezeichnen. Allerdings gibt es an wenigen Stellen mit den Multi-GPU-Lösungen auch Schwierigkeiten. So brechen zum Beispiel in Unreal Tournament 3 sowohl SLI als auch 3-Way-SLI für wenige Sekunden stark ein und sind dann gar minimal langsamer als nur eine Grafikkarte. In Crysis und Lost Planet kann sich 3-Way-SLI für wenige Sekunden nicht von SLI absetzen und in F.E.A.R. haben beide Multi-GPU-Lösungen ein kleines Startproblem in den ersten zwei Sekunden. Anschließen skalieren beide Techniken aber wieder normal.
Das Multi-GPU-Problem (Mikroruckler)
Als praktikablen Richtwert für ein flüssiges Spielgeschehen auf dem Monitor kann man zumeist die magische 30-FPS-Marke nehmen; 30 Bilder pro Sekunde sind normalerweise genug, um Spiele für das menschliche Auge als relativ flüssig zu bezeichnen. In letzter Zeit konnte man in einigen Diskussionsforen aber des Öfteren nachlesen, dass Multi-GPU-System, sprich CrossFire und SLI, trotz der Wiedergaberate von 30 Bildern pro Sekunde ein Spiel offensichtlich nicht mehr flüssig darstellen, es mit nur einer Grafikkarte gar besser spielbar sei. Nachdem dieses „Phänomen“ zuerst nur stiefmütterlich betrachtet worden ist, gibt es mittlerweile genügend Beschwerden, um sich ihm genauer anzunehmen.
Soviel vorweg: Ja, an diesen Behauptungen ist etwas dran und die vielerorts als „Mikroruckler“ bezeichneten Unstimmigkeiten gibt es sowohl auf SLI- als auch auf CrossFire-Systemen – und 3-Way-SLI ist ebenfalls betroffen. Dem Problem auf die Schliche zu kommen ist dabei kein leichtes Unterfangen, denn es tritt nicht in jedem Spiel auf. Darüber hinaus muss die Bildwiederholrate bei etwa 30 FPS oder darunter liegen, damit das Problem überhaupt zu einem als unstetig wahrgenommenen Spielablauf führen kann. Schaffen es zwei Grafikkarten weit über diesem Limit zu bleiben, treten die Ruckler nur noch schwer wahrnehmbar und irgendwann gar nicht mehr auf.
Doch worin besteht das Problem genau? Nehmen wir als Beispiel eine Darstellung mit 30 Bildern pro Sekunde (FPS), bei der eine Einzelkarte alle 33 Millisekunden (eine Sekunde geteilt durch 30 Bilder) ein Bild an den Monitor schickt - ganz so wie es sein sollte. Im optimalen Fall wird das erste Frame nach 33 Millisekunden, das zweite Frame nach 66 Millisekunden, das dritte nach 99 Millisekunden und so weiter fertiggestellt. Auf CF- und SLI-Systemen kann es aufgrund des Problems jedoch dazu kommen, dass die Abstände zwischen den einzelnen Bildern stark variieren. Wird der Abstand zu groß, kann das Auge den Unterschied zwischen den beiden Frames wahrnehmen – das Bild ruckelt. Da hilft es auch nicht, dass einige Bilder in extrem verkürzten Abständen zum Monitor wandern. Was zählt, ist die kritische, obere Grenze.
Praktischerweise kann man das Ruckeln nicht nur im Spiel selber feststellen, sondern mit Hilfe des Tools „Fraps“ auch in Zahlen ausdrücken. Denn Fraps gibt einem nicht nur die Möglichkeit, den FPS-Wert pro Sekunde festzuhalten, sondern ermöglicht es auch, die „Frametimes“ aufzuzeichnen. Die Frametimes geben an, wann genau die Grafikkarte ein fertiges Bild an den Bildschirm schickt. Im optimalen Fall müssen zwischen den Frametimes absolut identische Zeitabstände liegen.
Schauen wir uns zuerst die Frametimes mit einer GeForce-8800-Ultra-Karte in einigen aktuellen Spielen etwas genauer an.
- 1, 0.000
- 2, 34.747
- 3, 71.986
- 4, 109.881
- 5, 148.041
- 6, 186.736
- 7, 225.986
- 8, 266.376
- 9, 306.964
- 10, 347.807
- 11, 388.153
- 12, 426.821
- 13, 464.594
- 14, 502.986
- 15, 542.036
- 16, 581.341
- 17, 621.380
- 18, 662.921
- 19, 705.532
- 20, 747.260
- 21, 788.753
- 22, 829.936
- 23, 870.366
- 24, 909.739
- 25, 949.861
- 26, 990.201
- 27, 1029.518
- 28, 1068.456
- 29, 1107.191
- 30, 1146.055
- 1, 0.000
- 2, 31.854
- 3, 67.916
- 4, 103.904
- 5, 140.220
- 6, 176.189
- 7, 212.990
- 8, 248.891
- 9, 285.348
- 10, 321.764
- 11, 358.081
- 12, 394.299
- 13, 432.302
- 14, 467.433
- 15, 504.026
- 16, 540.221
- 17, 576.033
- 18, 613.065
- 19, 649.596
- 20, 686.160
- 21, 722.416
- 22, 758.882
- 23, 795.054
- 24, 831.708
- 25, 868.484
- 26, 904.569
- 27, 941.016
- 28, 977.803
- 29, 1013.691
- 30, 1050.465
- 1, 0.000
- 2, 37.770
- 3, 78.190
- 4, 118.785
- 5, 159.128
- 6, 199.223
- 7, 238.781
- 8, 278.578
- 9, 318.546
- 10, 358.700
- 11, 399.147
- 12, 439.492
- 13, 480.121
- 14, 520.447
- 15, 560.646
- 16, 600.821
- 17, 640.931
- 18, 680.912
- 19, 721.101
- 20, 761.360
- 21, 801.723
- 22, 842.086
- 23, 882.172
- 24, 921.916
- 25, 961.282
- 26, 1000.414
- 27, 1039.679
- 28, 1079.157
- 29, 1118.621
- 30, 1157.779
- 1, 0.000
- 2, 28.680
- 3, 59.544
- 4, 90.339
- 5, 121.362
- 6, 152.125
- 7, 183.069
- 8, 213.924
- 9, 244.947
- 10, 275.690
- 11, 306.658
- 12, 337.419
- 13, 368.225
- 14, 399.140
- 15, 430.032
- 16, 460.890
- 17, 491.732
- 18, 522.644
- 19, 553.411
- 20, 584.288
- 21, 615.031
- 22, 645.895
- 23, 676.676
- 24, 707.570
- 25, 738.421
- 26, 769.328
- 27, 800.227
- 28, 831.019
- 29, 861.831
- 30, 892.693
Wie man gut erkennen kann, sind die Frametimes bei nur einer Grafikkarte gleichmäßig und die Bilder werden in einem etwa gleichen Abstand an den Monitor weiter gegeben. Dadurch macht das Spielgeschehen einen flüssigen Eindruck. Kleinere Abweichungen sind zwar vorhanden, sie sind aber zu gering, um negativ auffallen zu können.
Doch nun zu den Frametimes auf einem SLI-System mit zwei Grafikkarten in denselben Anwendungen und Szenen, erneut bei etwa 30 Bildern pro Sekunde.
- 1, 0.000
- 2, 23.852
- 3, 141.431
- 4, 172.315
- 5, 289.292
- 6, 316.419
- 7, 429.893
- 8, 457.994
- 9, 569.877
- 10, 595.085
- 11, 703.886
- 12, 723.949
- 13, 834.057
- 14, 862.275
- 15, 973.158
- 16, 999.731
- 17, 1109.856
- 18, 1134.767
- 19, 1242.693
- 20, 1255.905
- 21, 1268.602
- 22, 1369.342
- 23, 1390.530
- 24, 1495.108
- 25, 1517.049
- 26, 1624.498
- 27, 1647.227
- 28, 1755.700
- 29, 1779.890
- 30, 1888.826
- 1, 0.000
- 2, 40.943
- 3, 102.529
- 4, 114.838
- 5, 166.073
- 6, 211.363
- 7, 274.604
- 8, 286.537
- 9, 338.654
- 10, 383.529
- 11, 447.242
- 12, 459.333
- 13, 510.921
- 14, 557.109
- 15, 619.876
- 16, 631.134
- 17, 684.587
- 18, 729.112
- 19, 793.434
- 20, 805.762
- 21, 858.035
- 22, 902.993
- 23, 966.725
- 24, 978.658
- 25, 1030.715
- 26, 1077.172
- 27, 1140.904
- 28, 1152.197
- 29, 1205.327
- 30, 1250.726
- 1, 0.000
- 2, 54.856
- 3, 75.197
- 4, 130.970
- 5, 150.576
- 6, 206.774
- 7, 225.799
- 8, 281.971
- 9, 302.134
- 10, 357.303
- 11, 377.901
- 12, 432.673
- 13, 451.768
- 14, 506.742
- 15, 525.845
- 16, 580.161
- 17, 599.096
- 18, 652.776
- 19, 671.914
- 20, 725.692
- 21, 744.855
- 22, 798.302
- 23, 816.765
- 24, 870.119
- 25, 888.456
- 26, 941.678
- 27, 959.734
- 28, 1012.897
- 29, 1032.301
- 30, 1085.170 31, 1104.379
- 1, 0.000
- 2, 29.708
- 3, 65.708
- 4, 96.739
- 5, 132.596
- 6, 163.725
- 7, 199.488
- 8, 230.366
- 9, 266.749
- 10, 297.467
- 11, 333.589
- 12, 364.241
- 13, 400.674
- 14, 430.960
- 15, 467.804
- 16, 498.121
- 17, 534.565
- 18, 564.961
- 19, 601.564
- 20, 631.885
- 21, 668.658
- 22, 698.992
- 23, 735.403
- 24, 766.044
- 25, 802.496
- 26, 833.061
- 27, 869.425
- 28, 899.889
- 29, 936.501
- 30, 966.830
In Stalker sind die Frametimes mit zwei Grafikkarten zwar nicht mehr ganz so gleichmäßig, allerdings sind die Differenzen minimal. So schwanken die Abstände immer im Bereich von 30 bis 35 Millisekunden, was im Spielverlauf aber nicht negativ auffällt. Stalker ist also eines der Spiele, in denen das Ruckeln nicht existiert.
Anders hingegen sieht es im 3DMark06 aus. Der Benchmark zeigt nicht nur extrem schwankende Zeitabstände in Fraps, er flackert auch ebenso unrund über den Bildschirm. Laut Fraps geben die Grafikkarten das erste Bild nach etwa 24 Millisekunden, das zweite nach 141 Millisekunden, das dritte nach 172 und das vierte Frame nach 289 Millisekunden an den Monitor weiter. Es hat also bis zum ersten Frame nur 24 Millisekunden, bis zum zweiten Frame aber schon viel längere 117 ms gedauert. Das dritte erscheint nach weiteren 31 ms, das vierte nach erneut 117 ms.
Da der 3DMark06 nicht unbedingt eine große Aussagekraft über das Verhalten in Spielen besitzt, haben wir uns die Frametimes auch noch in Call of Juarez und in Clive Barker's Jericho angeschaut – leider mit demselben Ergebnis. In Call of Juarez erscheint das erste Frame nach 41 ms, das zweite nach 103 ms, das dritte nach 115 ms und das vierte nach 166 ms auf dem Bildschirm. Daraus ergeben sich unterschiedliche Abstände von 41 ms, 62 ms, 12 ms und 51 ms. Ähnliches zeigt sich in Jericho: Dort liegen die Zeitintervalle für die ersten vier Frames bei 55 ms, 20 ms, 56 ms und dann wieder bei 20 ms. Dasselbe verhalten zeigen das heute getestete 3-Way-SLI und CrossFire von ATi.
Und ist eine Lösung für dieses Problem in Sicht? Darauf haben wir zur Zeit leider keine Antwort, da – zumindest offiziell – nicht eindeutig klar ist, worin denn überhaupt genau die Ursache liegt. Sowohl ATi als auch Nvidia kennen das Problem und möchten uns weitere Informationen dazu geben. Bis jetzt haben wir von beiden Chipspezialisten aber noch keine weiterführende Antwort bekommen. René Fröleke, Technischer PR-Manager bei AMD, hat uns bis jetzt immerhin eine kleine Vermutung zu diesem Problem gegeben.
Seiner Meinung nach wäre es möglich, dass die Mikroruckler kein Problem des Treibers oder der Multi-GPU-Technik sind, sondern vielmehr der Programmierweise einiger Spielen entstammen. Manche komplexe Objekte werden bei gewissen Rendertechniken nicht Frame für Frame wieder neu berechnet, da dies ein zu großer Aufwand wäre. Wenn nun die eine Grafikkarte das komplexe Objekt fertig berechnet hat und an die andere weitergibt (die somit das Objekt nicht neu berechnen muss), kann diese das Frame früher fertigstellen, womit natürlich eine unruhige Wiedergabe der einzelnen Frames gegeben wäre. Wir bleiben an dieser Sache auf jeden Fall dran.
Synthetische Benchmarks
3DMark06
Die allseits bekannte Benchmarkserie von Futuremark ist mittlerweile in der Version 2006 erschienen und hört dementsprechend auf die Bezeichnung „3DMark06“. Von den sechs Testszenen messen vier Sequenzen die Performance der Grafikkarte und zeigen eine Grafikpracht, die ihres gleichen sucht. Um jene zu erreichen setzen die Finnen auf modernste 3D-Technologie, weswegen nicht nur massiv das Shader-Model 3.0 verwendet wird, auch extrem aufwendige Texturen, spektakuläre Partikeleffekte, komplexe Schattenberechnungen und als weiteres Highlight „High Dynamic Range Rendering“ – kurz HDRR – werden eingesetzt. Dabei setzt Futuremark auf FP16-HDR, das die derzeit Best mögliche Bildqualität liefert, aber auch aufwendig zu berechnen ist. Somit können Grafikkarten ohne FP16-Blending-Einheiten, unter anderem die X8x0-Serie von ATi, zwei Testszenen nicht ausführen, weswegen die Punktzahl dieser GPUs generell niedrig ausfällt. Darüber hinaus können nur Grafikkarten, die MSAA auf ein FP16-Rendertarget ausführen können, die HDRR-Sequenzen mit Anti-Aliasing berechnen. Grafikkarten ohne diese Fähigkeit erzeugen bei Einsatz von Kantenglättung keine Punktzahl und werden deswegen nicht berücksichtigt. Weitere Details zu diesem Programm gibt es in einem unserer ausführlichen Artikel. [18]
3DMark06
Angaben in Punkten
|
Spielebenchmarks
Anno 1701
Auch wenn normalerweise First-Person-Shooter mit einer erstaunlichen Grafik glänzen können, so hat es sich das deutsche Entwicklerteam des Strategiespieles Anno 1701 nicht nehmen lassen, den Nachfolger der legendären Spiele Anno 1602 sowie Anno 1503 ebenfalls mit einer Grafikengine auszustatten, die sich vor der gesamten Konkurrenz nicht zu verstecken braucht. Das Auge bekommt praktisch alles geboten, was derzeit mit moderner Hardware möglich ist. Detaillierte Texturen, schön anzusehende Landschaften, nette Shadereffekte, wie Beispielsweise die Darstellung des Wassers inklusive der Brechung der Wellen und noch vieles mehr machen Anno 1701 zu einem wahren Augenschmaus. Aus diesem Grund eignet sich das Strategiespiel, als eines der wenigen seiner Art, für die Teilnahme an einem Grafikkarten-Review, da die GPU viel zu berechnen hat. Auf modernes FP16-HDRR verzichten Anno 1701 allerdings, stattdessen kommt nur ein simpler Bloom-Filter zum Einsatz.
Anno 1701
Angaben in Bildern pro Sekunde (FPS)
|
Clive Barker's Jericho
Spielerisch oder technisch bemerkenswerte Spiele geraten normalerweise schnell ins Blickfeld der Presse und werden auch von den Spielern meistens sehnlich erwartet. Anders war dies merkwürdigerweise bei „Clive Barker’ Jericho“, dessen Demo mehr oder weniger aus dem nichts aufgetaucht ist. Spielerisch wird die Vollversion zwar erst noch beweisen müssen, ob Jericho auf Dauer wird überzeugen können, technisch macht die Demo aber bereits eines klar: Die Grafikengine ist auf der Höhe der Zeit und braucht sich vor keinem anderen Konkurrenten zu verstecken. Nicht nur die Technik an sich kann mit qualitativ hochwertigen Texturen, diversen Shader- sowie Partikeleffekten und FP16-High-Dynamic-Range-Rendering punkten, auch der Grafikcontent selber, sprich die künstlerische Gestaltung, zeugt von Originalität. Da die GeForce-7-Serie von Nvidia bekanntlicherweise kein Multi-Sampling-Anti-Aliasing auf ein FP16-Rendertarget anwenden kann, muss die alte Grafikkartengeneration aus Kalifornien bei den Qualitätseinstellungen außen vor bleiben.
Clive Barker's Jericho
Angaben in Bildern pro Sekunde (FPS)
|
Colin McRae Dirt
Die Colin-McRae-Reihe war schon immer ein Highlight für alle Rennspielfans, bei denen es auch mal etwas dreckiger werden durfte. In der Rally-Serie fährt man nunmals längst nicht immer auf Asphalt. Nachdem die Serie in letzter Zeit qualitativ etwas abgeflacht ist, hat der Entwickler Codemaster mit Colin McRae Dirt die Handbremse gezogen und zu alten Tugenden gefunden – und viele neue Features hinzugefügt. Beeindrucken kann ebenso die neu entwickelte Grafikengine, die zum aktuellen Zeitpunkt zweifellos ihres Gleichen in der Rennsportszene sucht. Zwar verzichtet Dirt auf FP16-HDRR, kann aber mit einigen (wenn auch übertriebenen) schicken Lichteffekten, detaillierten Texturen, schönen Landschaften, einer großen Weitsicht sowie gut gelungenen Partikeleffekte überzeugen. Dies hat aber auch seinen Preis: Die Hardwareanforderungen sind extrem hoch und bereiten den meisten PCs Probleme. Grund genug für uns, Colin McRae Dirt in den Benchmarkparcours aufzunehmen.
Colin McRae Dirt
Angaben in Bildern pro Sekunde (FPS)
|
F.E.A.R.
Doom 3 bekommt Konkurrenz – und was für Eine! Die Programmierer des neue Gruselshooters F.E.A.R. scheinen sich Doom 3 als großes Vorbild ausgesucht zu haben, wobei man allerdings fast alles besser zu machen scheint. Unter anderem wird die sehr beklemmende Atmosphäre durch eine Grafikqualität erreicht, die ihres Gleichen sucht. Shadereffekte in Massen, wunderschönes Bump-Mapping, sehr spektakuläre Schattenwürfe, detaillierte Texturen sowie hübsch aussehende Partikeleffekte und noch vieles mehr bekommt der Spieler zu Gesicht, weswegen F.E.A.R. bereits Pflicht für einen guten Benchmark-Parcours geworden ist. Wir verwenden mittlerweile für diese Zwecke die Vollversion, die über eine integrierte Benchmarkfunktion verfügt. Jene zeigt ein Gefecht sowie eine größere Explosion, die durch eine frei bewegende Kamera aufgenommen worden sind. Die Details sind, mit Ausnahme der Soft-Shadows, auf das Maximum gesetzt.
F.E.A.R.
Angaben in Bildern pro Sekunde (FPS)
|
Gothic 3
Wohl zweifellos das meist erwartete Adventurespiel im Jahre 2006 hört auf den Namen „Gothic 3“, was mit den beiden beliebten Vorgängern begründet ist. Auch wenn das Spiel, selbst nach einigen Patches, immer noch sehr fehlerhaft ist, so erfreut es sich einer großen Beliebtheit in Deutschland, wie man gut an den Verkaufscharts erkennen kann. Doch neben dem eigentlichen Spielinhalt kann Gothic 3 zudem mit der Grafikengine punkten, die den Entwicklern sehr gut gelungen ist. So ist nicht nur die Weitsicht beeindruckend, auch die kleinen lieblichen Details an Figuren und Gegenständen machen die Grafik zu etwas Besonderem. Dass die Engine damit nicht nur gut aussieht, sondern auch sehr Hardwareintensiv ist, war bereits vom vornherein klar. Allerdings bietet das Grafikgrundgerüst einen entscheidenden Nachteil: So kann derzeit kein Anti-Aliasing angewendet werden, weswegen das Feature in den Qualitätseinstellungen nicht aktiv ist; dort ist nur der anisotrope Filter im Einsatz.
Gothic 3
Angaben in Bildern pro Sekunde (FPS)
|
Oblivion
Bereits der Vorgänger „Morrorwind“ hat bei vielen Spielefans eine richtige Begeisterung hervorgerufen und bei dem Nachfolger „Oblivion“ scheint dies nicht anders zu sein. Für kaum ein Spiel findet man derzeit mehr Diskussionen im Internet. Aber nicht nur spielerisch, auch grafisch kann Oblivion überzeugen und fährt, um dieses Ziel zu erreichen, schwere Geschütze auf. Noch niemals zuvor wurde HDRR mit dynamischem Tone-Mapping derartig realistisch eingesetzt. Darüber hinaus kann das Spiel mit schönen Schatteneffekte sowie stellenweise hoch auflösenden Texturen und Partikeleffekte glänzen. Dementsprechend ist Oblivion geradezu prädestiniert für einen guten Benchmarkparcours. Die verwendete Szene zeigt nicht nur eine aufwendige Beleuchtung, auch sind mehrere Sträucher und Bäume zu sehen, die vor allem die GPU extrem stark belasten. Da die Grafikkarten der GeForce-7-Generation auf ein FP16-Rendertarget kein Multi-Sampling Anti-Aliasing anwenden können, haben wir die entsprechenden Modelle in den Qualitäts-Benchmarks nicht abgebildet, um die Vergleichsmöglichkeiten der 3D-Beschleuniger untereinander aufrecht zu erhalten.
Oblivion
Angaben in Bildern pro Sekunde (FPS)
|
Prey
Kinder in jungen Jahren verkleiden sich zu Karneval gerne als Indianer. Viele ältere Artgenossen spielen dagegen lieber den First-Person-Shooter Prey und helfen dem etwas mürrischen Indianerhelden Tommy, die Welt vor einer außerirdischen Macht zu retten. Dies tut Tommy nicht nur mit gefundenen beziehungsweise abgenommenen Alien-Waffen, sondern zusätzlich mit der altbewährten Doom-3-Engine, die für Prey aber kräftig aufgebohrt worden ist. Mit anderen Worten: Die Grafik ist kaum wieder zu erkennen. Hochauflösende Texturen, schicke Shader-Effekte, aufwendige Schattenberechnungen und noch vieles mehr machen das Spiel zu einem wahren Augenschmaus. Die selbst aufgenommene Timedemo zeigt sowohl einen Abschnitt innerhalb als auch außerhalb eines Gebäudes und deckt insgesamt einen Großteil des Spielgeschehens ab. Waffenfeuer, viele Gegner und Tommys Fähigkeit, sich außerhalb seines eigenen Körpers zu bewegen, fehlen nicht.
Prey
Angaben in Bildern pro Sekunde (FPS)
|
Rainbow Six Vegas
Die „Rainbow Six“-Reihe umfasst schon etliche Titel und ist einer der größten PC-Spiele-Serien weltweit. Die neueste Kreation hört auf den simplen Namen „Vegas“, der aber bereits verdeutlicht, wo die Spezialeinheit diesmal im Einsatz ist. Und das die Stadt Vegas zu den farbenfrohesten Städten überhaupt gezählt werden kann, bezweifeln wohl nur die wenigsten. Dementsprechend bunt, aber auch sehr detailliert, ist die Grafikengine von Vegas, die zeitgleich nicht irgendeine, sondern eine sehr bekannte ist: Die Unreal Engine 3, die in diesem Jahr zudem in „Unreal Tournament 3“ zum Einsatz kommen wird. Obwohl die Version in Vegas der in UT3 um einiges hinterher hinkt, so weiß die Grafik zu überzeugen. Sehr viele Details werden dargestellt, die man bis jetzt in keinem Spiel entdecken konnte. Die vielen bunten Farben sowie die detaillierten Animationen runden das Ergebnis ab. Doch die Unreal Engine 3 hat einen großen Nachteil: So kommt „Deferred Shading“ (die Unreal Engine 3 an sich ist kein reiner Deffered Renderer, einzig der Schattenpart besitzt einen speziellen Algorithmus) zum Einsatz, das mit einer flotten Schatten- und Lichtberechnung zwar einige Vorteile bietet, aber unter der Direct3D-9-API Anti-Aliasing verhindert. Erst mit Direct3D 10 ist Deferred Shading und Kantenglättung möglich. Da in unserer ausgewählten Benchmark-Szene der anisotrope Filter keinen Einfluss auf die Geschwindigkeit hat, lassen wir diesen in der Diagrammdarstellung außen vor.
Rainbow Six Vegas
Angaben in Bildern pro Sekunde (FPS)
|
Stalker
„Stalker“ – neben Duke Nukem Forever wohl der Inbegriff des Wartens. Nach einer langen Zeit hat es der ukrainische First-Person-Shooter aber dennoch in die Regale geschafft und weißt trotz der schier ewigen Entwicklungszeit zu gefallen. Nicht nur spielerich punktet das Spiel mit einigen netten Ideen, auch die Atmosphäre kann sich sehen beziehungsweise spüren lassen. Darüber hinaus ist die Grafikengine, die einen „Deffered Shadowing“-Algorithmus verwendet, gut gelungen. Das Spiel überzeugt vor allem mit schicken Wettereffekten und kann detaillierte Texturen aufweisen. Shader-Model-3.0-Effekte kommen zum Einsatz, ebenso hochwertiges FP16-HDR-Rendering, das für ein realitätsnahes Farbenspektrum sorgt. Ein weiteres Highlight sind die zahlreichen hochwertigen Licht- und Schatteneffekte, die man in dieser Form bis jetzt noch nicht zu sehen bekommen hat. Dies ist der Vorteil von Deffered Shadowing, da die Licht- und Schattenberechnungen sehr schnell ausgeführt werden können. Ein große Nachteil ist aber, dass Direct3D-9-Beschleuniger deswegen kein Multi-Sampling-Anti-Aliasing ausführen können. Dazu benötigt es nicht nur eine D3D10-Grafikkarte, auch das Spiel muss mit der neuen API ausgestattet sein.
Stalker
Angaben in Bildern pro Sekunde (FPS)
|
Unreal Tournament 3
Klassische First-Person-Shooter sind in der heutigen Zeit selten geworden. Während es diese vor einigen Jahren noch in schieren Massen gegeben hat, ist ein „reinrassiger Ballerspaß“ mittlerweile etwas aus der Mode gekommen. Nichtsdestotrotz gibt es einige wenige Spiele, die dies mit großem Erfolg ignorieren und auf das alte Erfolgskonzept setzen. Eine dieser Serien hört auf den Namen „Unreal Tournament“, die von Epic, eine der bekanntesten Spieleschmieden, programmiert wird. Der neueste Spross hört auf den Namen Unreal Tournament 3, der im Gegensatz zu seinen beiden Vorgängern spielerisch wieder mehr an das originale Unreal Tournament erinnert. Als Technikgrundgerüst kommt die Unreal Engine 3 zum Einsatz, die derzeit bereits in einigen anderen Spielen technisch zu gefallen weiß. Dies ist auch in Unreal Tournament 3 nicht anders: Schicke und abwechslungsreiche Texturen, gute Partikeleffekte, ein sinnvolles (wenn auch manchmal etwas übertriebenes) Shading, High-Dynamic-Range-Rendering und noch vieles mehr machen aus „UT3“ eines der schönsten Spiele auf dem Markt. Noch nicht implementiert ist (obwohl die Unreal Engine 3 dazu durchaus in der Lage ist) die Unterstützung der Direct3D-10-API. Da die Unreal Engine 3 Deferred Shading benutzt, funktioniert kein Anti-Aliasing, weswegen die meisten Grafikkarten keine Kantenglättung nutzen können. Da die Direct3D-10-Hardware dazu aber in der Lage ist, hat Nvidia für die entsprechenden Grafikkarten einen kleinen Trick im Treiber angewendet, der Anti-Aliasing möglich macht. Dies machen wir uns zu Nutze und testen die GeForce-8-Karten ebenfalls mit aktivierter Kantenglättung. Als Benchmarksequenz verwenden wir die integrierte Flyby-Funktion der Karte „Gateway“. Diese erzeugt sehr hohe FPS-Werte, die im richtigen Spielgeschehen zu keiner Zeit auch nur annähernd erreicht werden. Deswegen kann man von unseren Benchmarks nur bedingt auf das Spiel schließen.
Unreal Tournament 3
Angaben in Bildern pro Sekunde (FPS)
|
Direct3D-10-Benchmarks
Bioshock
„Bioshock“, mehr oder weniger der inoffizielle Nachfolger von „System Shock 2“, hatte es beim Erscheinen wahrlich nicht leicht. Die Erwartungen waren dermaßen hoch, dass es nahezu unmöglich schien, diese alle zu erfüllen. Im Vorfeld sprach man bereits von „bestes Spiel aller Zeiten“. Nun ist Bioshock draußen. Ob es tatsächlich das beste Spiel aller Zeiten ist, kann man wohl noch ewig diskutieren. Eins ist aber eindeutig: Technisch ist Bioshock nicht nur sehr weit vorne, sondern wohl derzeit allen anderen Titeln voraus. Grund dafür ist die Unreal Engine 3, die die Entwickler modifiziert haben, um diese auf die eigenen Ansprüche anzupassen. Herausgekommen ist ein Direct3D-10-Renderer, der mit bisher noch nie dagewesenen Wassereffekten punkten kann. So interagiert das Wasser physikalisch Korrekt auf den Spieler, wenn dieser beispielsweise durch einen überfluteten Raum läuft. Darüber hinaus bietet Bioshock viele weitere optische Schmankerl. Schicke Partikeleffekte, spektakuläre Feuerdarstellung, realistische Schatten, schöne Oberflächen, Physikinteraktionen mit den Gegnern sowie der Umwelt und noch vieles mehr machen Bioshock grafisch zu einem Leckerbissen. Unter der Direct3D-10-API funktioniert bisher kein Anti-Aliasing, weil dieses nicht von der Applikation angefordert wird (technisch aber zumindest theoretisch möglich sein sollte). Deswegen verzichten wir auf die Kantenglättung in den Qualitätseinstellungen.
Bioshock
Angaben in Bildern pro Sekunde (FPS)
|
Call of Juarez
Als Testsequenz in dem Direct3D-10-Benchmark zu Call of Juarez kommt eine spezielle Flyby-Szene zum Einsatz, die verschiedene neue technische Möglichkeiten der Direct3D-10-API zeigt. In der neuen Version des Spieles ist die Vegetation um 30 Prozent dichter, es gibt 30 Prozent mehr Partikeleffekte, eine um 25 Prozent gestiegene Sichtweite, höher aufgelöste Texturen, höher aufgelöste Shadowmaps, Relief-Mapping wird eingesetzt und noch vieles mehr. Der Geometryshader kommt in der Benchmark-Sequenz natürlich ebenso wenig zu kurz. Wie man bereits bemerkt, ist die Anforderung an die Grafikkarte ein gutes Stück weiter gestiegen, und das, obwohl das Spiel von Grund auf eigentlich für die ältere Direct3D-9-Schnittstelle programmiert worden ist. Nichtsdestotrotz hat der Benchmark noch mit einem Problem zu kämpfen. So werden Teile der Vegetation nicht richtig dargestellt, was laut Techland am Alpha-to-Coverage-Verfahren liegt. Als Testsequenz nutzen wir die aktualisierte Vollversion und ein selber erstelltes Savegame.
Call of Juarez
Angaben in Bildern pro Sekunde (FPS)
|
Company of Heroes
Auf den Patch 1.70 von Company of Heroes haben sicherlich viele Spieler gewartet, denn so bringt die aktuelle Version des Strategietitels nicht nur einige weitere Fehlerbeseitigungen mit sich, sondern führt auch die Unterstützung von Direct3D 10 ein. Die neue API kann man bei einer entsprechenden Grafikkarte im Spielmenü auswählen und schon erscheinen alle Levels in neuem Glanz. Darüber hinaus kann man die Terraindetails nun eine Stufe höher auf „Ultra“ schrauben, was einige Bodendetails hinzufügt und die Texturen sichtbar verbessert. Die Direct3D-10-Version bietet dem Spieler eine pixelgenaue Beleuchtung, Percentage Closer Filtering für die Soft Shadows auf allen D3D10-Beschleunigern, schönere Partikeleffekte sowie Alpha to Coverage für alle Bäume und Sträucher, die somit auch von herkömmlichen MSAA erfasst und bearbeitet werden. Als Benchmarksequenz verwenden wir wie in der Direct3D-9-Version von Company of Heroes den integrierten Benchmark.
Company of Heroes
Angaben in Bildern pro Sekunde (FPS)
|
Crysis
Crysis – alleine der Name sagt wohl schon alles. Kaum ein anderes Spiel hat bereits vor der Veröffentlichung so viel Aufmerksamkeit erhalten wie der First-Person-Shooter von Crytek, der der inoffizielle Nachfolger zum Actionhit Far Cry ist. Far Cry sagt eigentlich auch schon alles: Denn kaum ein anderes Spiel lässt einen sofort an einen sonnigen Strand und an große Palmen denken. Und genau diesen (und noch viel mehr) sieht man in Crysis wieder, selbst wenn man ihn kaum wiedererkennen wird. Denn wie Far Cry setzt Crysis neue Maßstäbe in Sachen Grafik und hebt die Messlatte dabei gleich dermaßen hoch an, dass es wohl noch einige Zeit dauern wird, bis ein anderes Spiel die grafische Qualität von Crysis auch nur erreichen wird. Die Direct3D-10-API, High-Dynamic-Range-Rendering, Parallax Occlusion Mapping, Soft Shadows, Motion Blur, Depth of Field, Soft Particles und noch eine Menge mehr bekommt man bei Crysis geboten. Dementsprechend hoch fallen die Hardwareanforderungen aus, die selbst den schnellsten Rechner problemlos ins Schwitzen bringen. Als Benchmark verwenden wir in Crysis die integrierte GPU-Timedemo, die man mittels einer Batch-Datei ausführen kann.
Den Benchmark kann jeder am heimischen PC selber nachvollziehen. Damit dieser korrekt unter Windows Vista ausgeführt wird, muss der Crysis.exe das Attribut „Als Administrator ausführen“ gegeben werden. Anschließend funktioniert die unter „C:\Program Files\Electronic Arts\Crytek\Crysis\Bin32“ versteckte Batch-Datei Benchmark_GPU.bat. Bei den Benchmarks werden jeweils die zuletzt im Spiel gewählten Settings genutzt. Darauf muss geachtet werden. Unter „C:\Program Files\Electronic Arts\Crytek\Crysis SP Demo\Game\Config“ kann mit Hilfe der benchmark_gpu.cfg eingestellt werden, wie häufig die Benchmarks wiederholt werden sollen. Wir testen Crysis mit Very-High-Details in der Version 1.1 sowie dem ForceWare 169.28, da dieser spezielle 3-Way-SLI-Optimierungen für das Spiel enthält. Die Benchmarks mit der Ursprungsversion 1.0 rechnen wir nicht in das Performancerating ein.
Crysis 1.1
Angaben in Bildern pro Sekunde (FPS)
|
Crysis 1.0
Angaben in Bildern pro Sekunde (FPS)
|
Lost Planet
Das Actionspiel „Lost Planet“ gibt es in zwei verschiedenen Versionen: Eine Direct3D-9- und eine Direct3D-10-Variante; letztere hat es in unseren Parcours geschafft. Das Spiel kann technisch nicht nur durch die D3D-10-Erweiterung und somit der Nutzung des Shader-Model 4 inklusive des neuen Geometry-Shaders glänzen, auch abseits der API weiß Lost Planet zu gefallen. Mit Soft Shadows (diese sind in Lost Planet zwar an die D3D10-Version gekoppelt, mit Direct3D 10 hat diese Schattenvariante aber nichts zu tun), FP16-High-Dynamic-Range-Rendering, detaillierten Texturen, massig Partikeleffekte und noch vielem mehr ist das technisch weit fortgeschrittene Spiel ein regelrechter Augenschmaus; das Lost Planet dabei noch eine menge Spaß macht könnte man fast schon als nebensächlich bezeichnen. Die Demoversion des Spiels bietet praktischerweise eine integrierte Benchmarksequenz, die einen Kameraflug aus der Sicht des Spielers durch zwei verschiedene Levels zeigt. Aus uns unbekannten Gründen scheint auf einer Radeon-HD-2000-Karte derzeit der so genannte „Fur“-Shader nicht zu funktionieren, der für die Felldarstellung verantwortlich ist.
Lost Planet
Angaben in Bildern pro Sekunde (FPS)
|
World in Conflict
Mittlerweile sehen Strategiespiele zwar deutlich besser aus als noch vor einigen Jahren, so recht gelingen will es den Programmen aber nur selten, in die Königsklasse, die meist von First-Person-Shootern besetzt wird, vorzudringen. Den Entwicklern von World in Conflict scheint dies nicht gereicht zu haben und man entwickelte eine Grafikengine, die sich vor keinem anderen Spiel zu verstecken braucht. World in Conflicht unterstützt die Direct3D-10-API und hat keine Schwierigkeiten, Kantenglättung unter der neuen Programmierschnittstelle anzuwenden. Schicke Shadereffekte zieren das Spiel (so wirft die Sonne beispielsweise Lichtstrahlen durch die Wolken, die die Umgebung beleuchten), ebenso detaillierte Texturen und eine realistische Schattendarstellung. Die Animationen der Spielcharaktere sind gut gelungen, was in Kombination mit einer kinoreifen Schnittreihenfolge Filmatmosphäre in den Zwischensequenzen aufkommen lässt. Als Testsequenz benutzen wir nicht die integrierte Benchmarkfunktion, da diese sich etwas seltsam verhält. Stattdessen verwenden wir die Introsequenz zur ersten Kampagne der Demo.
World in Conflict
Angaben in Bildern pro Sekunde (FPS)
|
Performancerating
Kommen wir nun abschließend zum Performancerating. Dadurch soll es erleichtert werden, alle Ergebnisse auf einen Blick zusammengefasst zu bekommen. Da die synthetischen Benchmarks in dem Testparcours (sprich der 3DMark06) über keine Spiele-Engine verfügen und somit keine realistische Aussagen über die Geschwindigkeit in 3D-Titeln wiedergeben, haben wir diese Applikationen aus dem Rating herausgenommen. Achtung: In diesen Ratings sind auch die Ergebnisse der Anwendungen enthalten, in denen 3-Way-SLI nicht skaliert und somit eine Leistung auf Niveau des SLI-Systems (zwei Karten) erlangt hat.
Rating 1280x1024 4xAA/16xAF
Angaben in Prozent
|
Rating 1600x1200 4xAA/16xAF
Angaben in Prozent
|
Rating 2560x1600 4xAA/16xAF
Angaben in Prozent
|
Performancerating Qualität
Rating 1280x1024 8xAA/16xAF
Angaben in Prozent
|
Rating 1600x1200 8xAA/16xAF
Angaben in Prozent
|
Rating 2560x1600 8xAA/16xAF
Angaben in Prozent
|
Sonstiges
Lautstärke
Da quasi alle aktuellen Modelle über eine herstellerseitige Lüftersteuerung verfügen, unterscheiden wir bei den Messungen den 2D- und den 3D-Betrieb. Für die Last-Messungen wird der 3DMark06 in der Endlosschleife ausgeführt und nach dreißig Minuten die Lautstärke notiert. Beide Messungen werden im Abstand von 15 cm zur Grafikkarte durchgeführt. Um nur die Lautstärke der jeweiligen Grafikkarte messen zu können, wurden beim Test die Gehäuselüfter vom Netz getrennt. Die Messung erfolgt für das gesamte Testsystem.
Lautstärke
Angaben in Dezibel
|
Dass die Lautstärkeentwicklung bei einem 3-Way-SLI-System nur schwer in den Griff zu bekommen ist, scheint, zumindest bei den aktuellen Verlustleistungen, nahe liegend. Eine High-End-CPU und drei High-End-Grafikkarten sind nun einmal nicht ohne Weiteres zu kühlen. Und dementsprechend laut agiert der Atelco-PC (wobei es sich um ein „angenehmes Brummen“ und nicht um ein störendes Kreischen handelt). Die Messwerte sehen also schlimmer aus, als sich der PC anhört.
Mit nur einer GeForce 8800 Ultra ist der Computer unter Windows noch deutlich leiser und noch als angenehm zu bezeichnen. Ein ruhiges Arbeiten ist ohne Probleme möglich, auch wenn es sich natürlich nicht um einen Silent-PC handelt. Unter Last stört die Lautstärke ebenso wenig. Mit zwei Grafikkarten wird der Atelco-PC schon hörbar lauter, wobei sich der Lautstärkepegel im Idle-Modus noch zurück hält. Während einer Lastphase fällt der Rechner dann aber doch auf, wobei es beim Spielen eventuell noch so gerade zu vertragen ist (für empfindliche Spieler dürfte allerdings schon Schluss sein).
Erstaunlicherweise wird der Atelco-PC im 3-Way-SLI-Modus unter Windows nur gering lauter. Natürlich, mit den gemessenen 54,5 Dezibel ist der Computer nicht mehr leise, jedoch hat es Atelco mit drei Grafikkarten geschafft, immer noch leiser also so manche Einzelgrafikkarte zu bleiben. Unter Last agiert der Computer dann mit 62 dB störend laut. Kein Wunder bei der Leistungsaufnahme. Hier heißt das Zauberwort für die Hersteller eindeutig „Verlustleistung senken!“
Temperatur
Ähnlich den Messungen zur Lautstärke werden auch die Temperaturmessungen durchgeführt. Fast alle aktuellen Grafikkarten besitzen Sensoren, die per Treiber oder Hersteller-Tool ausgelesen werden können. Die Kern-Temperatur wird dabei im Ruhezustand im Windows-Desktop und unter Last nach dreißig Minuten 3DMark06 abgelesen. Zudem messen wir mit Hilfe eines Infrarot-Thermometers die Chiptemperatur auf der Rückseite der Grafikkarte.
Temperatur
Angaben in °C
|
Bei den Temperaturmessungen kann man gut erkennen, dass die GPU-Temperatur immer weiter zunimmt, umso mehr Grafikkarten man verbaut. Mit nur einer GeForce 8800 Ultra bleibt die Grafikabteilung im Atelco-PC angenehm kühl. Unter Windows messen wir nur 59 Grad Celsius, unter Last sind es angenehme 84 Grad Celsius. Im SLI-Modus steigt die Temperatur bereits auf der Windows-Oberfläche auf 68 Grad an, unter Last ist die Steigerung auf 88 Grad Celsius interessanterweise dagegen geringer.
Dasselbe gilt, wenn man die 3-Way-SLI-Konfiguration startet. Im Idle-Modus messen wir bis zu 78 Grad Celsius, unter Last bis zu 92 Grad. Zwar klingt dies im ersten Augenblick nach viel, allerdings sind moderne GPUs für den Betrieb mit 100 Grad Celsius und mehr ausgelegt. Zu Schwierigkeiten sollte es also selbst in heißen Sommertagen nicht kommen, da Atelco den Computer mit einer ausreichend guten Gehäusekühlung bedacht hat. Die Temperaturen auf der Chiprückseite bleiben, unabhängig von der Anzahl der Grafikkarten, immer gleich.
Leistungsaufnahme
Für die Messungen der Leistungsaufnahme wird ein handelsüblicher Verbrauchs-Monitor, den man sich auch beim örtlichen Stromversorger ausleihen kann, genutzt. Gemessen wird die Gesamt-Leistungsaufnahme des Testsystems. Auch hier gilt die Teilung zwischen Idle- und Last-Betrieb. Letzterer wird durch Verwendung des 3DMark06 unter der Auflösung 1600x1200 sowie 4-fachem Anti-Aliasing und 16-fachem anisotropen Filter simuliert.
Leistungsaufnahme
Angaben in Watt (W)
|
Unter Last messen wir mit drei Grafikkarten maximal 719 Watt – das 1300-Watt-Netzteil von Tagan ist in dem 3-Way-SLI-System also etwas überdimensioniert. Selbst wenn man sämtliche Komponenten übertaktet, sollte man das Netzteil wohl kaum komplett Auslasten können.
Dass ein 3-Way-SLI System viel Strom benötigen wird, wird wohl jedem potenziellen Käufer von vornherein klar sein. Und Enthusiasten, die sich 3-Way-SLI am Ende zulegen, interessiert die Leistungsaufnahme (unter Last) wohl kaum, da das Oberziel maximale Leistung lautet und andere Faktoren komplett außen vor bleiben.
Nichtsdestotrotz bereitet einem neben der Leistungsaufnahme unter Last insbesondere der Betrieb auf dem Windows-Desktop Kopfschmerzen. So leidet das 3-Way-SLI-System unter Windows an dem generellen Problem der G8x- und G92-GPU, dass die Grafikkarten über keinen effektiven Stromsparmechanismus verfügen und somit sehr viel Leistung benötigen, obwohl keine Arbeit verrichtet wird. Die Leistungsaufnahme steigt mit jeder GeForce-8800-Ultra-Grafikkarte um etwa 100 Watt an - für's nichts tun! Nvidias neu vorgestellte Hybrid-SLI-Technologie [19] würde bei einem 3-Way-SLI-System somit wahre Wunder bewirken, da der Rechner alle drei diskreten Grafikkarten komplett deaktivieren könnte und nur der Onboard-Grafikchip Strom verbrauchen würde. Eine lediglich vorgestellte und bisher nicht verfügbare Technik nutzt dem Kunden aber derweil noch nichts. Hier gilt es eindeutig an Tempo zuzulegen. Denn wenn man die Leistungsaufnahme unter Last noch mit einer brachialen Leistung besänftigen kann, für den sinnlosen, absolut ineffizienten Verbrauch von gut 300 Watt unter Windows gibt es keine Rechtfertigung.
Beurteilung
Für Grafikkartenverhältnisse ist es lange her, dass die Geschwindigkeit spürbar verbessert worden ist. Die Vorstellung der GeForce 8800 Ultra von Nvidia ist schon viele Monate her und seitdem gab es eine kleine Stagnation im High-End-Markt. Weder ATi, noch Nvidia waren bis jetzt in der Lage (oder dazu gewillt), die Performanceschraube weiter nach oben zu drehen. Und auch mit 3-Way-SLI stellt Nvidia keine schnellere Einzelgrafikkarte vor. Dafür bietet 3-Way-SLI eine die Gesamtleistung steigernde Erweiterung der SLI-Technologie, die nun nicht mehr nur mit zwei, sondern gleich mit drei Grafikkarten arbeiten kann. Und im Gegensatz zu Quad-SLI auf der GeForce 7950 GX2 funktioniert 3-Way-SLI auch gut. Die Ergebnisse zusammen gefasst:
In 1280x1024 mit vier-fachem Anti-Aliasing sowie 16-facher anisotroper Filterung ist zwar eine Geschwindigkeitsverbesserung für 3-Way-SLI vorhanden, aufgrund der zu hohen CPU-Limitierung fällt diese aber nicht allzu hoch aus. 17 Prozent kann sich 3-Way-SLI im Durchschnitt von der herkömmlichen SLI-Technologie absetzen. In 1600x1200 sieht es für die drei GeForce-8800-Ultra-Grafikkarten schon um einiges besser aus. Der Vorsprung vor SLI liegt bei akzeptablen 26 Prozent, in 2560x1600 erhöht sich die Differenz sogar auf gute 31 Prozent. Durch diese Performancesteigerung sind einige Spiele erstmals in 2560x1600 flüssig darstellbar.
Bei Verwendung von acht-fachem Anti-Aliasing kann sich 3-Way-SLI bereits in 1280x1024 um 30 Prozent von SLI absetzen. In 1600x1200 stagniert der Unterschied erneut bei 30 Prozent, während die Leistung in 2560x1600 etwas absackt. Die Performancesteigerung liegt in diesem Fall bei 24 Prozent. Der Grund ist wahrscheinlich in der für diese Qualitätseinstellung zu geringen Speichergröße der GeForce-8800-Ultra-Karten zu suchen (allerdings ist acht-faches Anti-Aliasing in dieser Auflösung auch ein regelrechter „Overkill“ für heutige Hardware in aktuellen Spielen). Da hilft selbst 3-Way-SLI dann nicht weiter.
Theoretisch könnte sich 3-Way-SLI maximal um 50 Prozent von zwei Grafikkarten absetzen. Wenn man nun betrachtet, dass 3-Way-SLI in einigen Spielen wie zum Beispiel Gothic 3 und Clive Barker's Jericho nicht funktioniert und eine Leistung auf SLI-Niveau (zwei Karten) geliefert hat und diese Anwendungen ebenfalls in unser Rating eingegangen sind, sind die durchschnittlich bis zu 30 Prozent ein sehr gutes Ergebnis. Denn wenn 3-Way-SLI ordentlich seinen Dienst verrichtet (was zum Glück überwiegend der Fall ist), liegt die Geschwindigkeitsverbesserung bei 40 Prozent oder gar noch darüber! Das Treiberteam von Nvidia scheint eine gute Arbeit geleistet zu haben. Aber es bleibt auch noch genügend Verbesserungspotenzial vorhanden. So fehlt einigen Spielen noch ein 3-Way-SLI-Profil und man hat mit einem weiteren Manko zu kämpfen.
Dieses betrifft aber nicht nur 3-Way-SLI, sämtliche Multi-GPU-Lösungen, also auch normales SLI und CrossFire, sind davon betroffen. Gemeint sind die so genannten „Mikroruckler“, die bei einer Bildwiederholfrequenz von etwa 30 Bildern pro Sekunde und weniger in manchen Spielen auftreten. Einige Anwendungen haben das Problem überhaupt nicht, manche nur bedingt, einige aber gleich störend heftig. Denn trotz eigentlich ausreichenden Frameraten ruckelt ein betroffenes System auf seltsame Art und Weise. Aus diesem Grund müssen wir vor der Anschaffung einer Multi-GPU-Lösung (dies gilt wie gesagt nicht nur für 3-Way-SLI) ab sofort dazu raten, sich zuerst einen Eindruck von den Rucklern zu machen, bis es für dieses Phänomen eine Lösung gibt. Für einige Spieler sind die Hänger ein K.O.-Kriterium für eine Multi-GPU-Lösung, andere störten sie nur bedingt. Zudem muss man SLI und CrossFire schon ans Limit fahren, damit das Problem auftritt.
Auf die sonstigen Messungen (wie zum Beispiel die Lautstärke und die Temperatur) möchten wir an dieser Stelle absichtlich nicht eingehen. Diese sind logischerweise von dem kompletten PC und den dort verbauten Komponenten abhängig (in unserem Fall ein Komplettrechner von Atelco), die jeder nach seinen eigenen Wünschen aussuchen kann. Doch eines sollte klar sein: Jeder 3-Way-SLI-Rechner benötigt eine sehr gute Gehäusekühlung, wird unter Umständen unter Last sehr laut und zieht auf jeden Fall sehr viele Kilowattstunden aus der Steckdose.
Fazit
3-Way-SLI ist ohne Zweifel eine sehr beeindruckende Technologie. Drei GeForce-8800-GTX- oder GeForce-8800-Ultra-Grafikkarten bringen derzeit eine spürbar bessere Geschwindigkeit als sämtliche andere Multi-GPU-Lösungen und machen dadurch viele Qualitätseinstellungen in aktuellen Spielen möglich, die vorher nur mit Problemen oder gar nicht genutzt werden konnten. Es gibt mehr oder weniger kein Spiel (Crysis ist einer der wenigen Ausnahmen), das nicht selbst in sehr hohen Auflösungen inklusive Kantenglättung sowie anisotroper Texturfilterung absolut flüssig läuft. Für Enthusiasten, die das absolut Schnellste vom Schnellsten wollen, führt in Sachen Leistung wohl kaum ein Weg an 3-Way-SLI vorbei.
Diesem Kaufsegment werden die Nachteile von 3-Way-SLI wie eine eventuell zu hohe Lautstärke, eine komplexe Gehäusekühlung und einen sehr hohen Leistungsaufnahme möglicherweise ziemlich gleichgültig sein, wobei genau hier die Nachteile der Technologie liegen. Insbesondere schreit die Leistungsaufnahme unter Windows nach Hybrid-SLI und es ist nur zu hoffen, dass der Vorstellung auf der CES eine baldige Verfügbarkeit der Technik und nicht nur warme Luft folgt.
Nicht gleichgültig wird einem Enthusiasten auf jeden Fall das Problem mit den Mikrorucklern sein, die je nach Spiel und Bildwiederholrate auftreten und den Nutzen des teuren Systems von Fall zu Fall durchaus in Frage stellen können. Falls einem die Ruckler auf einem Multi-GPU-System schon nicht negativ aufgefallen sind, werden sie es wohl auch nicht bei 3-Way-SLI tun. Falls aber doch, kann man nur hoffen, dass man die magische 30-FPS-Grenze in den kritischen Spielen deutlich überschreitet (was mit 3-Way-SLI aber in der Regel der Fall sein sollte).
Schlussendlich liefert 3-Way-SLI noch eine gravierende Einschränkung: Aus welchem Grund auch immer, drei Grafikkarten im SLI-Verbund gibt und wird es nur für Windows Vista geben.







































