3/27 nVidia GeForce 7950 GX2 Quad-SLI im Test : Maximale Leistung bei maximaler Qualität

, 101 Kommentare

Funktionsweise

Bei einem herkömmlichen SLI-System gibt es insgesamt zwei verschiedene Rendermodi, die je nach Spiel eingesetzt werden können, um das Spiel zu beschleunigen, dabei aber sowohl Vor- als auch Nachteile haben. Falls möglich, sollte immer der AFR-Modus (Alternate Frame Rendering) benutzt werden, da dieser die höchstmögliche Effizienz aufweist, die je nach Last die Performance theoretisch verdoppeln kann; nVidia gibt einen Performancezuwachs von etwa 90 Prozent an. Bei AFR arbeiten die beiden GPUs an zwei verschiedenen Frames gleichzeitig. Während die GPU0 das Frame0 berechnet, ist die GPU1 für das Frame1 zuständig. Somit kann jeder auftretende Rechenbefehl beschleunigt werden, was bei SFR (Split Frame Rendering) nicht möglich ist – dazu später mehr.

Auch wenn jetzt schon klar ist, dass AFR bei SLI das Optimum darstellt, so hat dieser Rendermodus leider ebenfalls einen Schwachpunkt, da dieser zu einigen Spielen aufgrund deren Programmierweise inkompatibel ist. So ist AFR generell problematisch, wenn so genannte „Render to Texture“-Befehle ausgeführt werden müssen, wie beispielsweise bei der Berechnung von Shadow Maps. Falls eine GPU eine Änderung an den Render Targets vornimmt, ist es nötig, dass der anderen GPU dieselben Daten zur Verfügung stehen, was eine hohe Bandbreitenlast zur Folge hat.

4WayAFR
4WayAFR

Dies ist allerdings noch kein K.O.-Kriterium für AFR, da der Programmierer mit einem speziellen „Clear“-Befehl diesen Overhead reduzieren kann. Wenn jedoch die GPU1 Ergebnisse benötigt, die erst von der GPU0 zur Verfügung gestellt werden müssen, dann ist man auf den langsameren SFR-Modus angewiesen, da das Render Target nicht einfach gelöscht werden kann, ohne dass die nötigen Informationen verloren gehen (zum Beispiel bei Tone-Mapping-Operationen).

Eine Lösung für dieses Problem kann nur vom Spiele-Programmierer kommen, in dem dieser zwei verschiedene Render Targets bereitstellt – eines für jede GPU. Falls dies der Entwickler nicht bedacht hat oder schlicht und ergreifend den Mehraufwand scheut, so muss Split Frame Rendering eingesetzt werden. Für Quad-SLI hat nVidia AFR leicht modifiziert. Erneut übernimmt jede GPU die Aufgaben eines gesamten Frames, womit ein Quad-SLI-System an vier verschiedenen Bildern gleichzeitig arbeiten kann. Diese Funktionsweise hört auf den Namen „4WayAFR“.

4WaySFR
4WaySFR

Bei SFR, welches den Namen „4WaySFR“ bei Quad-SLI trägt, wird das Bild in zwei beziehungsweise vier Hälften aufgeteilt, weswegen nicht mehr als ein Bild gleichzeitig gerendert werden kann. Die Aufteilung erfolgt über ein dynamisches Load Balancing, sprich, die GPUs passen sich immer auf das zu berechnende Bild an, damit ein Rechenkern zu keiner Zeit arbeitslos ist und kein Flaschenhals entsteht. SFR ist eine Art „Kompatibilitätsmodus“, da dieser bei jedem Spiel eingesetzt werden kann.

Jedoch hat der Rendermodus einen großen Nachteil, weswegen SFR zu keiner Zeit so effizient wie AFR ist. So müssen jeder GPU dieselben Geometriedaten vorliegen, da ein Rechenkern immer wissen muss, wo sich welches Objekt befindet, auch wenn dieses zur Zeit nicht berechnet wird. Während die Pixel-Berechnungen normal beschleunigt werden, bleibt der Vertex-Shader auf dem Niveau von einer einzelnen Karte.

AFR of SFR
AFR of SFR

Bei Quad-SLI hat nVidia einen dritten Modus eingeführt, bei dem der Name Programm ist: „AFR of SFR“. So werkelt jede einzelne 7950 GX2-Karte an einem Bild (GPU0 und GPU1 an Frame1, GPU2 und GPU3 an Frame2), wobei die beiden Karten im AFR-Modus miteinander kommunizieren, eine Doppelkarte unter sich aber den SFR-Modus nutzt. Dies funktioniert dabei logischerweise schneller als 4WaySFR, da die Geometrie zumindest teilweise beschleunigt wird, kommt an die Performance von 4WayAFR aber nicht heran.

Somit wird deutlich, dass SLI und Quad-SLI nur mit den richtigen Rendermodi einen Sinn ergeben. Was für genaue Auswirkungen dies auf ein Spiel hat, untersuchen wir im weiteren Verlauf des Artikels.

Auf der nächsten Seite: Testsystem