7/20 Nvidia 3-Way-SLI im Test : Wenn drei mehr ist als vier

, 141 Kommentare

Das Multi-GPU-Problem (Mikroruckler)

Als praktikablen Richtwert für ein flüssiges Spielgeschehen auf dem Monitor kann man zumeist die magische 30-FPS-Marke nehmen; 30 Bilder pro Sekunde sind normalerweise genug, um Spiele für das menschliche Auge als relativ flüssig zu bezeichnen. In letzter Zeit konnte man in einigen Diskussionsforen aber des Öfteren nachlesen, dass Multi-GPU-System, sprich CrossFire und SLI, trotz der Wiedergaberate von 30 Bildern pro Sekunde ein Spiel offensichtlich nicht mehr flüssig darstellen, es mit nur einer Grafikkarte gar besser spielbar sei. Nachdem dieses „Phänomen“ zuerst nur stiefmütterlich betrachtet worden ist, gibt es mittlerweile genügend Beschwerden, um sich ihm genauer anzunehmen.

Soviel vorweg: Ja, an diesen Behauptungen ist etwas dran und die vielerorts als „Mikroruckler“ bezeichneten Unstimmigkeiten gibt es sowohl auf SLI- als auch auf CrossFire-Systemen – und 3-Way-SLI ist ebenfalls betroffen. Dem Problem auf die Schliche zu kommen ist dabei kein leichtes Unterfangen, denn es tritt nicht in jedem Spiel auf. Darüber hinaus muss die Bildwiederholrate bei etwa 30 FPS oder darunter liegen, damit das Problem überhaupt zu einem als unstetig wahrgenommenen Spielablauf führen kann. Schaffen es zwei Grafikkarten weit über diesem Limit zu bleiben, treten die Ruckler nur noch schwer wahrnehmbar und irgendwann gar nicht mehr auf.

Doch worin besteht das Problem genau? Nehmen wir als Beispiel eine Darstellung mit 30 Bildern pro Sekunde (FPS), bei der eine Einzelkarte alle 33 Millisekunden (eine Sekunde geteilt durch 30 Bilder) ein Bild an den Monitor schickt - ganz so wie es sein sollte. Im optimalen Fall wird das erste Frame nach 33 Millisekunden, das zweite Frame nach 66 Millisekunden, das dritte nach 99 Millisekunden und so weiter fertiggestellt. Auf CF- und SLI-Systemen kann es aufgrund des Problems jedoch dazu kommen, dass die Abstände zwischen den einzelnen Bildern stark variieren. Wird der Abstand zu groß, kann das Auge den Unterschied zwischen den beiden Frames wahrnehmen – das Bild ruckelt. Da hilft es auch nicht, dass einige Bilder in extrem verkürzten Abständen zum Monitor wandern. Was zählt, ist die kritische, obere Grenze.

Praktischerweise kann man das Ruckeln nicht nur im Spiel selber feststellen, sondern mit Hilfe des Tools „Fraps“ auch in Zahlen ausdrücken. Denn Fraps gibt einem nicht nur die Möglichkeit, den FPS-Wert pro Sekunde festzuhalten, sondern ermöglicht es auch, die „Frametimes“ aufzuzeichnen. Die Frametimes geben an, wann genau die Grafikkarte ein fertiges Bild an den Bildschirm schickt. Im optimalen Fall müssen zwischen den Frametimes absolut identische Zeitabstände liegen.

Schauen wir uns zuerst die Frametimes mit einer GeForce-8800-Ultra-Karte in einigen aktuellen Spielen etwas genauer an.

Frametimes mit einer Grafikkarte im 3DMark06
Frametimes mit einer Grafikkarte in Call of Juarez
Frametimes mit einer Grafikkarte in Jericho
Frametimes mit einer Grafikkarte in Stalker

Wie man gut erkennen kann, sind die Frametimes bei nur einer Grafikkarte gleichmäßig und die Bilder werden in einem etwa gleichen Abstand an den Monitor weiter gegeben. Dadurch macht das Spielgeschehen einen flüssigen Eindruck. Kleinere Abweichungen sind zwar vorhanden, sie sind aber zu gering, um negativ auffallen zu können.

Doch nun zu den Frametimes auf einem SLI-System mit zwei Grafikkarten in denselben Anwendungen und Szenen, erneut bei etwa 30 Bildern pro Sekunde.

Frametimes mit zwei Grafikkarten im 3DMark06
Frametimes mit zwei Grafikkarten in Call of Juarez
Frametimes mit zwei Grafikkarten in Jericho
Frametimes mit zwei Grafikkarten in Stalker

In Stalker sind die Frametimes mit zwei Grafikkarten zwar nicht mehr ganz so gleichmäßig, allerdings sind die Differenzen minimal. So schwanken die Abstände immer im Bereich von 30 bis 35 Millisekunden, was im Spielverlauf aber nicht negativ auffällt. Stalker ist also eines der Spiele, in denen das Ruckeln nicht existiert.

Anders hingegen sieht es im 3DMark06 aus. Der Benchmark zeigt nicht nur extrem schwankende Zeitabstände in Fraps, er flackert auch ebenso unrund über den Bildschirm. Laut Fraps geben die Grafikkarten das erste Bild nach etwa 24 Millisekunden, das zweite nach 141 Millisekunden, das dritte nach 172 und das vierte Frame nach 289 Millisekunden an den Monitor weiter. Es hat also bis zum ersten Frame nur 24 Millisekunden, bis zum zweiten Frame aber schon viel längere 117 ms gedauert. Das dritte erscheint nach weiteren 31 ms, das vierte nach erneut 117 ms.

Da der 3DMark06 nicht unbedingt eine große Aussagekraft über das Verhalten in Spielen besitzt, haben wir uns die Frametimes auch noch in Call of Juarez und in Clive Barker's Jericho angeschaut – leider mit demselben Ergebnis. In Call of Juarez erscheint das erste Frame nach 41 ms, das zweite nach 103 ms, das dritte nach 115 ms und das vierte nach 166 ms auf dem Bildschirm. Daraus ergeben sich unterschiedliche Abstände von 41 ms, 62 ms, 12 ms und 51 ms. Ähnliches zeigt sich in Jericho: Dort liegen die Zeitintervalle für die ersten vier Frames bei 55 ms, 20 ms, 56 ms und dann wieder bei 20 ms. Dasselbe verhalten zeigen das heute getestete 3-Way-SLI und CrossFire von ATi.

Und ist eine Lösung für dieses Problem in Sicht? Darauf haben wir zur Zeit leider keine Antwort, da – zumindest offiziell – nicht eindeutig klar ist, worin denn überhaupt genau die Ursache liegt. Sowohl ATi als auch Nvidia kennen das Problem und möchten uns weitere Informationen dazu geben. Bis jetzt haben wir von beiden Chipspezialisten aber noch keine weiterführende Antwort bekommen. René Fröleke, Technischer PR-Manager bei AMD, hat uns bis jetzt immerhin eine kleine Vermutung zu diesem Problem gegeben.

Seiner Meinung nach wäre es möglich, dass die Mikroruckler kein Problem des Treibers oder der Multi-GPU-Technik sind, sondern vielmehr der Programmierweise einiger Spielen entstammen. Manche komplexe Objekte werden bei gewissen Rendertechniken nicht Frame für Frame wieder neu berechnet, da dies ein zu großer Aufwand wäre. Wenn nun die eine Grafikkarte das komplexe Objekt fertig berechnet hat und an die andere weitergibt (die somit das Objekt nicht neu berechnen muss), kann diese das Frame früher fertigstellen, womit natürlich eine unruhige Wiedergabe der einzelnen Frames gegeben wäre. Wir bleiben an dieser Sache auf jeden Fall dran.

Auf der nächsten Seite: Synthetische Benchmarks