ForceWare 65.62: Woher kommt die Performance?

Carsten Spille
53 Kommentare

Nachdem am gestrigen Tage bereits der höchst inoffizielle ForceWare-Treiber mit der Versionsnummer 65.62 aufgetaucht war (wir berichteten) und auch ein paar kurze Benchmarks gefahren wurden, haben wir uns dieses interessante Stück Software heute einmal etwas genauer angesehen.

Wie gestern schon bemerkt, gibt es im Treibermenü eine neue Optimierung zu bestaunen, die den Namen „Anisotropic Sample Optimization“ trägt.

Optimierungen im ForceWare 65.62
Optimierungen im ForceWare 65.62

Im Gegensatz zur Optimierung des trilinearen Filters, der das wirklich trilinear gefilterte Band stark verschmälert, und der anisotropen MipMap-Level Optimierung, die außer der Basistextur alle weiteren Texturstufen nur noch mit bilinearem Filter bedenkt, wie ATi es vorgemacht hat, wirkt diese Optimierung subtiler. Laut nVidia hätte man so eine Optimierung allerdings schon weitaus früher vermuten dürfen, denn schon die allererste Intellisample-Implementierung im auch als nV30 bekannten Chip der GeForce FX5800 sollte die verwendete Anzahl der Textursamples, die man mit bloßem Auge in Bewegung noch qualitätssteigernd wahrnimmt, auf ein Minimum reduzieren.

So intelligent und analytisch wie das Marketing es uns einreden will, geht dabei natürlich kein Chip vor. Vielmehr werden Texturen auf ihren Kontrast in- und zueinander hin untersucht und die verwendete Sample-Anzahl dabei reduziert. Wenn der entsprechend vorgegebene Wert dabei passend zum Texturinhalt eines gegebenen Spiels und der Wahrnehmungsfähigkeit des Anwenders gewählt wurde, kann so, ohne optische Einbußen, eine Absenkung der benötigten Samples und damit einhergehend eine Steigerung der erreichbaren Bildwiederholraten erreicht werden.

Leider ist es bislang so, dass die entsprechenden Funktionen, auch als Algorithmus glorifiziert, sehr statisch sind und mitnichten immer dem Texturinhalt angepasste Samplezahlen verwenden. Auch hier gab es in der Vergangenheit Berichte.

Nachdem nun in einer Reihe von Tests, Reviews und Artikeln dokumentiert wurde, dass nVidias neuestes Flaggschiff, die GeForce 6800 Ultra, nicht oder nur mit Mühe mit ATis Pendant, der Radeon X800 XT Platinum Edition, mithalten konnte und auch die kürzliche Berichterstattung über die Performance in Doom 3 nur ein Spiel unter vielen abdeckt, hat man sich bei nVidia für die 65er-ForceWares, die laut Gerüchten im Vorfeld schon einen großen Performanceschub bringen sollten, nun auch für den Weg der einfacheren Texturfilterung entschieden.

Da nicht nur unser Bericht dem ForceWare 65.62 eine deutliche Leistungssteigerung gegenüber dem kürzlich offiziell verfügbaren 61.77er bescheinigte, wollten wir dem Ursprung dieser Leistungsexplosion, auch wenn es nur eine kleinere Detonation war, nachgehen.

Zu diesem Zwecke haben wir den alten VillageMark, der sich in Zeiten moderner Hidden-Surface-Removal Techniken in den GPUs zu einem recht zweckmäßigen Füllratentest entwickelt hat, in der hohen Auflösung von 1600x1200 Pixeln und 32 Bit Farbtiefe auf einer von nVidia zur Verfügung gestellten GeForce 6800 ein paar Mal durchlaufen lassen und dabei jeweils eine andere Einstellung der Optimierung gewählt. Zum Vergleich sind ebenfalls Werte mit dem offiziellen ForceWare 61.77 enthalten. Der besseren Unterscheidbarkeit zuliebe haben wir die erreichten Frameraten in die umgesetzte Füllrate umgerechnet und den Graphen ein wenig abgeschnitten - so lassen sich zumindest bei genauerem Hinsehen die einzelnen Kurven noch gut unterscheiden.

GeForce 6800 und ForceWare 65.62
GeForce 6800 und ForceWare 65.62

Die Legende erklärt sich folgendermaßen: zusätzlich zur Treiberversion haben wir die möglichen Optimierungen von oben nach unten angegeben - für den ForceWare 65.62 sind dies Trilinear-, Anisotropic MipFilter- und Anisotropic Sample Optimization. Der offizielle 61.77 kennt letztere nicht, so dass hier nur die trilineare Optimierung und anisotrope MipFilter Optimierung wirken können.

Zur Beruhigung sei vorweg gesagt, dass es so scheint (immer vorausgesetzt, man kann den Ergebnissen des VillageMark noch trauen), als sei die komplette Abschaltung aller Optimierungen der Texturfilter weiterhin möglich - die Graphen für diesen Modus, der nur durch die Auswahl von „Hohe Qualität“ erreicht werden kann, haben wir zu einem einzigen zusammengefasst.

Zwischen diesem und dem Modus mit allen aktiven Optimierungen liegen stolze 61 Prozent Zugewinn an effektiv nutzbarer Füllrate - die natürlich in realen Spielen nur äußerst selten 1:1 umgesetzt werden kann. Weiter fällt auf, dass die trilineare Optimierung allein nur für einen Bruchteil des Performancegewinns zuständig ist und im Gegenteil an erster Stelle der zugewinnträchtigen Einzeloptimierungen die neu hinzugekommene „Anisotropic Sample Optimization“ steht, die, so vermuten wir derzeit, ähnlich den von uns beschriebenen Reg-Einträgen R420AnisoLOD und RV350ANTHRESH arbeitet, kurz gefaßt also mit unpassender Reduktion und Steigerung der genutzen AF-Samples. Wir versuchen, das in den kommenden Tagen mit den entsprechenden Methoden genauer zu untersuchen.

Weiterhin interessant ist auch die Tatsache, dass selbst mit augenscheinlich gleichem Optimierungsstand, nämlich mit der neu hinzugekommenen Optimierungsmethode abgeschaltet, der neue Treiber mehr Füllrate zur Verfügung hat, als es die offiziellen ForceWare 61.77 haben. Dies kann, da sowohl die Ergebnisse für den „Hohe Qualität”-Modus, als auch die Ergebnisse ohne anisotrope Filterung sich zwischen den Treibern nicht unterscheiden, nur bedeuten, dass zusätzliche Optimierungen im Bereich des anisotropen Filter stattfinden, die sich nur über „Hohe Qualität”, nicht aber über die drei angebotenen Schalter deaktivieren lassen. Die Ergebnisse ohne anisotrope Filterung haben wir aus dem Diagramm herausgenommen, da sie ausschließlich nach Schalterstellung der trilinearen Optimierung zwischen 247,68 (aktiv) und 226,56 (inaktiv) alternierten.

Als kleines Zwischenfazit können wir sagen, dass unsere Befürchtungen eingetreten sind: Die Jagd nach längeren Benchmarkbalken fordert immer neue Opfer - unschuldige Textursamples. Zum Glück und als lobenswerten Umstand nicht unerwähnt bleibt aber die Möglichkeit, auch in den neuesten Auswüchsen des Balkenlängenwahns die Verringerung der Qualität zu stoppen und dort, wo die Leistung im Überschuss vorhanden ist, die volle, ungetrübte Filterung der teuer bezahlten Grafikhardware zu genießen.

Jeder mag zu den Optimierungen stehen wie er will - der eine sieht es, der andere bildet sich ein, es zu sehen und ein dritter bemerkt es nicht oder will es nicht bemerken. Eines sollten wir als User jedoch nicht vergessen: Je weniger Protest über verminderte Filterqualität, auch den Entwicklern der Grafikkarten gegenüber, laut wird, desto eher wird uns in Zukunft vielleicht die Möglichkeit genommen, selbst zu entscheiden, wieviel Filterung gut für uns ist!