Dominator
Lt. Junior Grade
- Registriert
- Juli 2004
- Beiträge
- 447
ein auszug von 3d center:
Unseren Doom 3 Artikel, der versucht, das gute Abschneiden des NV40 im Vergleich zum R420 zu erklären, möchten wir jetzt zumindest in Teilen entkräften. Nach neuesten Erkenntnissen ist die Theorie, dass der R420 im Z/Stencil-Pass deutlich langsamer die Pixel verwirft (wodurch das gesamte Rendering verlangsamt würde) zumindest nicht in der Härte zutreffend, wie der Artikel behauptet. Der NV40 hat zwar eine geringere Verwerf-Maximalleistung, diese aber mit feinerer Granularität als R420. Daraus könnte sich letztlich doch noch ein kleiner Vorteil für den NV40 ergeben. Außerdem gibt es weiterhin einige Situationen, in denen der R420 den HierarchicalZ-Mechanismus nicht nutzen kann ...
... Doch die Unterschiede in der Leistung pro Takt sind damit nicht befriedigend erklärt. nVidia scheint im Treiber "Optimierungen" ähnlicher Art vorgenommen zu haben, mit welchen nVidia seit langem alle Q3A-Benches gewinnt: Abfangen und ersetzen von CPU-lastigen Calls durch weniger CPU-lastige, bzw. spezielle Optimierungen, welche auf die Q3A- und jetzt die D3-Engine besondere Rücksicht nehmen. Zudem wird in Doom 3 kreatives Shaderreplacement betrieben: Offenbar hat nVidia eine Lösung gefunden, Alternativshader zu nutzen, ohne die Bildqualität zu beeinträchtigen ...
... Daraus ergeben sich zunächst zwei Schlussfolgerungen: Die Geschwindigkeit in Doom 3 ist weniger der NV40-Architektur zuzuschreiben, als wir das zunächst dargestellt haben. Zweitens ist dann vielleicht auch für Radeon-Grafikkarten noch ein Speed-Up drin. Es ist aber auch nicht auszuschließen, dass nVidia die Doom 3 Optimierung noch weiter treiben kann. Hieraus folgt dann wieder, dass man die generelle Spiele-Tauglichkeit von Grafikkarten nicht anhand weniger, "repräsentativer" Spiele festmachen kann. Bessere Leistung in Doom 3 heißt weder bei ATi noch bei Nvidia, dass damit zwangsläufig die jeweilige Hardware-Architektur besser ausgenutzt würde. Eine bessere Hardware-Ausnutzung könnte in diesem Fall vorliegen, doch vielleicht handelt es sich auch nur um Treiber-Optimierungen ...
... Um ein allgemeines Statement zum Shaderreplacement abzugeben: Dass der "Original-Shader" genau so ausgeführt wird, wie er ist, kann man heutzutage nicht mehr verlangen: Eingebaute allgemeine Shader-Optimierungen, welche das Resultat nicht ändern, sind prinzipiell immer zulässig. Schwierig wird es, wenn handoptimierte Verfahren genutzt werden. Doch so lange nicht das Gegenteil gezeigt wird, nehmen wir an, dass nVidia in Doom 3 "nur" Dinge zur Leistungssteigerung ausnutzt, welche bei der Programmierung des Spiels übersehen wurden. Dennoch ist Handoptimierung auf einen Benchmark (Doom 3 ist ein Quasi-Standardbenchmark) grundsätzlich kritisch zu sehen.

Unseren Doom 3 Artikel, der versucht, das gute Abschneiden des NV40 im Vergleich zum R420 zu erklären, möchten wir jetzt zumindest in Teilen entkräften. Nach neuesten Erkenntnissen ist die Theorie, dass der R420 im Z/Stencil-Pass deutlich langsamer die Pixel verwirft (wodurch das gesamte Rendering verlangsamt würde) zumindest nicht in der Härte zutreffend, wie der Artikel behauptet. Der NV40 hat zwar eine geringere Verwerf-Maximalleistung, diese aber mit feinerer Granularität als R420. Daraus könnte sich letztlich doch noch ein kleiner Vorteil für den NV40 ergeben. Außerdem gibt es weiterhin einige Situationen, in denen der R420 den HierarchicalZ-Mechanismus nicht nutzen kann ...
... Doch die Unterschiede in der Leistung pro Takt sind damit nicht befriedigend erklärt. nVidia scheint im Treiber "Optimierungen" ähnlicher Art vorgenommen zu haben, mit welchen nVidia seit langem alle Q3A-Benches gewinnt: Abfangen und ersetzen von CPU-lastigen Calls durch weniger CPU-lastige, bzw. spezielle Optimierungen, welche auf die Q3A- und jetzt die D3-Engine besondere Rücksicht nehmen. Zudem wird in Doom 3 kreatives Shaderreplacement betrieben: Offenbar hat nVidia eine Lösung gefunden, Alternativshader zu nutzen, ohne die Bildqualität zu beeinträchtigen ...
... Daraus ergeben sich zunächst zwei Schlussfolgerungen: Die Geschwindigkeit in Doom 3 ist weniger der NV40-Architektur zuzuschreiben, als wir das zunächst dargestellt haben. Zweitens ist dann vielleicht auch für Radeon-Grafikkarten noch ein Speed-Up drin. Es ist aber auch nicht auszuschließen, dass nVidia die Doom 3 Optimierung noch weiter treiben kann. Hieraus folgt dann wieder, dass man die generelle Spiele-Tauglichkeit von Grafikkarten nicht anhand weniger, "repräsentativer" Spiele festmachen kann. Bessere Leistung in Doom 3 heißt weder bei ATi noch bei Nvidia, dass damit zwangsläufig die jeweilige Hardware-Architektur besser ausgenutzt würde. Eine bessere Hardware-Ausnutzung könnte in diesem Fall vorliegen, doch vielleicht handelt es sich auch nur um Treiber-Optimierungen ...
... Um ein allgemeines Statement zum Shaderreplacement abzugeben: Dass der "Original-Shader" genau so ausgeführt wird, wie er ist, kann man heutzutage nicht mehr verlangen: Eingebaute allgemeine Shader-Optimierungen, welche das Resultat nicht ändern, sind prinzipiell immer zulässig. Schwierig wird es, wenn handoptimierte Verfahren genutzt werden. Doch so lange nicht das Gegenteil gezeigt wird, nehmen wir an, dass nVidia in Doom 3 "nur" Dinge zur Leistungssteigerung ausnutzt, welche bei der Programmierung des Spiels übersehen wurden. Dennoch ist Handoptimierung auf einen Benchmark (Doom 3 ist ein Quasi-Standardbenchmark) grundsätzlich kritisch zu sehen.
Zuletzt bearbeitet: