Das gute an dem 8*1 Design ist, dass eigentlich
gar keine TMUs wegfallen, da ja jedes Pixel mit mind. einer Textur beklebt ist.
4TMUs (wie in deinem Beispiel) kommt ja auch nicht so ganz hin, da alle aktuellen Grakas (GF3, 4TI, Radeon8500, Radeon 9700) 8TMUs haben, sie sind nur etwas anders verteilt.
Nehmen wir mal an, UT2003 nutzt im Schnitt 4 Texturen (Base, Detail, Specular und Bump) so könnte
im Schnitt die GF4 genauso effektiv (nicht genauso schnell!!) rendern, wie die Radeon9700.
In bestimmten Situationen aber, wo nur drei, oder aber 5 Texturen benötigt werden, wird die Rechnung etwas anders.
Beispiel 1 (3 Texturen):
Radeon9700 braucht pro Pixel 3 Durchläufe (aber nur einen Rendering-Pass, weil sie erst nach den 3 aufgetragenen Texturen in den Speicher schreibt), kann dafür aber in diesen 3 Zyklen 8 Pixel bearbeiten (wegen der 8 parallelen Pipelines).
Ergebnis (zur besseren Vergleichbarkeit auf das KGV gerechnet): 6 Zyklen, 16 dreifach texturierte Pixel, zwei Passes
GeForce4Ti braucht pro Pixel nur zwei Durchläufe (ebenfalls nur einen Rendering-Pass, weil sie einfaches Loop-Back beherrscht), nutzt aber im zweiten Durchgang nur eine der beiden TMUs je Pipeline. Sie berechnet in 2 Zyklen 4 Pixel mit je drei Texturen.
Ergebnis (zur besseren Vergleichbarkeit auf das KGV gerechnet): 6 Zyklen, 12 dreifach texturierte Pixel, drei Passes
--> Also hier schon ein 33% Vorteil für das 8*1 Design (sogar ohne die zusätzliche Bandbreite für den zusätzlichen Pass)
Beispiel 2 (4 Texturen):
Radeon9700: 4 Zyklen, ein Pass, 8 Pixel
GeForce4 TI: 2 Zyklen, ein Pass, 4 Pixel
Normalisiert sind hier die Designs gleichwertig, da hüben wie drüben alle TMUs vollständig genutzt werden können (außer, daß die GF4 für dieselbe Anzahl Pixel (8) einen kompletten zweiten Rendering-Pass benötigen würde, welcher natürlich nicht zum Preis von weiteren 2 Zyklen zu bekommen ist, also ein deutlicherer Vorteil für das 8*1 Design).
Beispiel 3 (5 Texturen):
Radeon9700: 5 Zyklen, ein Pass, 8 Pixel
GeForce4 TI: 3 Zyklen, zwei Passes, 4 Pixel
Nun wird's kriminell: Auf 15 Zyklen normalisiert, schafft die Radeon 24 fünffach Texturiert Pixel in drei Rendering-Passes. Die GeForce4 schafft in 15 Zyklen 20 Pixel mit je fünf Texturen, braucht allerdings
10 Rendering-Passes dafür.
Ich hoffe, ich bin verständlich geblieben.....
