4/7 Vorstellung des GeForce4 : nVidia schlägt zurück

, 11 Kommentare

nFiniteFX Engine II

Im Prinzip handelt es sich hierbei um genau den Pixel- und Vertexshader, der vor beinahe 12 Monaten im GeForce3 programmierbare Transform und Lighting Effekte in den Consumermarkt brachte. Hier noch einmal eine kurze Erläuterung zur originalen nFiniteFX-Engine. Im Wesentlichen besteht diese aus den sogenannten Pixel- und Vertexshadern, welche für Manipulationen an den einzelnen Bildpunkten und den zugehörigen Texturoperationen bzw. an den grundlegenden Geometriedaten zuständig sind. Ähnlich wie die Hardware T&L-Einheit der alten GeForce2-Serie.

Der große und entscheidende Unterschied zwischen der sogenannten DirectX-7-T&L (GeForce2) und DirectX-8-T&L (GeForce3) liegt darin, dass man mit der alten Hardware nur einige wenige Effekte bzw. Operationen möglich waren, die von nVidia (und DirectX) fest vorgegeben waren. Mit den neuen Shadern war es nun erstmals möglich, dass jeder Spieleentwickler die für ihn wichtigen Operationen innerhalb gewisser Grenzen frei programmieren konnte und das nicht nur für die Geometrie, also das Dreiecksgerüst einer Szene, sondern auch für jeden einzelnen Bildpunkt. Das bedeutet im Endeffekt, dass, wie der Name schon dezent andeutet, rein rechnerisch nahezu beliebige Effekte mit den verwendeten Texturen und Polygonen möglich sind. Dass es doch etwas besser geht, bewies ein halbes Jahr später ATi mit ihrer Radeon8500, der die Anzahl der möglichen (abhängigen) Texturoperationen und Farbwerte noch etwas flexibler handhabte.

4x4 Evolution 2 nutzt Vertex und Pixel-Shader
4x4 Evolution 2 nutzt Vertex und Pixel-Shader
City of Heros nutzt Vertex und Pixel-Shaders
City of Heros nutzt Vertex und Pixel-Shaders

Im Unterschied zum GeForce3 ist beim GeForce4 nun ein zweiter Vertex-Shader vorhanden, der sicherlich einen Großteil der zusätzlichen 6 Millionen Transistoren ausmachen dürfte und für einen ordentlichen Schub bei der Geometrieverarbeitung sorgen sollte. "Sollte" deswegen, weil wir aufgrund der vom GeForce3 bekannten Daten (ca. 50M Vertices/s per Vertex-Shader oder 25M Dreiecke/s nach DirectX-7) von einer etwas höheren Geometrieleistung als den offiziell angegebenen 136M Vertices/s ausgegangen waren. Rein rechnerisch sollten ca. 150M Vertices/s möglich sein, wenn man bedenkt, das der Vertexshader nun sowohl doppelt vorhanden als auch um 50% höher getaktet ist. Offiziell wird von nVidia auch eine bis zu dreimal höhere Vertexshaderleistung angegeben, die Daten, um dies zu verifzieren, also entsprechende Angaben zum GeForce3, sind leider nicht zu erhalten.

Codecreatures Engine Wassereffekte nutzen Vertex und Pixel-Shaders
Codecreatures Engine Wassereffekte nutzen Vertex und Pixel-Shaders
Comanche 4 auch hier kommen die Shaders zum Einsatz
Comanche 4 auch hier kommen die Shaders zum Einsatz

Der nächste Punkt betrifft den nun ebenfalls leistungsfähiger ausfallenden Pixelshader. Nvidia spricht hier von "Advanced Pixelshader Pipelines", die gegenüber einem GeForce3 um bis zu 50% schneller arbeiten sollen. Das entspricht zufällig wiederum genau der Taktsteigerung von 100MHz und deutet auf eine unveränderte Übernahme hin. Die von vielen erwartete und erhoffte Implementierung der Pixelshader in Version 1.4, wie es ATis Radeon8500 seit mehr als einem halben Jahr bietet, scheint seitens der Kalifornier nicht gewünscht zu sein, gäbe man damit doch einen technologischen Rückstand der GeForce3 gegenüber der Radeon8500 zu. So wird nun versucht, diese an sich begrüßenswerte Entwicklung der Konkurrenz mittels der Marktüberlegenheit totzuschweigen. Entweder dies, oder es erfordert doch ein aufwendiges Redesign des gesamten Pixelshaders, um die Veränderungen gegenüber den Versionen 1.0-1.3, die vom GeForce3 bereits unterstütz werden, einfließen zu lassen, dass man in der Kürze der Zeit nicht hinbekommen hat.

Dieses Feature entfällt komplett für die GeForce4 MX-Serie, die sich mit einer Hardware Transform and Lighting Einheit nach dem Vorbild des GeForce2 zufrieden geben muss. Aufgrund der durchweg höheren Taktraten wird diese jedoch leistungfähiger als bisher ausfallen, im wesentlichen aber unverändert bleiben.

Auf der nächsten Seite: Light-Speed Memory Architecture II