John Carmack über nV30 und R300

Carsten Spille
44 Kommentare

John Carmack, seines Zeichens OpenGL-Guru und Chefentwickler von id-Software, hat sich in seinem aktuellen .plan-Update über einige interessante Details bezüglich der Chips hinter der GeForce FX und der Radeon 9700 Pro geäußert.

In besagtem Update bezeichnet er den nV30 interessanterweise keineswegs als durchweg schneller, sondern muss klar differenzieren.

So gibt es für beide Chips verschiedene Möglichkeiten Doom III darzustellen. Die beiden jeweils einfachsten Modi setzen auf der puren OpenGL-API ohne herstellerspezifische Extensionen auf (ARB) bzw. verwenden den Codepfad, den Carmack zur Kompatibiltät mit alten Grafikkarten vom Schlage einer GeForce256 einfügen musste (nV10). Diese sind allerdings über die Maßen langsam (auch auf aktueller Hardware), so dass vom Leistungsaspekt her erst die Modi interessant werden, die mit den Mitteln von GeForce3 und Radeon8500 gewinnnbringend umzugehen wissen (R200), im Falle der GeForce FX sind jedoch erst der spezielle nV30-Codepfad bzw. der schon die neuen Extensionen äquivalent zu DirectX-Shadern 2.0 verwendende ARB2-Pfad.

Einen wirklich fairen Leistungsvergleich wird es hier leider kaum geben können, da R300 und nV30 intern zu unterschiedlich aufgebaut sind. So rechnet der R300 intern beim Einsatz von FP-Genauigkeit immer mit einer Präzision von 24Bit pro (Farb-)Kanal, der nV30 kann jedoch entweder nur in einem schnellen Modus 16Bit FP oder gleich die vollen 32Bit FP pro Kanal seine Bildpunkte berechnen. Je nach verglichenem Modus ist also einer der Chips immer im Nachteil.

Nachdem dies vorweggeschickt wurde nun zu den wirklich interessanten Dingen, die Herr Carmack von sich gab.

Im allgemeinen sei momentan die GeForce FX in den meisten Szenarien etwas schneller als der R300, aber nur, wenn der spezielle nV30-Codefpad verwendet wird. Inwieweit dabei auf 16Bit-Präzision (wohlgemerkt, pro Kanal, also insgesamt immer noch stattliche 80Bit! [Korrektur: Es sind natürlich nur 64Bit. Dank an "der elektriker"]) zurückgegriffen wird, hat J.C. noch nicht verlauten lassen.

Wenn nun aber der allgemeine, sprich herstellerunabhängige ARB2-Rechenpfad genutzt würde, sei der R300 teils doppelt so schnell, wie der nV30. Auch hier steht die Vermutung, dass dies wohl zum Teil an unausgereiften Treibern und/oder der durchgängigen 4x32Bit Präzision der GeForce FX liegen könnte. Für ersteres erhielt er, wie kaum verwundern dürfte, auch prompt eine Bestätigung von nVidia, dass die Treiber noch einiges an Optimierungspotential böten.

Weiterhin bescheinigt er ATi zum wiederholten Male, dass die Treiber besser und besser würden und nur noch wenig hinter seinem "gold standard" ( =nVidia) lägen. Obschon er in seinem primären System weiterhin eine nVidia-Karte (GeForce FX, die nach seinem Bekunden aber "annoyingly noisy" ist) verwendet, meint er, dass für den Endkunden die Wahl zur besten Karte keineswegs so eindeutig sei. Ihm als Entwickler aber behagten die größeren Potenziale bei der Shaderprogrammierung des nV30 mehr, da er bei ATi schon an die Grenzen des Machbaren gestossen sei.

Das non-plus-ultra sei jedoch noch keine der beiden Lösungen (wenn es so etwas überhaupt gibt). Wer warten kann, ist, wie immer, besser dran.

Nvidia GTC 2024 (18.–21. März 2024): ComputerBase ist vor Ort!