nVidia GeForce 6200 TurboCache: Zahlenspiele mit 32 und 64 Bit

Jan-Frederik Timm
16 Kommentare
nVidia GeForce 6200 TurboCache: Zahlenspiele mit 32 und 64 Bit

Überblick

nVidia hat die in den letzten Tagen bereits hier und da erwähnte GeForce 6200 TurboCache nun offiziell vorgestellt. Was sich hinter den blumigen Marketing-Schlagwörtern und Bandbreiten tatsächlich verbirgt, wollen wir an dieser Stelle genauer durchleuchten.

Basierten die bisher verfügbaren und von nVidia vor etwas über zwei Monaten vorgestellten GeForce 6200-Karten auf dem NV43, einem nativen PCI Express-Chip mit acht Pipelines, der um weitere vier Pipelines beschnitten wurde, fußen die neuen Modelle, die den Beinahmen TurboCache (TC) tragen, auf dem NV44, der nur noch vier Pipelines, vier Vertex-Shader und zwei ROPs (6600 = 4) in sich birgt. Darüber hinaus wurde dem Chip der direkte Zugriff auf den Systemhauptspeicher spendiert - TurboCache wart geboren.

TurboCache

TurboCache erweckt ein schon zu AGP-Zeiten angerauntes Feature zu neuem Leben, das es der Grafikkarte ermöglicht, über den PCI Express-Bus direkt in den Hauptspeicher zu rendern. D.h. der Arbeitsspeicher dient nicht nur der Vorlagerung von Daten, die vor der eigentlichen Berechnung in den Speicher der Grafikkarte geschoben werden. Er kann zu einem Teil als Quasi-Grafikspeicher angesehen werden. TurboCache verspricht, erstmals einen wirklichen Nutzen aus PCI Express ziehen zu können und günstige Grafikkarten mit wenig lokalem Speicher möglich zu machen, wobei der Leitungseinbruch gegenüber bisherigen Technologien in Grenzen gehalten werden kann. Die zugewiesene Menge an RAM kann die Grafikkarte hierbei dynamisch in Eigenregie festlegen, wobei nVidia bei FarCry beispielsweise 76 MB angibt.

TurboCache-Architektur
TurboCache-Architektur

Bis zuletzt konnte leider nicht geklärt werden, wie es sich mit dem von der Grafikkarte maximal zu adressierenden Speicher verhält. nVidias Material widerspricht sich hier teilweise selbst, ein Ansprechpartner war bis 15:00 nicht zu erreichen. Entgegen erster Informationen ist der 6200 TC zumindest in den größeren Varianten in der Lage, bis zu 256 MB Speicher zu verwalten. Die obige Grafik impliziert jedoch, dass sich das Maximum aus der Addition von lokalem Speicher und dem über PCIe angesteuerten Arbeitsspeicher ergibt. Ob dies zutrifft und inwiefern lokaler Speicher und/oder Speicherinterface darauf Einfluss nehmen, ob 128 MB oder 256 MB angesprochen werden können, werden wir hoffentlich noch im Laufe des Tages beisteuern können.

Update: 16.12.2004

Bandbreiterei

GeForce 6200 TurboCache-Karten sind von nVidia auf 350 MHz Chiptakt spezifiziert, unterscheiden sich untereinander jedoch in Sachen Onboard-Speicher (Menge, Takt) und maximaler Speicherbandbreite. Vorgestellt wurden am heutigen Tag zwei Modelle:

  • GeForce 6200 TurboCache @ 10,8 GB/s
  • GeForce 6200 TurboCache @ 13,6 GB/s

Wir wollen beide Alternativen anhand eines kleinen Rechenbeispiels erläutern und eventuelle Schwachstelle in den stilistisch einwandfreien Rechengängen kommentieren.

Eine GeForce 6200 TurboCache @ 10,8 GB/s besitzt 16 MB Onboard-Grafikspeicher mit einer Anbindung von 32 Bit. Bei einem Speichertakt von nur 350 MHz (effektiv 700 MHz) ergibt sich für diesen Speicher des Typs DDR1 eine Speicherbandbreite von 2,8 GB/s (eine 6200 auf Basis des NV43 schafft mit 128 MB bei 64 Bit 4,4 GB/s, bei 128 Bit 8,8 GB/s).

Rechnung 1
Rechnung 1

Zu diesen 2,8 GB/s rechnet nVidia nun die theoretisch maximale Bandbreite der PCI Express X16-Schnittstelle hinzu. Pro Richtung ergeben sich bei 16 Leitungen und einem Takt von 2,5 GHz theoretisch satte 4 GB/s. Da PCI Express gleichzeitig in beiden Richtungen senden kann, ergeben sich für eine GeForce 6200 TurboCache mit 32-Bit-Onboard-Speicher auf dem Papier 10,8 GB/s. Rein theoretisch ist die Bandbreite zum Hauptspeicher größer als zum OnBoard-RAM.

Analog hierzu bringt es eine mit einem 64-Bit-Interface ausgestattete GeForce 6200 TurboCache-Karte auf 13,6 GB/s, da der Onboard-Speicher hier bei einem Takt von effektiv 700 MHz auf 5,6 GB/s kommt.

Rechnung 2
Rechnung 2

Den Herstellern steht es laut nVidia frei, Karten mit 16, 32 oder 64 MB Speicher auf den Markt zu bringen, wobei es sich bei der kleinsten Version um ein 32-Bit-Modell, bei den beiden größeren hingegen um 64-Bit-Modelle mit doppelseitiger Bestückung handeln sollte. Halten sich die Hersteller an die Taktvorgabe von effektiv 700 MHz, kommt es so zu den theoretischen Bandbreiten von 10,8 GB/s (16 MB) respektive 13,6 GB/s (32 und 64 MB). Auch wenn der NV44 Speicher auch mit 128 Bit adressieren können soll, ist von derartigen Lösungen bisher nichts zu sehen. Von Versionen für nVidias MXM-Modul für Notebooks hingegen schon.

Theorie...

TC-Theorie
TC-Theorie

... und Praxis

Was sich auf dem Papier noch so leicht daher rechnet, hängt in der Praxis jedoch an einer ganze Reihe von Haken. An erster Stelle wäre hier der PCIe-Bus zu nennen, der auf einem NV45 (6800 GT) mit ForceWare 71.20 im 3D Download Benchmark aktuell mit 700 MB/s in eine Richtung belastet wird. Auch wenn davon ausgegangen werden kann, dass nVidia den NV44 samt Treiber auf das Auslagern hin optimiert hat, wir dieses leider in Ermangelung eines Testsamples nicht überprüfen können, dürften vier Gigabyte pro Richtung eine Illusion sein. Zumal der einzige Speicher, der den PCIe-Bus derzeit mit 8 GB/s versorgen kann, Dual-DDR2-533 darstellt. Bei Dual-DDR400 ist bei 6,4 GB/s und somit spätestens beim Speicher Schluss. Dass insbesondere aktuelle CPUs den Arbeitsspeicher exzessiv nutzen und die maximale Arbeitsspeicher-Bandbreite der Grafikkarte somit nie zur Verfügung stehen wird, wird in nVidias-Rechung ebenfalls nicht betrachtet.