Im November des Jahres 2006 ließ Nvidia eine Bombe platzen und präsentierte die G80-GPU in Form der GeForce 8800 GTX sowie der kleineren GeForce 8800 GTS der Öffentlichkeit. Während bei neuen Grafikkartenchips im Vorfeld normalerweise immer ein großes Interesse herrscht und dementsprechend haufenweise Gerüchte den Weg noch vor der Produktvorstellung ins World Wide Web finden, war in diesem Fall erst nach der Präsentation so richtig klar, dass die Kalifornier mit dem G80 eine ganz besondere GPU auf den Markt gebracht hatten. Die Grafikkarte war nicht nur deutlich schneller als die Vorgängergeneration, auch wurde die Bildqualität auf ein Niveau gehoben, das es vorher noch nicht gegeben hatte.
Einige Leser mögen sich nun sicherlich fragen, warum wir an dieser Stelle fast anderthalb Jahre in die Vergangenheit schauen? Nun, abgesehen von der GeForce 8800 Ultra und der vor kurzem erschienenen Radeon HD 3870 X2 von ATi hat sich im High-End-Segment seit anno 2006 nicht mehr viel getan – einzig die Multi-GPU-Technologien für Enthusiasten, CrossFire und SLI, haben einen Schritt nach vorne gemacht.
Am heutigen Tag lässt Nvidia nun jedoch erneut den roten Vorhang herunter, um Neues im High-End-Sektor zu präsentieren. Aber nicht mit einer neuen GPU, sondern mit einer Multi-GPU-Karte, die auf zwei G92-Chips basiert, der bis jetzt als Einzelexemplar auf Grafikkarten für das Performance-Segment eingesetzt wurde.
Der Name der Grafikkarte lautet GeForce 9800 GX2, womit man nach der gehobenen Mid-Range-Karte GeForce 9600 GT also zugleich auch noch den zweiten 3D-Beschleuniger der GeForce-9-Serie vorstellt. Die GeForce 9800 GX2 erinnert dabei stark an die GeForce 7950 GX2, Nvidias ersten und weniger erfolgreichen Gehversuch mit Multi-GPU-Karten im Desktop-Markt. Die „Sandwichbauweise“ wird auch auf der neuen Grafikkarte übernommen, wurde allerdings verfeinert, damit es zu keinen Schwierigkeiten im Betrieb mehr kommt. Die G92-Chips auf dem neuen 3D-Beschleuniger bieten die Vollausbaustufe und somit unter anderem je 128 ALUs, 64 Textureinheiten sowie ein 256 Bit breites Speicherinterface.
Nvidia konnte uns freundlicherweise ein Exemplar der GeForce 9800 GX2 für einen Artikel zur Vorstellung stellen. Point of View hat uns ebenfalls mit der neuen Grafikkarte beliefert und somit werden wir in Kürze einen Quad-SLI-Artikel online stellen. Allerdings erst, wenn das spezielle Quad-SLI-Schweigeabkommen gefallen ist. Bis dahin wird die Einzelkarte zeigen müssen, ob Nvidia ein probates Mittel gegen die Radeon HD 3870 X2 gefunden hat. Zumindest nach eigenen Angaben hat man sogar mehr als dies: Die GeForce 9800 GX2 soll ATis Flaggschiff bei weitem schlagen. Die kommenden Seiten werden zeigen, ob dies der Wahrheit entspricht.
Noch eine kleine Anmerkung in eigener Sache: Für diesen Artikel setzen wir erstmals ein neues Testsystem ein, das den gestiegenen Anforderungen moderner Grafikkarten genügen soll. Wer sich über die neue Hardware eingehend informieren möchte, wird im Abschnitt „Testsystem“ zu allen Neuigkeiten fündig.
Bevor wir uns mit den G92-GPUs auf der GeForce 9800 GX2 und ihrer Architektur im Detail beschäftigen, möchten wir mit den obligatorischen Spezifikationen des Chips/Karten starten.
| Radeon HD 3870 X2 | GeForce 8800 Ultra | GeForce 8800 GTS 512 | GeForce 9800 GX2 | |
| Logo |
|
|
|
|
| Chip | R680 (2x RV670) | G80 | G92 | 2x G92 |
| Transistoren | ca. 2x 666 Mio. | ca. 681 Mio. | ca. 754 Mio. | ca. 2x 754 Mio. |
| Fertigung | 55 nm | 90 nm | 65 nm | 65 nm |
| Chiptakt | 825MHz | 612 MHz | 650 MHz | 600 MHz |
| Shadertakt | 825MHz | 1512 MHz | 1625 MHz | 1512 MHz |
| Shader-Einheiten (MADD) | 2x 64 (5D) | 128 (1D) | 128 (1D) | 2x 128 (1D) |
| FLOPs (MADD/ADD) | 2x 528 GFLOPs | 581 GFLOPs* | 624 GFLOP/s* | 2x 581 GLOP/s* |
| ROPs | 2x 16 | 24 | 16 | 2x 16 |
| Pixelfüllrate | 2x 13200 MPix/s | 14688 MPix/s | 10400 MPix/s | 2x 9600 MPix/s |
| TMUs | 2x 16 | 64 | 64 | 2x 64 |
| TAUs | 2x 32 | 32 | 64 | 2x 64 |
| Texelfüllrate | 2x 13200 MTex/s | 39168 MTex/s | 41600 MTex/s | 2x 38400 MTex/s |
| Shader-Model | SM 4.1 | SM 4 | SM 4 | SM 4 |
| Hybrid-CF/-SLI | X | X | X | √ |
| effektive Windows Stromsparfunktion | √ | X | X | X |
| Speichermenge | 2x 512 GDDR3 | 768 GDDR3 | 512 GDDR3 | 2x 512 GDDR3 |
| Speichertakt | 900 MHz | 1080 MHz | 970 MHz | 1000 MHz |
| Speicherinterface | 256 Bit | 384 Bit | 256 Bit | 256 Bit |
| Speicherbandbreite | 2x 57600 MB/s | 103680 MB/s | 62080 MB/s | 2x 64000 MB/s |
*Die von uns angegebenen GFLOP-Zahlen der G80-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.
Nvidia vertraut bei der GeForce 9800 GX2 auf zwei voll ausgebaute G92-GPUs. Diese werden im modernen 65-nm-Prozess bei TSMC hergestellt und bestehen aus satten 754 Millionen Transistoren – jeweils. Die Direct3D-10-Grafikkarte verfügt somit über zwei Mal 128 (mehr oder weniger) voneinander unabhängige skalare Shadereinheiten, die pro Takt ein MADD (Multiply-ADD) sowie ein MUL (Multiplikation) ausführen können. Während MADD durchgängig für das so genannte „General Shading“ (sprich für sämtliche anstehende Shaderoperationen) benutzt werden kann, sieht dies bei MUL anders aus. MUL ist zusätzlich als Special Function Unit (SFU), Perspektivenkorrektur oder als Attributinterpolator tätig und kann nur selten für General Shading verwendet werden. Dementsprechend fällt die reale Shaderleistung (oft gemessen in GFLOPs) niedriger aus, als man es anhand der nackten Zahlen (wenn man das MUL mit einbezieht) vermuten könnte.
Die Shadereinheiten haben auf der GeForce 9800 GX2 eine eigene Taktdomäne, die auf der Dual-GPU-Grafikkarte mit 1512 MHz arbeitet. Darüber hinaus sind auf der GeForce 9800 GX2 zwei Mal 64 vollwertige Textureinheiten verbaut, die pro Takt 64 Texel adressieren und filtern können. Zwei Mal 16 ROPs sorgen unter anderem für die Kantenglättung und die Tiefentests, damit nicht sichtbare Pixel vor dem eigentlichen Rendering verworfen werden können und somit keine unnötige Arbeit verrichtet werden muss. Die so genannte TMU-Domäne arbeitet auf der GeForce 9800 GX2 mit einer Frequenz von 600 MHz.
Die beiden G92-GPUs sind jeweils mit einem 256 Bit breiten Speicherinterface an den VRAM angebunden. Dieser ist auf dem Referenzdesign insgesamt 1024 MB groß, jeder Chip hat also seinen eigenen 512 MB großen Speicher. Die Taktfrequenz liegt bei 1000 MHz. Jede GPU sitzt mit ihren dazugehörigen Komponenten auf der Nvidia GeForce 9800 GX2 auf einem eigenen PCB. Es gibt also zwei Platinen, die mit dem hauseigenen nForce-200-Chip verbunden sind. Somit ist die GeForce 9800 GX2 im Gegensatz zur ATi Radeon HD 3870 X2 kompatibel zum neuen PCIe-2.0-Standard. Der nForce 200 ist mit je 16 PCIe-Lanes an die GPUs angebunden und kann mit weiteren 16 Lanes mit der Außenwelt kommunizieren. Zu Problemen mit der Bandbreite sollte es auf der Multi-GPU-Karte also nicht kommen.
Die GeForce 9800 GX2 benutzt die SLI-Technologie, damit die beiden Grafikchips Daten untereinander austauschen können. Dabei kommt mittlerweile beinahe ausschließlich AFR (Alternate Frame Rendering) zum Einsatz, sprich jede GPU rendert ein eigenes Frame. Dies stellt die derzeit optimale Methode zur Performanceverbesserung dar, da AFR auch die Geometrie beschleunigen kann. Auch Quad-SLI wird AFR nutzen, was sich dann 4-Way-AFR nennt, da jede GPU an einem eigenen Bild arbeitet. 4-Way-AFR funktioniert laut Nvidia auch in Direct3D-9-Anwendungen, obwohl die Direct3D-9-Spezifikation dies theoretisch verhindert, da sie nur erlaubt, für drei Bilder im Voraus Befehle anzunehmen. Aber anscheinend konnte man dieses Hindernis mit einigen Tricks umgehen. Wir versuchen schon in Kürze diesbezüglich etwas Licht ins Dunkel zu bringen.
Neben den Vorteilen von AFR übernimmt man somit aber logischerweise auch dessen Schwachstellen. So muss jede GPU in ihrem eigenen VRAM auf dieselben Daten zurückgreifen können, weswegen beide 512-MB-Speicher mit einheitlichen Bits gefüllt werden. Darum können effektiv nur 512 MB genutzt werden. Zudem kann man logischerweise auch nicht alle Ausführungseinheiten in den Chips doppelt zählen, da einige Berechnungen ebenfalls doppelt anfallen und natürlich auch Latenzen eine Rolle spielen. Nicht zu vergessen ist das Problem der „Mikroruckler“ [13], das in niedrigen FPS-Bereichen den Spielspaß massiv mindern kann. Nach eigenen Aussagen arbeitet Nvidia hier derzeit an einem Treiber, der mit Hilfe eines Schedulers die Frames verzögern und somit das Problem lösen oder zumindest mindern können wird.
Als erste Grafikkarte unterstützt die GeForce 9800 GX2 „Hybrid-Power“. Falls also ein dazu fähiges Nvidia-Mainboard mit einer integrierten Grafikeinheit (derzeit sind dies nur der nForce 780a sowie Mainboards mit dem GeForce-8200-Chip; in einigen Monaten sollen Intel-Platinen folgen) vorhanden ist, kann man die GeForce 9800 GX2 unter Windows automatisch komplett deaktivieren lassen und überlässt die Darstellung des Desktops dem integrierten Grafikchip. Dadurch kann man immens an Strom sparen und reduziert die Lautstärke des Rechners, da sich der Lüfter auf der GeForce 9800 GX2 abschaltet. Ein intelligenter Stromsparmechanismus wie auf den Radeon-HD-3000-Karten, der auch einsetzt, wenn man kein passendes Motherboard besitzt, fehlt aber immer noch.
Die PureVideo-HD-Technologie ist bei der GeForce 9800 GX2 auf dem Stand der GeForce 9600 GT und bietet somit eine bessere Videoqualität als auf den GeForce-8800-Karten (wobei die GeForce-8800-Produkte (basierend auf der G92-GPU) mit einem in Kürze erscheinenden Treiber „nachgerüstet“ werden sollen). Die maximale Stromaufnahme der Dual-GPU-Karte liegt bei 197 Watt. Dementsprechend reicht ein einzelner 6-Pin-Stromanschluss auf dem 3D-Beschleuniger nicht mehr aus, weswegen Nvidia zusätzlich einen weiteren 8-Pin-Stromstecker verbaut. Beide Stecker müssen voll bestückt sein, damit die GeForce 9800 GX2 ihre Arbeit verrichten kann.
Welchen Markt Nvidia mit der GeForce 9800 GX2 ansprechen möchte, sollte klar sein. Die Zielgruppe sind die High-End-User sowie die Enthusiasten, die bereit sind, für eine hohe Grafikleistung überproportional viel Geld auszugeben. Neben der versprochenen Leistung kann sich die Multi-GPU-Karte durch die Möglichkeit Quad-SLI von allen anderen Nvidia-Produkten absetzen. Dies hat aber logischerweise seinen Preis: 500 Euro lautet die Preisempfehlung für eine GeForce 9800 GX2 von Point of View. Wahrlich kein Pappenstiel, für eine High-End-Karte aber nichts Ungewöhnliches. Die Verfügbarkeit soll ab sofort gegeben sein.
Schon nach dem Auspacken der GeForce 9800 GX2 erkennt man, dass Nvidia auch optisch verdeutlichen möchte, dass es sich um ein besonderes Stück Hardware handelt. So liegen die beiden Platinen nicht wie gewöhnlich offen zur (optischen) Schau, sie sind in einem massiven Metallgehäuse verpackt. Dies ist nicht nur optisch etwas neues, es soll zudem die Wärmeabgabe optimieren. Und heiß wird die Verkleidung der Karte im Betrieb in der Tat.
Die Länge der GeForce 9800 GX2 misst die mittlerweile für eine High-End-Karte üblichen 28 cm, weswegen es in den meisten Gehäusen zu keinen Einbauproblemen kommen sollte. In kleinen Towern muss man aber aufpassen, dass die Grafikkarte nicht mit den Festplatteneinschüben kollidiert. Wie bereits erwähnt, sieht man von den eigentlichen Platinen überhaupt nichts. Das Metallgehäuse umfasst sämtliche Bauteile der Grafikkarte und einzig die Lüfterschlitze lassen einen kleinen Einblick zu.
Das eigentliche Kühlsystem sitzt auf der GeForce 9800 GX2 genau zwischen den beiden Platinen und besteht aus einem großen Kühlblock sowie einem Radiallüfter. Auf diesen Kühlblock montiert Nvidia die beiden Platinen mit den GPUs in Richtung des Kühlers, weshalb nicht nur die Grafikchips, sondern auch die Speicherbausteine gekühlt werden. Auf die Rückseiten der Platinen wird schließlich das Metallgehäuse befestigt. Der recht große Radiallüfter sitzt genau in der Mitte des Kühlblocks.
Die Funktionsweise des Kühlers scheint auf der GeForce 9800 GX2 durchdacht zu sein: So bläst der Lüfter nicht nur auf eine Platine, durch die Positionierung in der Mitte des Kühlblocks werden gleichzeitig beide PCBs mit Frischluft versorgt. Die Luft wird durch die Lüftungsschlitze am unteren Ende des Metallgehäuses aus dem Gehäuse angesaugt, über die beiden Platinen und somit die GPUs gepustet und anschließend aus den vorderen Lüftungsschlitzen wieder aus dem Gehäuse heraus geblasen. Nichtsdestotrotz wird der Radiallüfter unseres Exemplars unter Last ziemlich aufdringlich, obwohl dies laut Nvidia nicht der Fall sein sollte. Mehr dazu im Abschnitt Lautstärke. Unter Windows taktet sich die Grafikkarte nicht herunter.
Der insgesamt ein Gigabyte große GDDR3-Speicher wird von Samsung mit einer Zugriffszeit von 0,83 ns produziert. Nvidia verbaut auf dem Slotblech der Multi-GPU-Karte zwei Dual-Link-DVI-Ausgänge, die HDCP-kompatibel sind und den Kopierschutz selbst in hohen Auflösungen wie 2560x1600 anwenden können. Löblicherweise verzichtet man auf den mittlerweile doch arg angestaubten TV-Ausgang und setzt stattdessen auf eine moderne HDMI-Schnittstelle. Damit über sie auch der Ton wiedergegeben werden kann, muss man ein SPDIF-Kabel mit der Soundkarte oder dem Onboard-Sound mit der GeForce 9800 GX2 verbinden. Der dazu benötigte Anschluss befindet sich neben den beiden Stromsteckern.
Testsystem:
Folgende Benchmarks kamen zum Einsatz:
Alle Benchmarks werden mit maximalen Details ausgeführt, damit die Grafikkarte möglichst hoch belastet wird. Als Einstellungen haben wir uns dabei für 1280x1024 und 1600x1200 (sowie 2560x1600 bei Grafikkarten mit 512 MB oder mehr und einer entsprechenden Leistung) entschieden. Damit zollen wir den modernen High-End-Beschleuniger Tribut, die durch ihre Rechenkraft niedrigere Auflösungen als 1280x1024 CPU-limitiert werden lassen. Neben den reinen Auflösungen lassen wir den Benchmarkparcours auch mit 4-fachem (und falls möglich acht-fachem) Anti-Aliasing sowie 16-fachem anisotropen Filter durchlaufen. TSSAA (Nvidia) oder AAA (ATi) zur Glättung von Alpha-Test-Texturen nutzen wir aufgrund von Kompatibilitätsproblemen nicht mehr in unserem Benchmarkparcours.
Nach sorgfältiger Überlegung und mehrfacher Analyse selbst aufgenommener Spielesequenzen sind wir zu dem Schluss gekommen, dass die Qualität der Texturfilterung auf aktuellen ATi- und Nvidia-Grafikkarten in der Standard-Einstellung in etwa vergleichbar sind (mit leichten Vorteilen für die GeForce-Produkte). Bei Nvidia verändern wir somit keinerlei Einstellungen und im ATi-Treiber belassen wir die A.I.-Funktion auf „Standard“.
Treibereinstellungen: Nvidia-Grafikkarten (G8x, G9x)
Treibereinstellungen: ATi-Grafikkarten (R(V)6x0)
Fillrate Tester
Fablemark
Fablemark – 1920x1200
Angaben in Bildern pro Sekunde (FPS)
|
ShaderMark
D3DRighmark Beta 4 und D3D10-Version
Die allseits bekannte Benchmarkserie von Futuremark ist mittlerweile in der Version 2006 erschienen und hört dementsprechend auf die Bezeichnung „3DMark06“. Von den sechs Testszenen messen vier Sequenzen die Performance der Grafikkarte und zeigen eine Grafikpracht, die ihres gleichen sucht. Um jene zu erreichen setzen die Finnen auf modernste 3D-Technologie, weswegen nicht nur massiv das Shader-Model 3.0 verwendet wird, auch extrem aufwendige Texturen, spektakuläre Partikeleffekte, komplexe Schattenberechnungen und als weiteres Highlight „High Dynamic Range Rendering“ – kurz HDRR – werden eingesetzt. Dabei setzt Futuremark auf FP16-HDR, das die derzeit Best mögliche Bildqualität liefert, aber auch aufwendig zu berechnen ist. Weitere Details zu diesem Programm gibt es in einem unserer ausführlichen Artikel. [20]
3DMark 06 – 1280x1024
Angaben in Punkten
|
3DMark06 – 1600x1200
Angaben in Punkten
|
3DMark06 – 2560x1600
Angaben in Punkten
|
Der neueste Spross aus der bekannten „Call of Duty“-Reihe ist erstmal nicht im zweiten Weltkrieg angesiedelt, sondern einig Jahre später in der Zukunft. Dem Spielspaß tut dies aber keinen Abbruch, ganz im Gegenteil sogar. Die Atmosphäre ist in Call of Duty 4 dermaßen realistisch, dass man ohne Probleme in die Spielwelt eintauchen kann. Doch nicht nur spielerisch weiß der First-Person-Shooter zu gefallen, auch technisch macht man im Gegensatz zum (PC)-Vorgänger Call of Duty 2 einen großen Schritt nach vorne – und dies, obwohl man immer noch dieselbe Grafikengine benutzt. Von dieser kann viel aber nicht mehr übrig geblieben sein, denn optisch liegt Call of Duty 4 auf einem vollkommen anderen Niveau. Schicke Shadereffekte sowie ein intelligenter Parallax-Mapping-Einsatz vertuschen die teils etwas schwachen Texturen. Schon Call of Duty 2 konnte beim Erscheinen mit einer einzigartigen Rauchdarstellung punkten. Der Nachfolger steht dem zweiten Teil der Serie diesbezüglich in nichts nach und kommt mit einer Rauchpräsentation daher, die zu beeindrucken weiß. Auf Direct3D-10-Unterstützung muss man aber verzichten, Call of Duty 4 setzt noch auf den Vorgänger Direct3D 9.
Call of Duty 4 – 1280x1024
|