Mittlerweile ist es knapp ein Jahr her, dass Nvidia die G80-GPU-Generation der Öffentlichkeit vorgestellt hat [1]. Damals buhlten die GeForce 8800 GTS sowie das Topmodell, die GeForce 8800 GTX, um die Gunst der Käufer, die die beiden Grafikkarten auch in kürzester Zeit erobern konnten. Und das mit Recht. Die 3D-Beschleuniger rannten nicht nur in Sachen Geschwindigkeit regelrechte Kreise um die Konkurrenz, auch die Bildqualität machte gegenüber der Vorgängergeneration einen großen Sprung nach vorne. Dass die G80-GPU obendrein auch noch der erste Rechenkern war, der mit einer Direct3D-10-Unterstützung daher kam, war da beinahe schon nebensächlich.
Doch die Zeit steht glücklicherweise nicht still und seit November 2006 ist viel passiert: Nvidia präsentierte die Mid-Range-Reihe GeForce 8600 sowie die Low-End-Derivate der GeForce-8500- und GeForce 8400-Serie und der direkte Konkurrent AMD blieb eben so wenig untätig und platzierte nach einer langen Wartezeit die Radeon-HD-2000-Grafikkarten auf dem Markt. Danach schien es, als würden sich AMD und Nvidia etwas ausruhen, doch hinter den Kulissen ging es durchaus weiter heiß her. Denn in den USA und Kanada war man schon seit langer Zeit damit beschäftigt, eine Überarbeitung (Refresh) des G80 und des R600 fertigzustellen. Und so verwunderte es uns nach gut zwölf Monaten dann nur wenig, als vor einigen Tagen in unserem Postfach eine Einladung von Nvidia zu einem Editors Day in den USA eintrudelte. Ziel der Reise: Die Pressevorstellung der GeForce 8800 GT.
Nvidia GeForce 8800 GT
Mittlerweile ist das NDA (Non-Disclosure Agreement – Schweigeabkommen) gefallen und die Geheimnisse um die G92-GPU, über die es bereits seit Monaten diverse Gerüchte gab, dürfen gelüftet werden. Ein richtiger High-End-Chip ist es nicht geworden, stattdessen versorgt Nvidia mit dem G92 das Performance-Segment.
Nvidia hat uns freundlicherweise zwei Exemplare der GeForce 8800 GT zur Verfügung gestellt, die wir nach unserem Ersteindruck am Tag der Vorstellung [2] nun in diesem Artikel ausführlich und inklusive SLI untersuchen werden. Da Nvidia die öffentliche Vorstellung der Grafikkarte um zwei Wochen vorgezogen hat und wir erst letzte Woche aus dem Hauptquartier des Grafikchipspezialisten mit zwei G92-Karten im Gepäck zurückgekehrt sind, war es uns leider nicht möglich, wie sonst üblich pünktlich zum Launch unseren Lesern einen entsprechenden Artikel anzubieten.
Ist der 3D-Beschleuniger wirklich ein Preis-Leistungs-Champion, wie man bisher vermutete? Und was bringt die überarbeitete G92-GPU für Vorteile gegenüber dem erfolgreichen G80-Vorgänger? Auf den folgenden Seiten werden wir diese und noch weitere Fragen beantworten. Wir wünschen viel Spaß beim Lesen.
Bevor wir uns mit der G92-GPU und ihrer Architektur im Detail beschäftigen, möchten wir mit den obligatorischen Spezifikationen des neuen Chips starten.
Radeon HD 2900 XT
GeForce 8800 GTX
GeForce 8800 GT
GeForce 8800 GTS (320MB)
Logo
Chip
R600
G80
G92
G80
Transistoren
ca. 700 Mio.
ca. 681 Mio.
ca. 754 Mio.
ca. 681 Mio.
Fertigung
80 nm
90 nm
65 nm
90 nm
Chiptakt
742 MHz
575 MHz
600 MHz
500 MHz
Shadertakt
742 MHz
1350 MHz
1512 MHz
1200 MHz
Pixel-Pipelines
X
X
X
X
Shader-Einheiten (MADD)
64 (5D)
128 (1D)
112 (1D)
96 (1D)
FLOPs (MADD/ADD)
475 GFLOPs
518 GFLOPs*
508 GFLOPs*
346 GFLOPs*
ROPs
16
24
16
20
Pixelfüllrate
11872 MPix/s
13800 MPix/s
9600 MPix/s
10000 MPix/s
TMUs
16
64
56
48
TAUs
32
32
56
24
Texelfüllrate
11872 MTex/s
36800 MTex/s
33600 MTex/s
24000 MTex/s
Vertex-Shader
X
X
X
X
Unified-Shader in Hardware
✓
✓
✓
✓
Pixelshader
SM 4
SM 4
SM 4
SM 4
Vertexshader
SM 4
SM 4
SM 4
SM 4
Geometryshader
✓
✓
✓
✓
Speichermenge
512 GDDR3
768 GDDR3
512 GDDR3
640 GDDR3 (320 GDDR3)
Speichertakt
828 MHz
900 MHz
900 MHz
800 MHz
Speicherinterface
512 Bit
384 Bit
256 Bit
320 Bit
Speicherbandbreite
105984 MB/s
86400 MB/s
57600 MB/s
64000 MB/s
*Die von uns angegebenen GFLOP-Zahlen der G80-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.
G92-GPU
Technik im Detail
Mit der Einführung der G80-Chiparchitektur im November 2006 ist Nvidia ohne Zweifel ein großer Wurf gelungen. Denn wirkliche Schwachstellen scheint die GPU nicht zu haben. Sie ist schnell, bietet moderne Features, eine gute Bildqualität, eine ansprechende Wiedergabe von HD-Videos und eine gute Skalierbarkeit, mit der die Kalifornier problemlos diverse Preissegmente bedienen können. So wundert es wohl kaum, dass Nvidia bei dem Refresh-Chip G92, der erstmals auf der GeForce 8800 GT eingesetzt wird, nur marginale Änderungen vorgenommen hat – eine Notwendigkeit dazu bestand schlicht und ergreifend nicht (und wäre für einen Refresh-Chip zudem auch arg ungewöhnlich).
Der G92 wird im modernen 65-nm-Verfahren bei TSMC gefertigt und beherbergt satte 754 Millionen Transistoren. Er ist demzufolge die komplexeste GPU, die jemals produziert worden ist. Umso erstaunlicher, dass der G92 nicht so viele Ausführungseinheiten wie der altgediente G80 besitzt. Auf dem G92 sind lediglich sieben und nicht acht dem G80 sehr ähnliche Shadercluster verbaut, weswegen die GPU auf insgesamt 112 Shadereinheiten zurückgreifen kann. Im Gegensatz zum R600 von ATi sind die ALUs auf dem G92 keine Vektorprozessoren im eigentlichen Sinne mehr, sondern voneinander unabhängige Skalareinheiten (1D), die pro Takt eine Komponente (entweder Rot, Grün, Blau oder den Alphawert) bearbeiten können.
Das Direct3D-10-Rechenwerk (Direct3D 10.1 wird nicht unterstützt) ist nach dem Unified-Shader-Prinzip aufgebaut, weshalb es keine getrennten Pixel-, Vertex- und Geometry-Einheiten mehr gibt. Stattdessen kann jede ALU alle Berechnungen ausführen. Jede Shadereinheit ist in der Lage, pro Takt eine MADD- (Multiply-ADD) sowie eine MUL-Operation (Multiplikation) durchzuführen. Während MADD durchgängig für das so genannte „General Shading“ benutzt werden kann (sprich für sämtliche anstehende Shaderoperationen), sieht dies bei MUL anders aus. MUL ist zusätzlich als Special Function Unit (SFU), Perspektivenkorrektur oder als Attributinterpolator tätig und kann nur selten für General Shading verwendet werden. Dementsprechend fällt die reale Shaderleistung (oft gemessen in GFLOPs) niedriger aus, als man anhand der nackten Zahlen (wenn man das MUL miteinbezieht) vermuten könnte.
G92-Architektur
Die 112 Shadereinheiten agieren auch auf dem G92 nicht in derselben Taktdomäne wie die restlichen Chipkomponenten. So haben die ALUs wie beim G80 eine eigene Taktdomäne spendiert bekommen, die mit einer extrem hohen Frequenz angesteuert wird. Bei der GeForce 8800 GT liegt diese bei 1512 MHz. Erreicht wird diese Takterhöhung von Nvidia, in dem man bei der Designphase die entsprechenden Transistoren quasi „per Hand“ optimiert und für einen solchen Taktbereich auslegt.
Modifiziert gegenüber dem G80 hat Nvidia die Textureinheiten beim G92, die nun identisch zu denen im G84 sowie im G86 sind. Beim G80 hatte Nvidia einen einfachen, aber effektiven Trick angewandt, um Transistoren sparen zu können. So verdoppelte man schlicht und ergreifend die Anzahl der Filter- im Gegensatz zu den Adressierungseinheiten, womit man eine extrem schnelle Texturfilterung möglich machte (entweder einen trilinear oder einen bilinear anisotrop gefilterten Pixel innerhalb eines Taktes). Beim G92 hat man weniger auf den Die-Platz geachtet und diesen Nachteil (der je nach Sichtweise ein Vorteil sein kann) ausgebessert. So kann der G92 nicht nur 56 Texel pro Takt filtern, sondern sie auch adressieren.
Unangetastet hat man dagegen den Aufbau der Raster Operation Processors (ROPs) gelassen. Einzig die Anzahl hat man auf dem G92 variiert. Während auf dem G80 sechs ROP-Partitionen mit jeweils vier ROPs verbaut sind, sind auf dem G92 nur noch vier (also insgesamt 16 ROPs) vorhanden. Eine dieser Partitionen kann insgesamt vier Pixel mit Farb- sowie Z-Werten (Tiefeninformationen) pro Takt fertigstellen. Wie ab der GeForce-FX-Serie gewohnt, bieten die GeForce-ROPs bei reinen Z-Berechnungen die Möglichkeit, die Rechenkraft um ein Vielfaches zu steigern. So lange einzig und allein Tiefeninformationen berechnet werden, können nicht 16, sondern 128 Samples pro Takt zur weiteren Nutzung bereitgestellt werden. Bei 4xMSAA bleiben noch 32 Samples pro Takt übrig. Die ROPs (sowie die TMUs) werden auf der GeForce 8800 GT mit 600 MHz angesteuert. Dies ist für die G92-Architektur durchaus als moderat zu bezeichnen, wie auch Nvidia zugibt. Genügend Spielraum bei den Taktraten nach oben scheint noch vorhanden.
PireVideo HD 2
Wer sich mit der G8x-Architektur auskennt, der weiß, dass durch die Deaktivierung einer ROP-Partition automatisch Einfluss auf den Memorycontroller genommen wird. Jede ROP-Partition ist direkt mit einem Framebuffer verbunden. Dieses Manko besteht auch beim G92 und ist ohne Zweifel sein mit Abstand größter Hemmschuh. Während beim G80 sechs 64 Bit breite Speicherkanäle existieren, sind es beim G92 – analog der Anzahl der ROPS – nur noch vier. Somit bietet der G92 dem Käufer ein lediglich 256 Bit breites Speicherinterface an, das in vier 64-Bit-Speicherkanäle aufgeteilt ist. Jeder Speicherkanal ist an zwei Speicherbausteine angeschlossen, die je nach Version des 3D-Beschleunigers (256-MB- oder 512-MB-Variante) 32 MB oder 64 MB groß sind.
Auf den ersten Blick nicht ersichtlich, hat Nvidia nach eigenen Angaben darüber hinaus einige interne Schaltungen im G92 optimiert. So soll der Scheduler (Zeitplaner) für die Shadereinheiten verbessert worden sein, was für eine effektivere Auslastung der ALUs sorgen soll. Darüber hinaus soll die Effizienz der GPU in Verbindung mit Anti-Aliasing sowie einer hohen Auflösung verbessert worden sein: Der Performanceverlust soll geringer ausfallen. Das SLI-Anti-Aliasing wurde zusätzlich optimiert, was in einer besseren Performance resultieren soll. Verzichten müssen die G92-Käufer weiterhin auf „Double Precision“ (64- anstatt 32-Bit-Genauigkeit), das bei GPGPU-Programmen eine wichtige Rolle spielt. Double Precision soll erst in der nächsten GPU-Generation nach dem aktuellen IEEE-754-Standard unterstützt werden.
Der separate „NVIO“ (Nvidia Input Output), der für die Bildschirmausgabe sowie die SLI-Steuerung auf einer G80-Karte zuständig ist, entfällt bei der GeForce 8800 GT und wandert wieder in die GPU selber. Diese wurde darüber hinaus um den von der GeForce 8600 und der GeForce 8400 bekannten „Video Processor 2“ erweitert, weswegen man den G92 als „PureVideo HD“-fähig bezeichnet. Somit kann die GPU der CPU die Mehrarbeit bei MPEG2- sowie H.264-HD-Filmen abnehmen, weswegen es selbst auf schwächeren CPUs kein Problem darstellt, einen HD-Film anzuschauen. VC-1 wird dagegen weiterhin nur teilweise beschleunigt, da laut Nvidia der Decodierungsprozess für einen Prozessor einfacher zu erledigen ist als der von H.264-Material. Dies trifft zwar durchaus zu, trotzdem wünschen wir uns in Zukunft eine volle VC-1-Beschleunigung. Denn derart anspruchslos für eine CPU sind entsprechende Filme wahrlich nicht.
GeForce 8800 GT Specs
Eine weitere nennenswerte Neuerung beim G92 ist die Kompatibilität zum PCIe-2.0-Standard. Bisherige Grafikkarten waren PCIe-1.1-kompatibel und konnten in jede Richtung mit je acht Gigabyte pro Sekunde mit dem PCIe-Bus kommunizieren. PCIe 2.0 (oder auch PCIe Gen2 genannt) verdoppelt nun die Bandbreite auf 16 GB pro Kanal – AGP 4x gegen AGP 8x lässt grüßen. Selbst Nvidia gibt jedoch an, dass Spiele und sogar 3-Way-SLI in naher Zukunft nur bedingt bis eher gar nicht von der höheren Bandbreite profitieren werden. Nvidia sieht PCIe 2.0 aber als einen großen Schritt bei GPGPU-Anwendungen (Cuda), die je nach Programmierung einen starken Geschwindigkeitsschub von PCIe 2.0 erfahren sollen. Entgegen diverser Gerüchte wurde beim neuen Standard der maximale Stromverbrauch pro PCIe-Slot nicht verändert. Dieser liegt bei einem PCIe-x16-Slot immer noch bei 75 Watt.
Zusammengefasst gibt Nvidia die neuen Features und Überarbeitungen als Grund für die höhere Transistorenanzahl des G92 gegenüber dem G80 an (754 Millionen zu 681 Millionen Transistoren). Namentlich die Verwendung vom VP2, die modifizierten Textureinheiten, PCIe Gen2 sowie die Integration des NVIO in die GPU. Doch überkompensieren diese Änderungen tatsächlich derart drastisch den theoretischen Rückgang der Transistorenanzahl durch Entnahme eines Shader-Clusters? Wir spekulieren an dieser Stelle einmal und behaupten, dass der G92 nicht nur sieben Shadercluster und vier ROP-Partitionen, sondern wie der G80 acht Shadercluster und sechs ROP-Partitionen besitzt. Denn uns kommt die Anzahl der Transistoren trotz der Verbesserungen des G92 zu hoch vor (NVIO sollte zum Beispiel nur eine kleine einstellige Millionenzahl kosten). Ob der G92 wirklich mehr Einheiten besitzt als die GeForce 8800 GT offenbart, wird aber nur die Zeit zeigen können.
Impressionen
Nvidia GeForce 8800 GT
Mit der GeForce 8800 GT möchte Nvidia wiederholen, was ihnen zuletzt mit der GeForce 4 TI 4200 und ATi mit der Radeon X1950 Pro gelungen ist: Eine kostengünstig zu fertigende und somit preiswerte Grafikkarte, die geschwindigkeitsmäßig nur leicht hinter den High-End-Modellen zurück liegt und sich weit von den Mid-Range-Karten absetzen kann. Dass dies längst nicht bei jeder GPU-Generation möglich ist, sollte klar sein, denn nicht nur eine wirtschaftlich lohnenswerte GPU ist Voraussetzung für dieses Vorhaben, darüber hinaus muss der Rechenkern auch schnell genug sein. Nvidia gibt an, dass solch eine Grafikkarte etwa alle vier bis fünf Jahre möglich ist – und nun soll es wieder soweit sein.
Nvidia GeForce 8800 GT
Die offizielle Preisempfehlung der GeForce 8800 GT für Deutschland beginnt bei 229 Euro, wobei einige Shops die GeForce 8800 GT bereits für etwa 220 Euro gelistet haben. Lieferbar ist die Karte für diesen Preis aber nicht. Der durchschnittliche Kostenpunkt beläuft sich derzeit auf etwa 240 Euro, eine Lieferbarkeit ist aktuell aber erst bei 260 Euro und mehr gewährleistet. Da sich sehr viele Interessenten auf die GeForce 8800 GT stürzen, haben Nvidia und die Boardpartner eine Woche nach dem Launch Probleme, ausreichende Mengen zu fertigen, und lassen sich den Ansturm auf die Karte gerne mit ein paar Euros extra vergüten.
Das – wie sollte es anders sein – grüne PCB misst auf der GeForce 8800 GT eine Länge von 23 cm und entspricht somit der Größe einer High-End-Grafikkarte der letzten Generation. Die Grafikkarte sollte in sämtliche aktuell im Handel befindlichen Standardgehäuse ohne größere Schwierigkeiten hineinpassen. Das PCB ist sowohl auf der Vorder- als auch auf der Rückseite mit diversen Bauteilen bestückt; Freiräume gibt es nur wenige. Das Single-Slot-Kühlsystem umfasst die gesamte Vorderseite der GeForce 8800 GT. Einzig einige Lüftungsschlitze gewährleisten einen knappen Einblick auf den 3D-Beschleuniger. Die maximale Stromaufnahme der Grafikkarte liegt laut Nvidia bei 105 Watt, weswegen ein PCIe-Stromstecker vorhanden ist. Dieser ist auch auf einem PCIe-2.0-Mainboard von Nöten, da der PCIe-Slot immer noch auf 75 Watt limitiert ist.
Bei den Kühlermaterialien setzt Nvidia größtenteils auf kostengünstiges Aluminium. Mehrere Alulamellen sollen den Wärmetransport verbessern. Direkt auf der GPU sitzt ein eingelassener Kupferkühlblock, der wiederum durch eine Heatpipe mit dem Aluminiumkühler verbunden ist. Zu unserer Überraschung setzt Nvidia bei der GeForce 8800 GT auf einen kleinen 55-mm-Radiallüfter, der im hinteren Drittel des Kühlsystems montiert ist. Die Funktionsweise ist schnell erklärt: Der Radiallüfter saugt die kühle Luft aus dem Tower durch die Lüftungsschlitze an, leitet diese über die GPU und bläst die aufgewärmte Luft wieder aus den vorderen Lüftungsschlitzen hinaus. Der Speicher ist in dem Kühlsystem mit einbezogen. Unter Windows taktet sich die GeForce 8800 GT wie sämtliche Vorgängerprodukte mit der G8x-GPU nicht herunter, sondern agiert weiterhin mit den maximalen Taktraten. Schade. Für die Lüftersteuerung muss man Nvidia hingegen ein großes Lob aussprechen. Die Grafikkarte fällt zu keiner Zeit unangenehm auf und bleibt selbst nach einer längeren Lastphase leise. Mehr dazu im Abschnitt Lautstärke.
Der 512 MB große VRAM wird von Qimonda mit einer Zugriffszeit von 1,0 ns produziert. Die acht Speicherchips sind allesamt auf der Vorderseite des PCBs montiert. Auf dem Slotblech montiert Nvidia zwei Dual-Link-fähige DVI-Ausgänge, die HDCP-kompatibel sind und den Kopierschutz auch in hohen Auflösungen wie 2560x1600 anwenden können. Eine Möglichkeit, um wie bei der Radeon-HD-2000-Serie von ATi den Ton über einen speziellen DVI-zu-HDMI-Adapter wiederzugeben, sucht man auf der GeForce 8800 GT leider vergebens. Darüber hinaus kann man einen handelsüblichen Fernseher per HDTV-Ausgang mit der Grafikkarte verbinden.
GeForce 8800 GT ohne Kuhler
Testsystem
Testsystem:
Prozessor
Intel Core 2 Extreme X6800 (übertaktet auf 3,46 GHz, Dual-Core)
Motherboard
Asus Striker Extreme (Nvidia nForce 680i) Haupt-Testplatine und für SLI-Systeme
Asus P5W DH Deluxe (Intel i975X) für CrossFire-Systeme
Folgende Benchmarks kamen während unseres Tests zum Einsatz:
Synthetische Benchmarks:
3DMark06 Version 1.0.2
Spielebenchmarks:
Anno 1701 Demo
Bioshock D3D10
Call of Juarez D3D10-Benchmark-Demo
Clive Barker's Jericho
Colin Mcrae Dirt Demo
Company of Heroes
Company of Heroes D3D10
F.E.A.R.
Gothic 3
Lost Planet D3D10-Demo mit Patch für D3D10-Optimierung
Oblivion
Prey
Rainbow Six Vegas
Stalker
World in Conflict D3D10
Alle Benchmarks werden mit maximalen Details ausgeführt, damit die Grafikkarte möglichst hoch belastet wird. Als Einstellungen haben wir uns dabei für 1280x1024 und 1600x1200 (sowie 2560x1600 bei Grafikkarten mit 512 MB oder mehr und einer entsprechenden Leistung) entschieden. Damit zollen wir den modernen High-End-Beschleuniger Tribut, die durch ihre Rechenkraft niedrigere Auflösungen als 1280x1024 CPU-limitiert werden lassen. Neben den reinen Auflösungen lassen wir den Benchmarkparcours auch mit 4-fachem (und falls möglich acht-fachem) Anti-Aliasing sowie 16-fachen anisotropen Filter durchlaufen. TSSAA (Nvidia) oder AAA (ATi) zur Glättung von Alpha-Test-Texturen nutzen wir aufgrund von Kompatibilitätsproblemen nicht mehr in unserem Benchmarkparcours.
Achtung: Moderne SLI- und CrossFire-Systeme bieten dem Kunden eine dermaßen gewaltige Rechenleistung, dass selbst der schnellste Prozessor damit hoffnungslos überfordert ist und demzufolge beinahe alle Spiele CPU-limitiert sind, was bei immer schneller werdenden 3D-Beschleunigern ein großes Problem darstellt. Aus diesem Grund lassen wir Testläufe ohne Anti-Aliasing sowie dem anisotropen Filter komplett weg, da diese Qualitätseinstellung für zwei Grafikkarten keine Herausforderung mehr ist. Somit werden die Tests ausschließlich mit 4xAA (beziehungsweise 8xAA) sowie 16xAF in 1280x1024, 1600x1200 und 2560x1600 durchgeführt.
Nach sorgfältiger Überlegung und mehrfacher Analyse selbst aufgenommener Spielesequenzen sind wir zu dem Schluss gekommen, im ForceWare-Treiber für Nvidia-Karten die Qualitätseinstellungen auf High Quality anzuheben, da man nur mit diesem Setting das Texturflimmern effektiv bekämpfen kann – dies trifft aber nur auf die G7x-Generation zu, die G8x-GPUs werden mit den Standardeinstellungen des Treibers getestet, weil die Bildqualität stark zugenommen hat. Zudem ist dieser Modus vergleichbar mit der Einstellung „Catalyst A.I. Standard“ auf den ATi-Pendants, wodurch bei der Bildqualität größtenteils ein Gleichstand erreicht wird.
Dieses nützliche kleine Programm dient dazu, die Füllraten einer Grafikkarte zu messen. Im Gegensatz zu den bzw. im 3DMark integrierten Füllraten-Tests, die im Fall von Single-Texturing vornehmlich die Bandbreite messen, kann dieses Programm recht differenzierten Aufschluss über verschiedene Arten von Füllrate geben, unter anderem auch die Pixelshader-Füllraten, welche wir hier betrachten wollen.
Da die verwendeten Shader teilweise recht kurz und bandbreitenintensiv sind, haben wir die Auflösung möglichst weit erhöht, um den Fokus etwas mehr auf die Füllrate zu verlagern. Da hier mehrere mathematische Operationen pro Pixel nötig sind, wird die Füllrate durch die Erhöhung der Auflösung stärker belastet als die Bandbreite.
Getestet wurde in 1600x1200 in 32Bit mit 24Bit Z- und 8Bit Stencilbuffer und 60 Hz Refreshrate.
Der VillageMark wurde von PowerVR entwickelt und diente dazu, die Vorzüge des Kyro 2 zu verdeutlichen, da in jenem Benchmark der Overdraw mit einem Faktor von bis zu 10 besonders groß ist. Viele, besonders ältere Grafikkarten, berechnen hier auch die Oberflächen, die durch andere verdeckt sind und daher eigentlich nur verschwendete Bandbreite und Füllrate bedeuten, so dass dieser grafisch eigentlich nicht sehr aufwendige Benchmark doch öfter als man zunächst denkt zu einem Stolperstein wird. Deswegen ist es von größter Bedeutung in diesem Benchmark, eine gut funktionierende Technik zum Entfernen verdeckter Oberflächen (HSR = Hidden Surface Removal) zu besitzen.
Getestet wurde mit folgender Kommandozeile: [InstallDir]\D3DVillagemark.exe -benchmark=1 -width=xxxx -height=xxxx -bpp=32"
Der Fablemark wurde, wie auch der nachfolgende Templemark, von PowerVR entwickelt und dient trotz eines sehr hohen Anteils an Overdraw der Zurschaustellung der Stärken des Kyro-Chips was den Stencil-Buffer angeht.
Natürlich wird auch auf allen anderen Karten die Stencil-Performance stark gefordert, so dass dieser Test ein Indiz für kommende Spiele sein kann, die vor dem eigentlichen Rendering einen Z-/Stencil-only Pass einlegen, um vorab jeglichen Overdraw zu vermeiden.
Getestet wurde mit folgender Kommandozeile: [InstallDir]\D3DFablemark.exe -benchmark=1 -width=xxxx -height=xxxx -bpp=32"
Der ShaderMark liegt zur Zeit in der aktuellen Version 2.1 vor und wurde von Tommti-Systems [19] entwickelt. Dank zahlreichen Updates befindet sich der Benchmark immer noch auf der Höhe der Zeit und misst die Performance der Shader-Einheiten moderner Grafikkarten. Dabei unterstützt das Programm auch das Shader-Model 3.0, weswegen es sich gut zu einem Vergleich aktueller Architekturen eignet. Getestet werden dabei bis zu 25 unterschiedliche Shader-Anweisungen unter der Auflösung 1600x1200, die allesamt in der Hochsprache HLSL (High Level Shader Language) geschrieben sind.
Auch wenn theoretische Benchmarks, weil diese keine „reale“ 3D-Umgebung darstellen, suboptimal für die Bestimmung der allgemeinen Performance sind, so zeigen solche Programme sehr gut, wie schnell oder langsam eine Grafikkarte in einem gewissen Teilbereich ist. Der „D3DRightmark“ in der Version „Beta 4“, der gleich mehrere dieser Teilbereiche untersucht, gehört derselben Kategorie an. Es wird nicht nur die Vertex-Shader-3.0-Performance, sondern ebenfalls mit Hilfe von unterschiedlichem Shader-Code, der in HLSL geschrieben ist und FP32-Genauigkeit vorsieht, die Pixel Shader 3.0 gemessen. Darüber hinaus wird zusätzlich ein Test der „Hidden Surface Removal“-Mechanismen durchgeführt, ebenso ein Pixel-Filling- und Point-Sprites-Test. Als Auflösung verwenden wir 1600x1200 ohne Kantenglättung und Texturfilterung. Da das Diagramm für die Ergebnisse des D3DRightmark sehr lang ist, haben wir die Werte in einem Klapptext versteckt. Ein einfaches Draufklicken genügt, um die Benchmarks sehen zu können.
Die allseits bekannte Benchmarkserie von Futuremark ist mittlerweile in der Version 2006 erschienen und hört dementsprechend auf die Bezeichnung „3DMark06“. Von den sechs Testszenen messen vier Sequenzen die Performance der Grafikkarte und zeigen eine Grafikpracht, die ihres gleichen sucht. Um jene zu erreichen setzen die Finnen auf modernste 3D-Technologie, weswegen nicht nur massiv das Shader-Model 3.0 verwendet wird, auch extrem aufwendige Texturen, spektakuläre Partikeleffekte, komplexe Schattenberechnungen und als weiteres Highlight „High Dynamic Range Rendering“ – kurz HDRR – werden eingesetzt. Dabei setzt Futuremark auf FP16-HDR, das die derzeit Best mögliche Bildqualität liefert, aber auch aufwendig zu berechnen ist. Somit können Grafikkarten ohne FP16-Blending-Einheiten, unter anderem die X8x0-Serie von ATi, zwei Testszenen nicht ausführen, weswegen die Punktzahl dieser GPUs generell niedrig ausfällt. Darüber hinaus können nur Grafikkarten, die MSAA auf ein FP16-Rendertarget ausführen können, die HDRR-Sequenzen mit Anti-Aliasing berechnen. Grafikkarten ohne diese Fähigkeit erzeugen bei Einsatz von Kantenglättung keine Punktzahl und werden deswegen nicht berücksichtigt. Weitere Details zu diesem Programm gibt es in einem unserer ausführlichen Artikel. [22]
Auch wenn normalerweise First-Person-Shooter mit einer erstaunlichen Grafik glänzen können, so hat es sich das deutsche Entwicklerteam des Strategiespieles Anno 1701 nicht nehmen lassen, den Nachfolger der legendären Spiele Anno 1602 sowie Anno 1503 ebenfalls mit einer Grafikengine auszustatten, die sich vor der gesamten Konkurrenz nicht zu verstecken braucht. Das Auge bekommt praktisch alles geboten, was derzeit mit moderner Hardware möglich ist. Detaillierte Texturen, schön anzusehende Landschaften, nette Shadereffekte, wie Beispielsweise die Darstellung des Wassers inklusive der Brechung der Wellen und noch vieles mehr machen Anno 1701 zu einem wahren Augenschmaus. Aus diesem Grund eignet sich das Strategiespiel, als eines der wenigen seiner Art, für die Teilnahme an einem Grafikkarten-Review, da die GPU viel zu berechnen hat. Auf modernes FP16-HDRR verzichten Anno 1701 allerdings, stattdessen kommt nur ein simpler Bloom-Filter zum Einsatz.
Spielerisch oder technisch bemerkenswerte Spiele geraten normalerweise schnell ins Blickfeld der Presse und werden auch von den Spielern meistens sehnlich erwartet. Anders war dies merkwürdigerweise bei „Clive Barker’ Jericho“, dessen Demo mehr oder weniger aus dem nichts aufgetaucht ist. Spielerisch wird die Vollversion zwar erst noch beweisen müssen, ob Jericho auf Dauer wird überzeugen können, technisch macht die Demo aber bereits eines klar: Die Grafikengine ist auf der Höhe der Zeit und braucht sich vor keinem anderen Konkurrenten zu verstecken. Nicht nur die Technik an sich kann mit qualitativ hochwertigen Texturen, diversen Shader- sowie Partikeleffekten und FP16-High-Dynamic-Range-Rendering punkten, auch der Grafikcontent selber, sprich die künstlerische Gestaltung, zeugt von Originalität. Da die GeForce-7-Serie von Nvidia bekanntlicherweise kein Multi-Sampling-Anti-Aliasing auf ein FP16-Rendertarget anwenden kann, muss die alte Grafikkartengeneration aus Kalifornien bei den Qualitätseinstellungen außen vor bleiben.
Die Colin-McRae-Reihe war schon immer ein Highlight für alle Rennspielfans, bei denen es auch mal etwas dreckiger werden durfte. In der Rally-Serie fährt man nunmals längst nicht immer auf Asphalt. Nachdem die Serie in letzter Zeit qualitativ etwas abgeflacht ist, hat der Entwickler Codemaster mit Colin McRae Dirt die Handbremse gezogen und zu alten Tugenden gefunden – und viele neue Features hinzugefügt. Beeindrucken kann ebenso die neu entwickelte Grafikengine, die zum aktuellen Zeitpunkt zweifellos ihres Gleichen in der Rennsportszene sucht. Zwar verzichtet Dirt auf FP16-HDRR, kann aber mit einigen (wenn auch übertriebenen) schicken Lichteffekten, detaillierten Texturen, schönen Landschaften, einer großen Weitsicht sowie gut gelungenen Partikeleffekte überzeugen. Dies hat aber auch seinen Preis: Die Hardwareanforderungen sind extrem hoch und bereiten den meisten PCs Probleme. Grund genug für uns, Colin McRae Dirt in den Benchmarkparcours aufzunehmen.
Egal wohin man schaut, Spiele, bei denen das Szenario im Zeitraum des zweiten Weltkrieges angesiedelt ist, gibt es spätestens nach dem Erfolgshit „Call of Duty“ wohl wie Sand am Meer. Während einige dieser Spiele durchaus zu gefallen wissen, sind andere nur ein regelrechter Abklatsch, um auf der Erfolgswelle mitzuschwimmen. Zu ersterer Gattung gehört zweifellos das Strategiespiel „Company of Heroes“, was sich im Jahre 2006 wohl zu einem kleinen Geheimtipp entwickelt hat. Ein Grund dafür ist eine sehr gute Grafik-Engine, die auch schwerste Geschütze auffährt, damit die Konkurrenztitel das Nachsehen haben. „Operation gelungen!“, ist das einzige, was man bei Company of Heroes diesbezüglich sagen kann. Das Spiel bietet eine Menge fürs Auge und vor allem in den Schlachtszenen passiert es des Öfteren, dass man vergisst, den eigenen Truppen Kommandos zu erteilen, und stattdessen das Spielgeschehen bewundert. Als Benchmark benutzen wir die einbaute Testsequenz.
Company of Heroes D3D9 - G80 Company of Heroes D3D9 - R600
Doom 3 bekommt Konkurrenz – und was für Eine! Die Programmierer des neue Gruselshooters F.E.A.R. scheinen sich Doom 3 als großes Vorbild ausgesucht zu haben, wobei man allerdings fast alles besser zu machen scheint. Unter anderem wird die sehr beklemmende Atmosphäre durch eine Grafikqualität erreicht, die ihres Gleichen sucht. Shadereffekte in Massen, wunderschönes Bump-Mapping, sehr spektakuläre Schattenwürfe, detaillierte Texturen sowie hübsch aussehende Partikeleffekte und noch vieles mehr bekommt der Spieler zu Gesicht, weswegen F.E.A.R. bereits Pflicht für einen guten Benchmark-Parcours geworden ist. Wir verwenden mittlerweile für diese Zwecke die Vollversion, die über eine integrierte Benchmarkfunktion verfügt. Jene zeigt ein Gefecht sowie eine größere Explosion, die durch eine frei bewegende Kamera aufgenommen worden sind. Die Details sind, mit Ausnahme der Soft-Shadows, auf das Maximum gesetzt.
Wohl zweifellos das meist erwartete Adventurespiel im Jahre 2006 hört auf den Namen „Gothic 3“, was mit den beiden beliebten Vorgängern begründet ist. Auch wenn das Spiel, selbst nach einigen Patches, immer noch sehr fehlerhaft ist, so erfreut es sich einer großen Beliebtheit in Deutschland, wie man gut an den Verkaufscharts erkennen kann. Doch neben dem eigentlichen Spielinhalt kann Gothic 3 zudem mit der Grafikengine punkten, die den Entwicklern sehr gut gelungen ist. So ist nicht nur die Weitsicht beeindruckend, auch die kleinen lieblichen Details an Figuren und Gegenständen machen die Grafik zu etwas Besonderem. Dass die Engine damit nicht nur gut aussieht, sondern auch sehr Hardwareintensiv ist, war bereits vom vornherein klar. Allerdings bietet das Grafikgrundgerüst einen entscheidenden Nachteil: So kann derzeit kein Anti-Aliasing angewendet werden, weswegen das Feature in den Qualitätseinstellungen nicht aktiv ist; dort ist nur der anisotrope Filter im Einsatz.
Bereits der Vorgänger „Morrorwind“ hat bei vielen Spielefans eine richtige Begeisterung hervorgerufen und bei dem Nachfolger „Oblivion“ scheint dies nicht anders zu sein. Für kaum ein Spiel findet man derzeit mehr Diskussionen im Internet. Aber nicht nur spielerisch, auch grafisch kann Oblivion überzeugen und fährt, um dieses Ziel zu erreichen, schwere Geschütze auf. Noch niemals zuvor wurde HDRR mit dynamischem Tone-Mapping derartig realistisch eingesetzt. Darüber hinaus kann das Spiel mit schönen Schatteneffekte sowie stellenweise hoch auflösenden Texturen und Partikeleffekte glänzen. Dementsprechend ist Oblivion geradezu prädestiniert für einen guten Benchmarkparcours. Die verwendete Szene zeigt nicht nur eine aufwendige Beleuchtung, auch sind mehrere Sträucher und Bäume zu sehen, die vor allem die GPU extrem stark belasten. Da die Grafikkarten der GeForce-7-Generation auf ein FP16-Rendertarget kein Multi-Sampling Anti-Aliasing anwenden können, haben wir die entsprechenden Modelle in den Qualitäts-Benchmarks nicht abgebildet, um die Vergleichsmöglichkeiten der 3D-Beschleuniger untereinander aufrecht zu erhalten.
Kinder in jungen Jahren verkleiden sich zu Karneval gerne als Indianer. Viele ältere Artgenossen spielen dagegen lieber den First-Person-Shooter Prey und helfen dem etwas mürrischen Indianerhelden Tommy, die Welt vor einer außerirdischen Macht zu retten. Dies tut Tommy nicht nur mit gefundenen beziehungsweise abgenommenen Alien-Waffen, sondern zusätzlich mit der altbewährten Doom-3-Engine, die für Prey aber kräftig aufgebohrt worden ist. Mit anderen Worten: Die Grafik ist kaum wieder zu erkennen. Hochauflösende Texturen, schicke Shader-Effekte, aufwendige Schattenberechnungen und noch vieles mehr machen das Spiel zu einem wahren Augenschmaus. Die selbst aufgenommene Timedemo zeigt sowohl einen Abschnitt innerhalb als auch außerhalb eines Gebäudes und deckt insgesamt einen Großteil des Spielgeschehens ab. Waffenfeuer, viele Gegner und Tommys Fähigkeit, sich außerhalb seines eigenen Körpers zu bewegen, fehlen nicht.
Die „Rainbow Six“-Reihe umfasst schon etliche Titel und ist einer der größten PC-Spiele-Serien weltweit. Die neueste Kreation hört auf den simplen Namen „Vegas“, der aber bereits verdeutlicht, wo die Spezialeinheit diesmal im Einsatz ist. Und das die Stadt Vegas zu den farbenfrohesten Städten überhaupt gezählt werden kann, bezweifeln wohl nur die wenigsten. Dementsprechend bunt, aber auch sehr detailliert, ist die Grafikengine von Vegas, die zeitgleich nicht irgendeine, sondern eine sehr bekannte ist: Die Unreal Engine 3, die in diesem Jahr zudem in „Unreal Tournament 3“ zum Einsatz kommen wird. Obwohl die Version in Vegas der in UT3 um einiges hinterher hinkt, so weiß die Grafik zu überzeugen. Sehr viele Details werden dargestellt, die man bis jetzt in keinem Spiel entdecken konnte. Die vielen bunten Farben sowie die detaillierten Animationen runden das Ergebnis ab. Doch die Unreal Engine 3 hat einen großen Nachteil: So kommt „Deferred Shading“ (die Unreal Engine 3 an sich ist kein reiner Deffered Renderer, einzig der Schattenpart besitzt einen speziellen Algorithmus) zum Einsatz, das mit einer flotten Schatten- und Lichtberechnung zwar einige Vorteile bietet, aber unter der Direct3D-9-API Anti-Aliasing verhindert. Erst mit Direct3D 10 ist Deferred Shading und Kantenglättung möglich. Da in unserer ausgewählten Benchmark-Szene der anisotrope Filter keinen Einfluss auf die Geschwindigkeit hat, lassen wir diesen in der Diagrammdarstellung außen vor.
„Stalker“ – neben Duke Nukem Forever wohl der Inbegriff des Wartens. Nach einer langen Zeit hat es der ukrainische First-Person-Shooter aber dennoch in die Regale geschafft und weißt trotz der schier ewigen Entwicklungszeit zu gefallen. Nicht nur spielerich punktet das Spiel mit einigen netten Ideen, auch die Atmosphäre kann sich sehen beziehungsweise spüren lassen. Darüber hinaus ist die Grafikengine, die einen „Deffered Shadowing“-Algorithmus verwendet, gut gelungen. Das Spiel überzeugt vor allem mit schicken Wettereffekten und kann detaillierte Texturen aufweisen. Shader-Model-3.0-Effekte kommen zum Einsatz, ebenso hochwertiges FP16-HDR-Rendering, das für ein realitätsnahes Farbenspektrum sorgt. Ein weiteres Highlight sind die zahlreichen hochwertigen Licht- und Schatteneffekte, die man in dieser Form bis jetzt noch nicht zu sehen bekommen hat. Dies ist der Vorteil von Deffered Shadowing, da die Licht- und Schattenberechnungen sehr schnell ausgeführt werden können. Ein große Nachteil ist aber, dass Direct3D-9-Beschleuniger deswegen kein Multi-Sampling-Anti-Aliasing ausführen können. Dazu benötigt es nicht nur eine D3D10-Grafikkarte, auch das Spiel muss mit der neuen API ausgestattet sein.
„Bioshock“, mehr oder weniger der inoffizielle Nachfolger von „System Shock 2“, hatte es beim Erscheinen wahrlich nicht leicht. Die Erwartungen waren dermaßen hoch, dass es nahezu unmöglich schien, diese alle zu erfüllen. Im Vorfeld sprach man bereits von „bestes Spiel aller Zeiten“. Nun ist Bioshock draußen. Ob es tatsächlich das beste Spiel aller Zeiten ist, kann man wohl noch ewig diskutieren. Eins ist aber eindeutig: Technisch ist Bioshock nicht nur sehr weit vorne, sondern wohl derzeit allen anderen Titeln voraus. Grund dafür ist die Unreal Engine 3, die die Entwickler modifiziert haben, um diese auf die eigenen Ansprüche anzupassen. Herausgekommen ist ein Direct3D-10-Renderer, der mit bisher noch nie dagewesenen Wassereffekten punkten kann. So interagiert das Wasser physikalisch Korrekt auf den Spieler, wenn dieser beispielsweise durch einen überfluteten Raum läuft. Darüber hinaus bietet Bioshock viele weitere optische Schmankerl. Schicke Partikeleffekte, spektakuläre Feuerdarstellung, realistische Schatten, schöne Oberflächen, Physikinteraktionen mit den Gegnern sowie der Umwelt und noch vieles mehr machen Bioshock grafisch zu einem Leckerbissen. Unter der Direct3D-10-API funktioniert bisher kein Anti-Aliasing, weil dieses nicht von der Applikation angefordert wird (technisch aber zumindest theoretisch möglich sein sollte). Deswegen verzichten wir auf die Kantenglättung in den Qualitätseinstellungen.
Als Testsequenz in dem Direct3D-10-Benchmark zu Call of Juarez kommt eine spezielle Flyby-Szene zum Einsatz, die verschiedene neue technische Möglichkeiten der Direct3D-10-API zeigt. In der neuen Version des Spieles ist die Vegetation um 30 Prozent dichter, es gibt 30 Prozent mehr Partikeleffekte, eine um 25 Prozent gestiegene Sichtweite, höher aufgelöste Texturen, höher aufgelöste Shadowmaps, Relief-Mapping wird eingesetzt und noch vieles mehr. Der Geometryshader kommt in der Benchmark-Sequenz natürlich ebenso wenig zu kurz. Wie man bereits bemerkt, ist die Anforderung an die Grafikkarte ein gutes Stück weiter gestiegen, und das, obwohl das Spiel von Grund auf eigentlich für die ältere Direct3D-9-Schnittstelle programmiert worden ist. Nichtsdestotrotz hat der Benchmark noch mit einem Problem zu kämpfen. So werden Teile der Vegetation nicht richtig dargestellt, was laut Techland am Alpha-to-Coverage-Verfahren liegt. Ab dem Catalyst 7.8 hat ATi stark die Bildqualität auf einer Radeon-HD-2000-Karte in die Höhe geschraubt, die nun gar besser als auf den GeForce-8x00-Karten von Nvidia ist. So werden zum Beispiel auf den ATi-Modellen die Schatten besser als auf einem G8x gefiltert, was in Bewegung ein deutlich ruhigeres Bild erzeugt. Die Vergleichbarkeit zwischen ATi- und Nvidia-Karten ist derzeit also nur eingeschränkt gewährleistet.
Call of Juarez D3D10 - G80 Call of Juarez D3D10 - R600
Auf den Patch 1.70 von Company of Heroes haben sicherlich viele Spieler gewartet, denn so bringt die aktuelle Version des Strategietitels nicht nur einige weitere Fehlerbeseitigungen mit sich, sondern führt auch die Unterstützung von Direct3D 10 ein. Die neue API kann man bei einer entsprechenden Grafikkarte im Spielmenü auswählen und schon erscheinen alle Levels in neuem Glanz. Darüber hinaus kann man die Terraindetails nun eine Stufe höher auf „Ultra“ schrauben, was einige Bodendetails hinzufügt und die Texturen sichtbar verbessert. Die Direct3D-10-Version bietet dem Spieler eine pixelgenaue Beleuchtung, Percentage Closer Filtering für die Soft Shadows auf allen D3D10-Beschleunigern, schönere Partikeleffekte sowie Alpha to Coverage für alle Bäume und Sträucher, die somit auch von herkömmlichen MSAA erfasst und bearbeitet werden. Als Benchmarksequenz verwenden wir wie in der Direct3D-9-Version von Company of Heroes den integrierten Benchmark.
Company of Heroes D3D10 - G80 Company of Heroes D3D10 - R600
Crysis – alleine der Name sagt wohl schon alles. Kaum ein anderes Spiel hat bereits vor der Veröffentlichung so viel Aufmerksamkeit erhalten wie der First-Person-Shooter von Crytek, der der inoffizielle Nachfolger zum Actionhit Far Cry ist. Far Cry sagt eigentlich auch schon alles: Denn kaum ein anderes Spiel lässt einen sofort an einen sonnigen Strand und an große Palmen denken. Und genau diesen (und noch viel mehr) sieht man in Crysis wieder, selbst wenn man ihn kaum wiedererkennen wird. Denn wie Far Cry setzt Crysis neue Maßstäbe in Sachen Grafik und hebt die Messlatte dabei gleich dermaßen hoch an, dass es wohl noch einige Zeit dauern wird, bis ein anderes Spiel die grafische Qualität von Crysis auch nur erreichen wird. Die Direct3D-10-API, High-Dynamic-Range-Rendering, Parallax Occlusion Mapping, Soft Shadows, Motion Blur, Depth of Field, Soft Particles und noch eine Menge mehr bekommt man bei Crysis geboten. Dementsprechend hoch fallen die Hardwareanforderungen aus, die selbst den schnellsten Rechner problemlos ins Schwitzen bringen. Als Benchmark verwenden wir in Crysis die integrierte GPU-Timedemo, die man mittels einer Batch-Datei ausführen kann.
Den Benchmark kann jeder am heimischen PC selber nachvollziehen. Damit dieser korrekt unter Windows Vista ausgeführt wird, muss der Crysis.exe das Attribut „Als Administrator ausführen“ gegeben werden. Anschließend funktioniert die unter „C:\Program Files\Electronic Arts\Crytek\Crysis SP Demo\Bin32“ versteckte Batch-Datei Benchmark_GPU.bat. Bei den Benchmarks werden jeweils die zuletzt im Spiel gewählten Settings genutzt. Darauf muss geachtet werden. Unter „C:\Program Files\Electronic Arts\Crytek\Crysis SP Demo\Game\Config“ kann mit Hilfe der benchmark_gpu.cfg eingestellt werden, wie häufig die Benchmarks wiederholt werden sollen. Damit der Benchmark auch nur annähernd spielbare Werte erzielt, haben wir sämtliche Details von „Very High“ auf „High“ zurückgestellt. Nichtsdestotrotz verwenden wir weiterhin die Direct3D-10-Version von Crysis.
Aufgrund eines Bugs im Catalyst 7.10 konnten wir in Crysis leider weder die Auflösung 1280x1024 noch 1600x1200 einstellen. Deswegen haben wir diese beiden Auflösungen mit dem Catalyst 7.9 getestet.
Das Actionspiel „Lost Planet“ gibt es in zwei verschiedenen Versionen: Eine Direct3D-9- und eine Direct3D-10-Variante; letztere hat es in unseren Parcours geschafft. Das Spiel kann technisch nicht nur durch die D3D-10-Erweiterung und somit der Nutzung des Shader-Model 4 inklusive des neuen Geometry-Shaders glänzen, auch abseits der API weiß Lost Planet zu gefallen. Mit Soft Shadows (diese sind in Lost Planet zwar an die D3D10-Version gekoppelt, mit Direct3D 10 hat diese Schattenvariante aber nichts zu tun), FP16-High-Dynamic-Range-Rendering, detaillierten Texturen, massig Partikeleffekte und noch vielem mehr ist das technisch weit fortgeschrittene Spiel ein regelrechter Augenschmaus; das Lost Planet dabei noch eine menge Spaß macht könnte man fast schon als nebensächlich bezeichnen. Die Demoversion des Spiels bietet praktischerweise eine integrierte Benchmarksequenz, die einen Kameraflug aus der Sicht des Spielers durch zwei verschiedene Levels zeigt. Aus uns unbekannten Gründen scheint auf einer Radeon-HD-2000-Karte derzeit der so genannte „Fur“-Shader nicht zu funktionieren, der für die Felldarstellung verantwortlich ist.
Mittlerweile sehen Strategiespiele zwar deutlich besser aus als noch vor einigen Jahren, so recht gelingen will es den Programmen aber nur selten, in die Königsklasse, die meist von First-Person-Shootern besetzt wird, vorzudringen. Den Entwicklern von World in Conflict scheint dies nicht gereicht zu haben und man entwickelte eine Grafikengine, die sich vor keinem anderen Spiel zu verstecken braucht. World in Conflicht unterstützt die Direct3D-10-API und hat keine Schwierigkeiten, Kantenglättung unter der neuen Programmierschnittstelle anzuwenden. Schicke Shadereffekte zieren das Spiel (so wirft die Sonne beispielsweise Lichtstrahlen durch die Wolken, die die Umgebung beleuchten), ebenso detaillierte Texturen und eine realistische Schattendarstellung. Die Animationen der Spielcharaktere sind gut gelungen, was in Kombination mit einer kinoreifen Schnittreihenfolge Filmatmosphäre in den Zwischensequenzen aufkommen lässt. Als Testsequenz benutzen wir nicht die integrierte Benchmarkfunktion, da diese sich etwas seltsam verhält. Stattdessen verwenden wir die Introsequenz zur ersten Kampagne der Demo.
Kommen wir nun abschließend zum Performancerating. Dadurch soll es erleichtert werden, alle Ergebnisse auf einen Blick zusammengefasst zu bekommen. Da die synthetischen Benchmarks in dem Testparcours (sprich der 3DMark06) über keine Spiele-Engine verfügen und somit keine realistische Aussagen über die Geschwindigkeit in 3D-Titeln wiedergeben, haben wir diese Applikationen aus dem Rating herausgenommen.
Da quasi alle aktuellen Modelle über eine herstellerseitige Lüftersteuerung verfügen, unterscheiden wir bei den Messungen den 2D- und den 3D-Betrieb. Für die Last-Messungen wird der 3DMark06 in der Endlosschleife ausgeführt und nach dreißig Minuten die Lautstärke notiert. Beide Messungen werden im Abstand von 15 cm zur Grafikkarte durchgeführt. Um nur die Lautstärke der jeweiligen Grafikkarte messen zu können, wurden beim Test die Gehäuselüfter vom Netz getrennt. Die Messung erfolgt für das gesamte Testsystem.
„Nanu, läuft denn der Lüfter der Grafikkarte überhaupt?“ Diese Frage stellten wir uns, als wir den mit der GeForce 8800 GT bestückten Rechner zum ersten Mal starteten. Ja, der Lüfter lief tatsächlich, allerdings agierte er unter Windows auf einem derartig niedrigen Geräuschniveau, dass die Grafikkarte aus unserem geschlossenen, mit CPU- und Gehäuselüfter versehenen Gehäuse nicht auszumachen war. Selbst bei genauestem Hinhören macht es keinerlei Unterschied, ob nun eine passiv gekühlte Grafikkarte oder eine GeForce 8800 GT ihr Werk verrichtet. Ein ruhiges Arbeiten ist mit der Nvidia GeForce 8800 GT somit ohne Weiteres möglich – ein Silent-PC wird sich freuen.
Selbst eine längere Lastphase scheint den Kühler der GeForce 8800 GT nicht zu interessieren, denn er dreht nur unwesentlich auf, weswegen der Rechner nicht hörbar lauter wird. Ob man sich nun in einem Spiel, oder auf dem Windows-Desktop befindet, kann man anhand der Lautstärke einer GeForce 8800 GT nicht unterscheiden. Sehr gut! Die GeForce 8800 GT setzt sich mit den gemessenen 48 Dezibel auf den ersten Platz in unserem Testparcours und überholt den bisherigen Spitzenreiter, die GeForce 7900 GTX. Im Vergleich dazu arbeitet die etwas schnellere GeForce 8800 GTX nur marginal lauter, während das Konkurrenzprodukt von ATi, die Radeon HD 2900 XT, in einer ganz anderen Liga spielt.
Ähnlich den Messungen zur Lautstärke werden auch die Temperaturmessungen durchgeführt. Fast alle aktuellen Grafikkarten besitzen Sensoren, die per Treiber oder Hersteller-Tool ausgelesen werden können. Die Kern-Temperatur wird dabei im Ruhezustand im Windows-Desktop und unter Last nach dreißig Minuten 3DMark06 abgelesen. Zudem messen wir mit Hilfe eines Infrarot-Thermometers die Chiptemperatur auf der Rückseite der Grafikkarte.
Was dem Ohr sein Freund, das ist der Temperatur sein Feind. Höchstwahrscheinlich dank der angenehm leisen Kühlung ist die G92-GPU trotz des 65-nm-Prozesses auf unseren Karten ein richtig heißer Kopf. Unter Windows hält sich die Temperaturentwicklung mit gemessenen 59 Grad Celsius zwar noch im Rahmen. Deutlich höher wird es dagegen unter Last, wo die GeForce 8800 GT der magischen 100-Grad-Grenze ziemlich nahe kommt (gefährlich sind die Temperaturen für eine moderne GPU aber nicht). Wir konnten 93 Grad Celsius (95 °C mit SLI) auf der GPU messen, was ein neuer Rekord in unserem Testfeld ist. Wärmer wurde bis jetzt noch keine Grafikkarte mit einem aktiven Kühlsystem.
Auf der Chiprückseite messen wir ebenfalls hohe Temperaturwerte. 73 Grad Celsius lautet das Ergebnis, das nur noch knapp von der GeForce 7950 GX2 geschlagen wird. Probleme während des Testlaufs hatten wir mit der GeForce 8800 GT aber keine, da entsprechende Grafikkarten, wie oben bereits erwähnt, für diesen Temperaturbereich (und noch mehr) ausgelegt sind. Nichtsdestotrotz sollte man einer GeForce 8800 GT kein nicht belüftetes Gehäuse zumuten. Denn in warmen Sommertagen könnte so schnell ein Hitzestau entstehen, der das Fass zum Überlaufen bringt.
Für die Messungen der Leistungsaufnahme wird ein handelsüblicher Verbrauchs-Monitor, den man sich auch beim örtlichen Stromversorger ausleihen kann, genutzt. Gemessen wird die Gesamt-Leistungsaufnahme des Testsystems. Auch hier gilt die Teilung zwischen Idle- und Last-Betrieb. Letzterer wird durch Verwendung des 3DMark06 unter der Auflösung 1600x1200 sowie 4-fachem Anti-Aliasing und 16-fachem anisotropen Filter simuliert.
Mit der G80-GPU hat Nvidia eine starke Chip-Architektur entwickelt, die einen einzigen Nachteil hat: Der Leistungshunger der GPU ist sowohl unter Windows als auch unter Last sehr hoch (auch wenn er relativ zur Leistung gegenüber der Vorgängergeneration gesunken ist). Der 65-nm-Prozess der G92-GPU sollte Nvidia dabei helfen, die Leistungsaufnahme senken zu können. Und es scheint zu funktionieren. Unter Windows zieht die GeForce 8800 GT mit dem Rest des Systems 196 Watt aus der Leitung, womit sich der 3D-Beschleuniger – ungefähr auf dem Niveau einer GeForce 7900 GTX – im Mittelfeld platzieren kann. Im Vergleich: Eine (etwas schnellere) GeForce 8800 GTX benötigt 233 Watt.
Unter Last hat sich der Strombedarf ebenfalls stark gebessert. 248 Watt konnten wir schlimmstenfalls messen, was erneut ein Platz im Mittelfeld bedeutet. Die GeForce 8800 GTX benötigt mit 300 Watt um einiges mehr Leistung, die GeForce 7900 GTX dagegen erneut nur knapp weniger. Nvidia hat mit der GeForce 8800 GT gezeigt, dass mit Verbesserungen in der Architektur die Leistungsaufnahme spürbar gesenkt werden kann. Ein Sparwunder ist logischerweise nicht drin. Für die gezeigten Leistungen ist der Stromverbrauch der GeForce 8800 GT aber angemessen.
Vielen dort draußen wird die gerade neu gekaufte Grafikkarte noch nicht schnell genug sein. Ein probates Mittel, dieses Bedürfnis nach noch mehr Geschwindigkeit zu befriedigen, ist die Hardware zu übertakten. Als kleine Stabilitätsprobe ließen wir den 3DMark06, der besonders grafiklastig ist, laufen und testeten nachfolgend den höchsten Takt mit Hilfe von Company of Heroes, F.E.A.R und Prey. Jedoch muss man vor den Messungen anmerken, dass sich die Ergebnisse nicht auf jede Karte desselben Typs übertragen lassen, da die Güte von Chip zu Chip unterschiedlich ist.
Nach Nvidias Bemerkung, dass die G92-GPU auf der GeForce 8800 GT noch recht moderat getaktet ist, waren wir gespannt, wie hoch wir die Frequenzen auf unseren beiden Testsamples treiben können. Und in der Tat, die Leistungssteigerungen sind durchaus beachtlich. Die TMU-Domäne der G92-GPU konnten wir im besseren der beiden Fälle auf gute 725 MHz anheben (auf dem zweiten Exemplar auf 712 MHz), was ein Plus von satten 125 MHz bedeutet. Die Shaderdomäne lief selbst noch mit 1728 MHz (1620 MHz) ohne Grafikfehler oder Abstürze. Ebenfalls genügend Spielraum, der im Gegensatz zur GPU aber geringer ausfällt, hat der verbaute Speicher. Auf der Grafikkarte mit den höheren GPU-Frequenzen war nach einer Taktfrequenz von 1000 MHz das Ende der Fahnenstange erreicht, während das andere Exemplar noch bis 1050 MHz ohne Probleme seinen Dienst verrichtete.
Somit konnten wir durchschnittlich eine Leistungssteigerung von guten 15 Prozent erreichen. Company of Heroes fiel aus der Reihe und lief gar um etwa 21 Prozent schneller. Taktreserven hat die GeForce 8800 GT also genügend, was auch die aus dem Erdboden sprießende Anzahl von von Haus aus übertakteten GeForce-8800-GT-Karten erklärt. Hersteller wie XFX, Zotac und MSI bieten entsprechende Produkte an.
VC-1-Wiedergabe
Noch vor einigen Jahren standen sämtliche PCs vor der damals komplizierten Aufgabe, ein DVD-Video zu decodieren. Nachdem damals zuerst die CPU alleine ackern musste, und diese des Öfteren damit überfordert war, kam es bei den Grafikchipspezialisten in die Mode, ihre 3D-Beschleuniger mit speziellen Funktionen auszustatten, um dem Prozessor die Hauptarbeit des Dekodierens abzunehmen. Ein netter Nebeneffekt war, dass die Grafikkarten mit speziellen Algorithmen arbeiten konnten, der die Bildqualität ohne einen großen Leistungsaufwand verbessern konnte. DVDs sind mittlerweile schon längst keine Herausforderung mehr. Ein moderner PC steht mittlerweile vor deutlich schwereren Aufgaben: Das Decodieren von im VC-1- oder H.264-Codec befindlichen HD-Videos, die auf einer Blu-ray oder einer HD DVD aufgenommen worden sind (HD-Trailer haben zwar dieselben Codecs sowie eine identische Bildqualität, allerdings sind diese nicht verschlüsselt, weswegen die CPU-Auslastung um einiges geringer ausfällt). Wir haben uns als Film für „Children of Men“ auf einer HD DVD (1024p, 24 Bilder pro Sekunde) entschieden, der im VC-1-Codec auf einer HD DVD vorliegt. Wir messen sekündlich die CPU-Auslastung der ersten zweieinhalb Minuten des Films und bilden jede fünfte Sekunde in einem Verlaufsdiagramm ab.
Obwohl uns bewusst ist, dass ATi mit der Radeon HD 2400 sowie Radeon HD 2600 Grafikkarten im Angebot hat, die HD-Material deutlich besser als die Radeon HD 2900 XT beschleunigen können, haben wir diese an dieser Stelle absichtlich außen vor gelassen. Die beiden ATi-Produkte spielen in einer ganz anderen Preisklasse als die GeForce 8800 GT – dort bietet ATi (noch) nur die Radeon HD 2900 XT an.
Das Ergebnis spricht eine eindeutige Sprache: Obwohl Nvidias Videoprozessor auf der GeForce 8800 GT nicht den kompletten VC-1-Codec beschleunigen kann, zieht der 3D-Beschleuniger vor der Radeon HD 2900 XT davon. Bei dieser scheint auf dem Catalyst 7.10 zu allem Überfluss aktuell überhaupt keine Hardwarebeschleunigung des VC-1-Codecs zu funktionieren (auch nicht mit einer Radeon HD 2400 oder Radeon HD 2600), da der Softwareplayer bei der Wiedergabe der HD DVD mitteilt, dass die Videobeschleunigung deaktiviert ist. Mit dem Catalyst 7.7 funktioniert dies hingegen noch einwandfrei. Probleme gab es während der Wiedergabe auf der Radeon HD 2900 XT dennoch keine.*
* Da wir unser Testsystem an einem 30-Zoll-Monitor von Dell betreiben, ist es bei der Wiedergabe von HD-DVD- oder Blu-ray-Disks von Nöten, dass die Grafikkarte bei einer Dual-Link-DVI-Auflösung den HDCP-Kopierschutz verwenden kann. Leider sind dazu bis jetzt noch nicht allzu viele Grafikkarten in der Lage, weswegen wir an dieser Stelle keine Ergebnisse der GeForce 8800 GTS darstellen können. Die GeForce 8800 GT sowie die Radeon HD 2900 XT von ATi sind dazu aber in der Lage und funktionieren auch einwandfrei.
Preis-Leistung-Verhältnis
Neben der Leistung, der Bildqualität und den sonstigen Eigenschaften einer modernen Grafikkarte spielt der Preis für die meisten Käufer eine entscheidende Rolle. Denn was nützt einem die schnellste GPU, wenn sie schlicht unbezahlbar ist? Aus diesem Grund haben wir ein Diagramm mit allen 3D-Beschleunigern aus dem Testparcours zusammengestellt und die günstigsten Preise bei Geizhals [23] heraus gesucht. Dabei wird der Preisindex nicht nur nach dem günstigsten Preis erstellen, die Hardware muss auch erhältlich sein. Wir weisen darauf hin, dass sich der Preis der bevorzugten 3D-Karte täglich ändern kann, weswegen eine dauerhafte Korrektheit nicht garantiert werden kann. (Stand der Preise: 2.11.2007)
Die offizielle Preisempfehlung von Nvidia für eine GeForce 8800 GT liegt bei 229 Euro. Einen Blick auf Geizhals verrät allerdings, dass dieser Preis zurzeit kaum eingehalten wird. Der Grund ist ein Unterversorgung des Marktes mit der Grafikkarte. Der Ansturm auf die GeForce 8800 GT ist dermaßen hoch, dass Nvidia nicht genügend Chips produzieren kann. So lassen sich Händler, die Modelle verfügbar haben, diese Verfügbarkeit entsprechend versilbern. Erst ab 260 Euro sind Karten lieferbar. Wenn sich die Situation entspannt hat, sollte der Preis recht schnell auf 240 Euro fallen.
Im Folgenden wird nun das Preis-Leistung-Verhältnis der im Test vertretenen Karten bestimmt. Dabei wird das Performance-Rating durch den Preis dividiert und mit 1000 Multipliziert. Das Ergebnis repräsentiert die Leistung, die man kaufmännisch gerundet für einen Euro erhält. Das Preis-Leistung-Verhältnis wurde für verschiedene Auflösungen und Qualitätseinstellungen ermittelt.
Da ist sie nun, die Grafikkarte, die laut Nvidia seit der legendären GeForce 4 TI 4200 das beste Preis-Leistung-Verhältnis zu bieten hat. Für etwa 260 Euro wandert die im Performance-Segment angesiedelte Grafikkarte derzeit über die Ladentheke, womit Nvidia ein Preissegment anspricht, das bis jetzt etwas vernachlässigt worden ist. Einzig die GeForce 8800 GTS 320 konnte mit der Zeit annähernd dieses Niveau erreichen.
Ohne Anti-Aliasing sowie die anisotrope Filterung ist die Leistung der GeForce 8800 GT unter DirectX 9 sehr hoch und erreicht ohne große Mühe die Werte einer teureren GeForce 8800 GTX. In 1280x1024 liegt die GeForce 8800 GT nicht spürbare 3,5 Prozent hinter dem größeren Bruder und kann sich leicht von ATis Radeon HD 2900 XT mit einer Differenz von zehn Prozent absetzen. Die GeForce 8800 GTS hat man gar spielend im Griff. In 1600x1200 sieht es für die GeForce 8800 GT immer noch gut aus. Der Rückstand auf die GeForce 8800 GTX steigt mit sechs Prozent knapp an, die Radeon HD 2900 XT kann man aber immer noch auf denselben Abstand halten. Die GeForce 8800 GTS ist erneut kein würdiger Gegner. Für 2560x1600 mangelt es der GeForce 8800 GT leicht an Speicher und an Speicherbandbreite, weswegen der Rückstand zur GeForce 8800 GTX auf knapp 14 Prozent ansteigt – nichtsdestotrotz ist die Leistung für einen Preis von 260 Euro immer noch sehr gut. Die Radeon HD 2900 XT kommt leicht bis auf acht Prozent heran, während die GeForce 8800 GTS den Rückstand auf 25 Prozent verkürzt.
Nvidia GeForce 8800 GT
Mit den beiden qualitätssteigernden Features ist die Leistung der GeForce 8800 GT in 1280x1024 immer noch den meisten anderen Konkurrenten überlegen. Die GeForce 8800 GTX muss man um 13 Prozent ziehen lassen, während die GeForce 8800 GTS auf 20 Prozent heran kommt. Die Radeon HD 2900 XT hat man mit einem Vorsprung von 23 Prozent unter Kontrolle. In 1600x1200 wird die GeForce 8800 GT aufgrund des kleineren Speichers und der geringeren Speicherbandbreite erstmals spürbar langsamer. Die GeForce 8800 GTX zieht mit 27 Prozent auf und davon, während die GeForce 8800 GTS nur noch 13 Prozent zurück liegt. Die Radeon HD 2900 XT hält man mit einer 20 Prozent besseren Performance auf Abstand. In noch höheren Einstellungen verliert die GeForce 8800 GT dann teilweise deutlich gegenüber der GeForce 8800 GTX und liegt mehr als 30 Prozent zurück. In 2560x1600 hält der 3D-Beschleuniger die GeForce 8800 GTS und die Radeon HD 2900 XT interessanterweise jedoch immer noch gut in Schach, wobei jedoch in einigen Spielen mehr oder weniger ein Totalausfall auftritt, da der Speicher zu klein ist. Acht-faches Anti-Aliasing ist nicht mehr sinnvoll, selbst in 1600x1200 gibt es bereits des Öfteren Probleme.
Die Direct3D-10-Performance ist ohne Anti-Aliasing sowie der anisotropen Filterung ebenso sehr gut und erreicht in etwa die Verhältnisse der älteren API. Mit den qualitätssteigernden Features fällt die GeForce 8800 GT aber stärker zurück. Die GeForce 8800 GTS ist nun in etwa gleich schnell, während die Radeon HD 2900 XT noch etwa 18 Prozent langsamer ist. Für 2560x1600 muss dann aber endgültiger ein 3D-Beschleuniger vom Kaliber einer GeForce 8800 GTX oder einer GeForce 8800 Ultra her – am besten in einer SLI-Konfiguration.
Nvidia GeForce 8800 GT Logo
Einen hervorragenden Eindruck hinterlässt die GeForce 8800 GT in der Disziplin der Lautstärke. Selten zuvor konnte ein schneller 3D-Beschleuniger derart überzeugen. Die Grafikkarte ist zu keiner Zeit hörbar und eignet sich somit perfekt für einen Silent-PC. Selbst nach einer mehrstündigen Lastphase bleibt die GeForce 8800 GT flüsterleise! Weitere Verbesserungen gab es bei der Leistungsaufnahme. Die GeForce 8800 GT ist um einiges sparsamer als die Vorgänger auf der G8x-Generation, wobei diesbezüglich vor allem der moderne 65-nm-Prozess geholfen haben sollte.
Auch bezüglich der Bildqualität gibt es (beinahe) nichts zu meckern, da diese identisch zu den bisherigen GeForce-8800-Karten geblieben ist. Die Kantenglättung ist sehr gut und meistens gleich auf mit dem Anti-Aliasing einer Radeon HD 2900. Je nach Modus und Spiel bietet mal die eine, mal die andere Karte Vorteile. Punkten kann der G80/G92 immer noch bei der anisotropen Filterung. An dessen Qualität reicht bis jetzt kein anderer 3D-Beschleuniger heran.
Ebenfalls als positiv zu bewerten ist die Integration von PureVideo HD in die GeForce-8800-Serie. Damit kann nun die GPU der CPU einiges an Arbeit abnehmen und selbst bei langsameren Prozessoren bleibt die Wiedergabe eines HD-Videos flüssig. Weder die bisherigen GeForce-8800-, noch die Radeon-HD-2900-Karten können dort überzeugen. Einzig der VC-1-Codec wird noch nicht voll beschleunigt. Hier wünschen wir uns, dass in Zukunft die GPU diese Arbeit ebenso erledigen kann. Der PCIe-2.0-Standard gehört stattdessen eher in die Kategorie „schön zu haben, aber sicherlich kein muss“. Vorteile in Spielen wird es in nächster Zeit mit dem neuen Standard sicherlich keine geben.
Fazit
Einen handfesten Kritikpunkt bei der GeForce 8800 GT zu finden, fällt schwer. Einzig bemängeln könnte man die derzeit schlechte Verfügbarkeit der Grafikkarte. Ansonsten hat sie keinen Schwachpunkt. Durch die das Angebot übersteigende Nachfrage ist es derzeit allerdings nicht nur schwer, sich überhaupt eine GeForce 8800 GT zu zulegen. Darüber hinaus liegt der Preis zurzeit mit etwa 260 Euro für ein sofort lieferbares Exemplar deutlich über der Preisempfehlung des Herstellers.
Davon abgesehen ist die GeForce 8800 GT die drittschnellste Grafikkarte auf dem Markt, kostet allerdings nur die Hälfte des Top-Modells und ist in den meisten Qualitätseinstellungen nicht viel langsamer als das GTX-Modell. Falls die Einstellungen nicht höher als 1600x1200 mit vier-fachem Anti-Aliasing sowie 16-facher anisotroper Filterung sein müssen, können wir die GeForce 8800 GT jedem Käufer wärmstens empfehlen. Einzig wer in 2560x1600 noch gerne Kantenglättung hinzuschalten möchte, für den lohnt es sich, nach einem noch potenteren 3D-Beschleuniger Ausschau zu halten. Ansonsten gibt es selbst für derzeit noch „inklusive Engpassaufpreis“ zu verstehende 260 Euro keine Konkurrenz. Weder von Nvidia, noch von ATi.
Darüber hinaus erhält der Käufer eine sehr gute Bildqualität sowie eine sinnvolle (wenn auch nicht optimale) Videobeschleunigung für HD-Videos. Bezüglich der Lautstärke muss man sich bei einer GeForce 8800 GT mit Referenztaktraten keinerlei Gedanken machen. Der Lüfter ist der leiseste, den wir seit langem gehört haben. Der PCIe-2.0-Standard sollte dagegen kein Kaufkriterium sein. Aufgrund der gezeigten Leistungen für den angemessenen Kaufpreis vergeben wir der Nvidia GeForce 8800 GT verdient unsere neue ComputerBase-Empfehlung.