Einleitung
Etwas mehr als ein Jahr ist es mittlerweile her, dass die letzte (mehr oder weniger) wirklich neue Grafikkarten-Serie präsentiert wurde. Die Rede ist hier von der ATi Radeon X1800 XT mit R520-Chip, die heute aufgrund des Nachfolgers R580 größtenteils in Vergessenheit geraten ist. GeForce 7900 GTX, Radeon X1900 XTX, GeForce 7950 GX2 sowie Radeon X1950 XTX lauten die Namen der Grafikkarten, die innerhalb dieses Jahres im High-End-Segment neue Rekordwerte aufgestellt haben, ansonsten jedoch nur wenig Neues zu bieten hatten. Am heutigen Tag, dem 8. November 2006, präsentiert der Grafikchiphersteller nVidia die „GeForce 8800 GTX“ sowie die „GeForce 8800 GTS“, die, wie die Namen bereits erahnen lassen, nach einer langen Ruhepause wieder viele Neuigkeiten bieten können.
Die GPU der GeForce-8800-Generation hört auf den Namen „G80“, von dem in den letzten Wochen viel Wahrheit, allerdings auch viel Falsches den Weg in das World Wide Web gefunden haben. So war von unendlich hoch klingenden Taktraten, abstrus vielen Shadereinheiten, verwirrenden VRAM-Größen und weiterem die Rede, was insgesamt mehr irritierte als dem potenziellen Käufer geholfen hat. Vor allem, wenn einem einige kleine, aber dennoch wichtige Details der Architektur fehlten. Nichtsdestotrotz waren diese Spekulationen sicherlich hilfreich, um sich schon vor dem Launch ein Bild der neuen GeForce-Modelle machen zu können.
Vollständige Direct3D-10-Unterstützung, eine komplett in Hardware gegossene Unified-Shader-Architektur – das Gerücht, dass der G80 über keine Unified Shader verfügen wird, wurde übrigens absichtlich zur Täuschung im Internet verbreitet – 128 Stream-Prozessoren, sensationelle 681 Millionen Transistoren, 768 MB RAM, ein 384 Bit großes Speicherinterface, ein verbessertes Anti-Aliasing sowie eine stark modifizierte anisotrope Filterung sind einige der Feinheiten der G80-Architektur, die auf den ersten Blick schon mehr als nur ein klein' Wenig Interesse wecken. Ob all dies reichen wird, um gegen ATis zukünftige R600-GPU bestehen zu können, ist derzeit noch ungewiss. Schon heute ist aber das Duell zwischen der GeForce 8800 GTX sowie den „älteren“ Modellen spannend.
nVidia konnte uns freundlicherweise ein Exemplar der GeForce 8800 GTX zur Verfügung stellen, das wir ausführlich unter die Lupe nehmen werden. Dabei durchleuchten wir nicht nur die Architektur. Auch die Bildqualität und natürlich die Performance werden untersucht. Stellt sich zum Schluss nur noch eine Frage: Wie gut ist sie wirklich, die wohl aufwendigste GPU für den Desktop-Markt, die je entwickelt worden ist?
Lesezeichen
- nVidia GeForce 7950 GX2 Quad-SLI [1]
- nVidia GeForce 7950 GX2 [2]
- GeForce 7600 GT, 7900 GT und 7900 GTX [3]
- nVidia GeForce 7950 GT [4]
- nVidia GeForce 7900 GS [5]
- nVidia GeForce 7800 GTX 512 SLI [6]
- nVidia GeForce 7800 GTX 512 [7]
- nVidia GeForce 7800 GTX (SLI) [8]
- nVidia GeForce 7800 GT [9]
- nVidia GeForce 7800 GS [10]
- nVidia GeForce 7600 GS [11]
- nVidia GeForce 7300 GS [12]
- ATi Radeon X1950 XTX und X1950 CrossFire [13]
- ATi Radeon X1900 XTX und X1900 CF-Edition [14]
- ATi Radeon X1900 XT 256 MB [15]
- ATi Radeon X1900 GT [16]
- ATi Radeon X1800 XT CrossFire-Edition [17]
- ATi Radeon X1800, X1600 und X1300 [18]
- ATi Radeon X1800 GTO [19]
- Radeon X1000 vs. GeForce 7 [20]
Technische Daten
Bevor wir uns mit der G80-GPU und den Änderungen der Architektur im Detail beschäftigen, möchten wir mit den obligatorischen Spezifikationen des neuen Chips starten, der alles am Grafikkarten-Markt bisher dagewesene in den Schatten stellt.
| Radeon X1950 XTX |
GeForce 7900 GTX |
GeForce 7950 GX2 |
GeForce 8800 GTX |
GeForce 8800 GTS |
|
|---|---|---|---|---|---|
| Logo | |||||
| Chip | R580+ | G71 | G71 | G80 | G80 |
| Transistoren | ca. 384 Mio. | ca. 278 Mio. | ca. 2x 278 Mio. | ca. 681 Mio. | ca. 681 Mio. |
| Fertigung | 90 nm | 90 nm | 90 nm | 90 nm | 90 nm |
| Chiptakt | 650 MHz | 650MHz | 500 MHz | 575 MHz | 500 MHz |
| Shadertakt | 650 MHz | 650MHz | 500 MHz | 1350 MHz | 1200 MHz |
| Pixel-Pipelines | 16 | 24 | 2x 24 | X | X |
| Shader-Einheiten (MADD) |
48 (4D) | 48 (4D) | 48 (4D) | 128 (1D) | 96 (1D) |
| FLOPs (MADD/ADD) | 374 GFLOPs | 250 GFLOPs | 2x 192 GFLOPs | 518 GFLOPs | 346 GLOPs |
| ROPs | 16 | 16 | 2x 16 | 24 | 20 |
| Pixelfüllrate | 10400 MPix/s | 10400 MPix/s | 2x 8000 MPix/s | 13800 MPix/s | 10000 MPix/s |
| TMUs | 16 | 24 | 2x 24 | 64 | 48 |
| Texelfüllrate | 10400 MTex/s | 15600 MTex/s | 2x 12000 MTex/s | 36800 MTex/s | 24000 MTex/s |
| Vertex-Shader | 8 | 8 | 2x 8 | X | X |
| Unified-Shader in Hardware |
X | X | X | ✓ | ✓ |
| Pixelshader | PS 3.0 | PS 3.0 | PS 3.0 | SM 4 | SM 4 |
| Vertexshader | VS 3.0 | VS 3.0 | VS 3.0 | SM 4 | SM 4 |
| Geometryshader | X | X | X | ✓ | ✓ |
| Speichermenge | 512 GDDR4 | 512 GDDR3 | 2x 512 GDDR3 | 768 GDDR3 | 640 GDDR3 |
| Speichertakt | 1000 MHz | 800 MHz | 600 MHz | 900 MHz | 800 MHz |
| Speicherinterface | 256 Bit | 256 Bit | 256 Bit | 384 Bit | 320 Bit |
| Speicherbandbreite | 64000 MB/s | 51200 MB/s | 2x 38400 MB/s | 86400 MB/s | 64000 MB/s |
Verglichen mit heutigen Prozessoren ist der G80 ein wahres Monster. Intels Core 2 Duo bringt insgesamt 291 Millionen Transistoren auf die Waage; auch der Quad-Core bleibt mit 582 Mio. Schaltern hinter nVidia zurück. Aufgrund Intels 65 nm-Fertigungstechnologie ist der Core 2 Duo mit 143 mm² (2x143 mm² der Quad-Core) bedeutend kleiner, sodass auch die Chipausbeute (Yield-Rate) weniger problematisch ist, die bekanntlich exponentiell mit steigender Chipfläche abnimmt. Intel selbst hat bekannt gegeben, auf einem 300-mm-Wafer insgesamt 320 funktionsfähige Dual-Core-Kerne (für 160 Quad-Core-CPUs) zu erhalten [21], was einer Ausbeute von etwa 75 Prozent entspricht.
Während Intel 320 funktionsfähige Chips erhält, kommt nVidia (im nicht eintreffenden Idealfall mit 100 Prozent Ausbeute) auf 118 Chips, von denen erwartungsgemäß der kleinere Teil als GeForce 8800 GTX eingesetzt werden kann – kein Wunder, dass GeForce 8800-Karten zum Startschuss im Hochpreis-Segment angesiedelt sind, ist doch bereits der Grafikchip alles andere als billig in der Herstellung. Hinzu kommt ein kompliziertes Platinenlayout und schneller GDDR3-Speicher. Insofern ist der G80 stark mit Intels Transistor-Monstern wie dem Dual-Core-Itanium 2 „Montecito“ [22] (596 mm² Chipfläche, 1,72 Mrd. Transistoren, 90 nm) oder dem Dual-Core Xeon 7100 „Tulsa“ [23] (424 mm², 1,38 Mrd. Transistoren, 65 nm) zu vergleichen. Diese Spielen mit Großhandelspreisen von 3,692 US-Dollar und 1,980 US-Dollar (bei der Abnahme von 1000 Stück) im Vergleich zu den Desktop-Prozessoren preislich in anderen Regionen.
Auch AMDs Dual-Core Athlon 64 X2 mit 2x 1 MB Cache oder die aktuelle Opteron-Familie für den Sockel F ist mit 227,4 Mio. Transistoren und einer Chipfläche von 230 mm² bei 90 nm-Fertigung ein Winzling gegen den G80. Nicht einmal zwei vollwertige Dual-Core-CPUs kommen an nVidia heran. Außerdem sollte man nicht vergessen, dass die Prozessoren darüber hinaus den Vorteil haben zu großen Teilen aus leichter zu fertigen Cache zu bestehenden, während bei nVidia ganz klar die Logik-Komponenten überwiegen.
Durch den Vergleich mit den klassischen Prozessoren von AMD und Intel wird deutlich, welche Entwicklungsleistung hinter dem neuen Chip von nVidia steckt, den wir nun im Detail beleuchten werden.
Technik im Detail Part 1
Auch wenn bereits klar war, dass nVidia die GPU der GeForce-8800-Serie, namentlich den G80, gegenüber dem Vorgänger G7x deutlich erweitern musste, kommt es trotzdem überraschend, dass im Endeffekt mehr verändert wurde, als die ersten Gerüchte vermuten ließen. Wenig überraschend ist die Unterstützung der neuen Direct3D-API in der Version 10, die mit dem in Kürze erhältlichen Betriebssystem Windows Vista Einzug erhalten wird. Erstaunlicher ist dagegen, dass die Kalifornier beim G80 auf eine komplette Unified-Shader-Architektur setzen, da man beim G80 eigentlich vom Erhalt des klassischen Designs mit getrennten Pixel-, Vertex- und Geometryshadern ausgegangen ist. Denn diese ist, obwohl des Öfteren das Gegenteil behauptet wird, nicht zwingend Voraussetzung für Direct3D 10. Einzig ein „Unified Shader Core“ muss vorhanden sein. Sprich die ALUs müssen alle vorhandenen Shaderarten berechnen können, unabhängig davon, ob die Einheiten als Pixel- oder Vertexshader deklariert sind.
Der G80, der vorerst auf dem Topmodell GeForce 8800 GTX sowie auf der etwas langsameren Variante GeForce 8800 GTS verbaut wird, beweist sich mit seinen 681 Millionen Transistoren als ein wahres Monster, das weiterhin im 90-nm-Prozess bei TSMC hergestellt wird und dessen Entwicklung bereits im Jahr 2002 begonnen haben soll. Der G80 verfügt über insgesamt 128 Stream-Prozessoren (GTX: 128; GTS: 96), die die ehemals getrennten Shadervarianten der klassischen Architektur ablösen. Bei der klassischen Pipeline nimmt die GPU die Kommandos der CPU entgegen und berechnet zuerst die Geometrie im Vertex-Shader. Anschließend werden im „Triangle-Setup“ die Vertices (Eckpunkte) in Primitive (wie beispielsweise eine Linie oder ein Dreieck) umgewandelt, bevor im Fragmentshader (die D3D-Spezifikation spricht hier vom Pixelshader) unter anderem Pixeltexturing sowie Farbbestimmungen durchgeführt werden. Schlussendlich finden in den ROPs noch Z-Berechnungen (Sichtbarkeitsprüfungen) und das Anti-Aliasing statt, bevor die fertigen Daten in den Framebuffer geschrieben werden.
Diese klassische Pipeline ist schon seit vielen Jahren im Einsatz, bietet jedoch ein paar Nachteile. So werden beispielsweise traditionell mehr Pixelshader-Anweisungen als Vertexshader-Programme verwendet, was schnell eine ungleiche Auslastung des 3D-Beschleunigers zur Folge hat, da eine Einheit mit Anweisungen regelrecht überquillt, während sich die andere ALU im Leerlauf langweilt. Zudem war es kompliziert, fertig berechnete Daten durch einen erneuten Pipelinedurchlauf zu modifizieren, was allerdings eher eine Limitierung der Direct3D-9-API ist. Bei der Direct3D-10-GPU G80 fallen nun beide Nachteile weg. So sind die 128 Streamprozessoren in der Lage, sowohl Vertex- als auch Pixel- und Geometryanweisungen zu verarbeiten. Dadurch ist es zumindest theoretisch möglich, dass alle ALUs durch die Bank maximal ausgelastet sind und kein unnötiger Leerlauf entsteht. Ob dies aber tatsächlich immer der Fall ist, kann man nur vermuten. Einen wichtigen Anteil an der Auslastung trägt dabei der so genannte „Thread-Prozessor“, der den Shadercode auf die 128 Shadereinheiten verteilt.
Wie weiter oben erwähnt, ist die GeForce 8800 in der Lage, Daten, die den Shadercore bereits durchlaufen haben, erneut im Shadercore zu modifizieren. Der Output des Streamprozessors wird dabei in ein Register, einen extrem schnellen Zwischenspeicher, geschrieben und anschließend entweder erneut durch den Unified Shader Core geschleust (eine „Loop-Funktion“) oder an die ROPs weitergegeben. Schauen wir uns nun die G80-Architektur der GeForce 8800 GTX und GeForce 8800 GTS etwas genauer an.
Streamprozessoren:
Verglichen mit den 56 Shadereinheiten auf einem R580 oder G71 erscheinen die 128 Streamprozessoren der GeForce 8800 GTX als geradezu monströs. Hier muss man allerdings einen Blick ins Innere der ALUs werfen, da diese zwischen den beiden Generationen deutliche Änderungen aufweisen. So sind die ALUs sowohl auf dem R580 als auch auf dem G71 Vektorprozessoren (4D), die innerhalb eines Taktes vier unterschiedliche Komponenten (RGBA; Rot, Grün, Blau und den Alphawert) berechnen können. Jedoch sind viele Shaderanweisungen simpler als eine Vektoranweisung gestrickt (Skalarberechnung mit einer einzigen Komponente; 1D), weswegen es beispielsweise auf einem G71 möglich ist, die Recheneinheiten in einem 3:1 oder 2:2 Verhältnis aufzuteilen, um die Last auf die ALUs gleichmäßiger zu verteilen (Nichtsdestotrotz rechnen die ALUs längst nicht immer mit der maximal möglichen Leistung). Somit entschied sich nVidia beim G80 dazu auf Vektorprozessoren zu verzichten und verbaut 128 Skalareinheiten. Bei Pixelshader-Anweisungen, die auf den vier Komponenten basieren, stehen einem theoretisch maximal 32 Shadereinheiten (der alten Klasse) zur Verfügung.
Jede der 128 ALUs auf der GeForce 8800 GTX kann jeweils eine MADD- (Multiply-ADD) sowie eine MUL-Operation (Multiply) innerhalb eines Taktes ausführen. Gleichzeitig kann der G80 dabei von 128 Pixelshader auf 128 Vertex- oder Geometryshader umschalten, besitzt also eine äußerst feine Granularität. Angebunden sind die Streamprozessoren, ähnlich wie die Geometric-Domain auf der G71-GPU, mit einer eigenen Taktdomäne. Diese taktet mit satten 1350 MHz und arbeitet um einiges schneller als die restlichen Komponenten auf der GeForce 8800 GTX, die mit 575 MHz angetrieben werden. Wie nVidia uns auf Nachfrage bestätigte, handelt es sich dabei nicht um ein „DDR-Prinzip“ sondern reale Taktraten. Die Streamprozessoren sind auf der GeForce 8800 GTX in acht Blöcken mit jeweils 16 ALUs eingeteilt, die nVidia blockweise deaktivieren kann. So ist auf der GeForce 8800 GTS dieselbe GPU vorhanden. Allerdings sind zwei der acht Blöcke deaktiviert, womit der kleinere Bruder auf 96 Streamprozessoren zurückgreifen kann.
Textureinheiten:
Bei den Textureinheiten des G80 hat sich ebenfalls einiges verändert. Während nVidia auf der GeForce 7900 GTX noch 24 bilinear ausgelegte Texture Mapping Units (TMUs) verbaute, werden auf der GeForce 8800 GTX nun gleich 64 solcher (bilinearen) Einheiten eingesetzt. Man kann aber auch hier die Einheiten nicht direkt miteinander vergleichen. So konnten auf dem G71 nicht nur 24 Pixel texturiert und gefiltert, sondern zusätzlich auch noch adressiert werden. Auf dem G80 können dagegen zwar 64 Pixel gefiltert, aber nur 32 Pixel adressiert werden, was eine interessante Eigenschaft mit sich bringt: Bei einfacher bilinearer Filterung können insgesamt 32 Texel pro Takt fertiggestellt werden, wobei die restlichen 32 Textureinheiten quasi brach liegen. Wenn man nun allerdings einen 2-fachen bilinearen anisotropen Filter einsetzt, benötigen die 32 Textureinheiten bereits zwei Takte, um die Pixel zu filtern. Mit Hilfe der 32 restlichen Einheiten kann dieser Schritt nun schon in einem Taktdurchlauf erledigt werden, weswegen 2xAF mit bilinearer Filterung theoretisch keinerlei Leistung kostet. Ob bei herkömmlicher trilinearer Filterung 32 Pixel in einem Taktdurchlauf fertiggestellt werden können, gibt nVidia leider nicht an.
Darüber hinaus hat nVidia auf dem G80 eine Schwachstelle des G71 entfernt. So war bei einer Texturoperation die Shader-Unit 1 kurzzeitig mit einer Latenz versehen, womit die Funktion der ALU ungenutzt blieb und unnötig Rechenleistung verschenkt wurde. Bei dem G80 sind die TMUs nun vollständig von den ALUs abgekoppelt, womit dieser „stall“ bei einer Texturoperation nicht mehr auftritt. nVidia konnte somit einige Transistoren einsparen und die GPU dementsprechend einfacher produzieren. Darüber hinaus sind die TMUs des G80 bei der anisotropen Filterung intelligenter. So kann der G71 bei anisotroper Filterung gewisse Winkel nicht mit der vollen Anzahl an Samples filtern, wodurch eine winkelabhängige Texturfilterung entsteht, die in einigen Spielen negativ auffällt. Der G80 beherrscht nun, wie der R5x0 von ATi, eine winkelunabhängige Texturfilterung.
Technik im Detail Part 2
Raster Operation Processor (ROP):
Der G80 auf der GeForce 8800 GTX setzt auf insgesamt 24 ROPs, die in sechs verschiedene Partitionen eingeteilt sind. Auf der GeForce 8800 GTS hat nVidia eine dieser Partitionen deaktiviert, womit die GPU nur noch auf 20 Rops zurückgreifen kann. Eine dieser Partitionen kann insgesamt vier Pixel mir Farb- sowie Z-Werten (Tiefeninformationen) pro Takt fertigstellen. Wie ab der GeForce-FX-Serie gewohnt, beherrschen die GeForce-ROPs bei reinen Z-Berechnungen die Möglichkeit, die Rechenkraft um ein vielfaches zu steigern. So lange einzig Tiefeninformationen berechnet werden, können nicht 24, sondern 192 Samples pro Takt zur weiteren Nutzung bereit gestellt werden. Bei 4xMSAA bleiben noch 48 Samples pro Takt übrig.
Doch damit noch nicht genug. Auch das Anti-Aliasing wurde auf dem G80 kräftig aufgebohrt. Neben dem gewohnten 2-fach- und 4-fach-Modus, gibt es nun eine 8-fach- sowie 16-fach-Einstellung mit acht beziehungsweise 16 einzeln verteilten Multi-Sample-Anti-Aliasing-Samples – auf das hybride SSAA muss der G80-Käufer allerdings verzichten. Neu ist das so genannte „Coverage Sample AA“, das eine gute Bildqualität bei kaum geringerer Performance ermöglichen soll. 16xCSAA soll dieselbe Optik wie 16xMSAA aufweisen, jedoch nur einen leicht höheren Geschwindigkeitsverlust als 8xMSAA haben. 8xCSAA soll dagegen so aussehen wie herkömmliches 8xMSAA und nur gering schlechter als 4xAA den Dienst verrichten. Erreicht wird dies durch eine spezielle Komprimierung der Farb- und Z-Werte. Diese Methode funktioniert aber nicht mit jedem Spiel. In 3D-Applikationen, in denen Stencil-Schatten eingesetzt werden, funktioniert CSAA nicht.
Die Direct3D-10-Spezifikationen schreiben es vor und der G80 hält dies ein: Die Rede ist hier von FP32-Blending, sprich 128 Bit High Dynamic Range Rendering. Die alten Grafikkarten unterstützten nur FP16-Blending, was ein Zwischenschritt zwischen der herkömmlichen Farbtiefe und dem „richtigen“ HDRR ist. Mit FP32-Blending sollen Spiele ermöglicht werden, die eine noch ausgefeiltere Farbdarstellung und Präzision aufweisen, als es beispielsweise in Far Cry möglich ist. Der G80 kann zudem sowohl auf ein FP16- als auch auf ein FP32-Rendertarget MSAA anwenden – harte Kanten wie auf einem G7x werden einem erspart bleiben. Um die Featureliste zu vervollständigen, kommt der G80 mit FP16- und FP32-Filtering daher. Bei Floating-Point-Formaten kann also direkt in der TMU gefiltert werden; ein Umweg über den Pixelshader, so wie es auf dem R5x0 nötig ist, bleibt der GPU erspart.
Speicherinterface:
Seit der legendären Radeon 9700 Pro gehört ein 256 Bit breites Speicherinterface zum guten Ton einer High-End-Karte. Doch damit ist nun Schluss. nVidia trennt sich von der vertraut gewordenen Zahl und verbaut auf der GeForce-8800-Serie ein 384-Bit-Speicherinterface (GeForce 8800 GTX) beziehungsweise eine 320-Bit-Anbindung (GeForce 8800 GTS). Möglich wird dies durch einen sechsfach aufgeteilten Memorycontroller, der jeweils mit einem 64 Bit breiten Interface an den VRAM angebunden ist. Bei der GeForce 8800 GTS ist der Speichercontroller nur noch fünffach aufgeteilt, was einer Breite von 320 Bit entspricht. Anders als bei der Radeon X1950 XTX setzt nVidia auf der GeForce 8800 nicht auf modernen GDDR4-RAM, sondern belässt es bei kostengünstigeren GDDR3-Bausteinen. Der 768 MB große VRAM auf der GeForce 8800 GTX (12 RAM-Bausteine mit je 64 MB) taktet mit 900 MHz, während der 640 MB fassende Speicher der GeForce 8800 GTS (10 RAM-Bausteine mit je 64 MB) mit einer Frequenz von 800 MHz arbeitet.
Dynamic Branching:
Dynamic Branching (Sprunganweisungen im Shadercode, durch if-, else, then-Befehle) gehört spätestens mit dem Shader-Model 3.0 zum guten Ton eines 3D-Beschleunigers, wobei jedoch längst nicht immer Wert auf eine gute Performance gelegt wurde. So ist das Dynamic Branching auf dem R5x0 im Pixelshader zwar extrem schnell, die Geschwindigkeit im Vertex-Shader lässt aber zu wünschen übrig – genau anders herum sieht es beim G7x aus.
Beim G80 soll dies nun anders werden, da Dynamic Branching im Shader-Model 4 eine wichtige Rolle spielt. Der G80 kann einen Shader nun in ein 4x4 Pixel großes Feld unterteilen und aufgrund dessen effizientere und genauere Berechnungen ohne einen allzu großen Verschnitt durchführen. Im Vergleich dazu teilt der R580 den Shader in einen 4x12 Pixel großen Block ein, arbeitet also etwas ineffizienter.
Early-Z:
Auch wenn die Speicherbandbreite bei GeForce 8800 GTX und GeForce 8800 GTS massiv gestiegen ist, so kann es sich der G80 dennoch nicht leisten, verschwenderisch mit dieser wichtigen Ressource umzugehen. Um dies zu verhindern, arbeiten moderne 3D-Beschleuniger mit speziellen Z-Mechanismen, die bei gewissen Pixelblöcken erkennen können, ob diese komplett oder teilweise von anderen Pixel überdeckt werden, somit unsichtbar sind und nicht mitberechnet werden müssen. Eine dieser Techniken nennt sich „Early-Z“, das nVidia auf dem G80 verbessert hat. Z-Cull ermöglicht es, nicht sichtbare Pixelblöcke in der Rasterization-Stage (noch vor dem Pixelshader beziehungsweise den Streamprozessoren) zu verwerfen. Dies soll der G80 vier mal so schnell wie eine GeForce 7900 GTX durchführen können. Zudem wurde eine Technik implementiert, die es ermöglicht, einzelne Pixel, noch bevor diese die ROPs durchlaufen, zu entfernen. Vor allem bei langem Shadercode ergeben sich so Vorteile. Wie nVidia uns auf Nachfrage mitteilte, wurde der On-Chip-Speicher auf dem G80 für das Hidden Surface Removal aufgestockt, damit die bandbreitenschonenden Maßnahmen auch in der hohen Auflösung 2560x1600 ordnungsgemäß funktionieren. Ein Abfall der Performance, wie man es beispielsweise des Öfteren auf einer GeForce 7900 GTX beobachten kann, sollte also der Vergangenheit angehören.
Abschließend wäre es, da die GeForce 8800 GTX eine Direct3D-10-Grafikkarte ist, natürlich noch möglich, auf die neue API mit dem Shader Model 4 sowie den verbesserten Fähigkeiten, Effekt-Physik zu simulieren, genauer einzugehen. Um den Umfang dieses Artikels nicht endgültig zu sprengen, wollen wir aber hier darauf verzichten und holen eine detaillierte Beschreibung in einem späteren Artikel nach.
Techdemos
Jahr für Jahr haben neu vorgestellte GPU-Architekturen, die mit einer modifizierten Technologie aufwarten können, immer ein und dasselbe Problem: Es fehlt an Software, um das Können der aktuellen Grafikgeneration zu zeigen. So auch beim G80, denn Direct3D-10-Spiele sucht man bekanntlich vergebens. Aus diesem Grund lassen es sich die Software-Teams des Herstellers nicht nehmen, eigene Technologiedemos zu programmieren, die speziell auf den neu vorgestellten 3D-Beschleuniger angepasst sind und das letzte Quäntchen Leistung von der Hardware fordern. Dementsprechend sind die „Techdemos“, die wir an dieser Stelle nicht verheimlichen wollen, immer sehr eindrucksvoll.
Adrianne heißt die wohl optisch gelungenste Techdemo für den nVidia G80. Waren die Vorgänger Nalu und Luna noch reine Fantasiewesen, entspricht Adrianne einer wirklichen Person, dem bekannten Modell Adrianne Curry. Mit mehreren Kameras und speziellen Techniken wurde Adrianne Curry aufgezeichnet und anschließend in 3D modelliert, um eine real aussehende Polygonfigur zu erzeugen – und das Ergebnis spricht für sich. Da die Demo in OpenGL programmiert ist, kann man die optischen Finessen auch auf Windows XP begutachten.


Die zweite Techdemo stellt „Froggy“, den – wer hätte es erwartet? – Frosch dar. Dieser ist optisch vor allem in Bewegung schön anzusehen. Mit dem Mauszeiger kann man die Haut des Tieres in alle Richtungen ziehen, was einen schicken „Wabbeleffekt“ erzeugt. Die Techdemo ist ebenfalls in OpenGL programmiert.





Die dritte Techdemo hört auf den Namen Waterworld und zeigt einen in der Luft fliegenden Felsen mit äußerst detaillierten Texturen und einer schicken, sich der Situation anpassenden Beleuchtung. Das eigentliche Highlight ist jedoch das aus dem Felsen austretende Wasser, das sehr realitätsnah das Gestein herunterläuft. Mit dem Mauszeiger kann man weitere Wassergruben erzeugen, die physikalisch korrekt berechnet werden. Auf Wunsch trocknen diese Gruben mit der Zeit wieder aus. Diese Techdemo ist übrigens die einzige, die in Direct3D 10 programmiert ist und somit nur unter Windows Vista läuft.





Darüber hinaus gibt es eine weitere Techdemo, die optisch allerdings nicht sehr beeindruckend ist – dies soll sie aber auch gar nicht sein. Sie zeigt einen Behälter, in dem sich mehrere Staubwolken befinden. Diese kann man nun physikalisch korrekt durch den Behälter jagen. Die Physikberechnungen finden dabei auf dem G80 statt.
Bildqualität
AA kontrolliert
Moderne Grafikkarten sollten nicht nur schnell sein, sie sollen auch ein exzellentes Bild liefern. Eine Möglichkeit um dies zu erreichen, auch wenn der gelieferte Grafik-Content des Spieles nicht allzu gut ausfällt, ist die Aktivierung von Anti-Aliasing, welches die Polygonkanten glättet, und das Hinzuschalten des anisotropen Filters, das die Texturen auch in weiter Ferne noch scharf erscheinen lässt. Da ATi und nVidia versuchen, in diesen Features den Konkurrenten zu übertreffen, erlebt man bei manch' neuer Chipgeneration eine positive Überraschung – wobei eine negative allerdings auch nicht ausgeschlossen werden kann –, da die Bildqualität sich verbessert hat. Aus diesem Grund gehört zu einem Grafikkarten-Review einer neuen Chipserie nicht nur das Testen der Geschwindigkeit, es sollte ebenfalls ein Blick auf die gelieferte Bildqualität geworfen werden.
Dabei werden wir beide Bildverbesserungsmechanismen nicht nur in der Praxis, sondern auch in der Theorie begutachten. So untersuchen wir die Qualität des anisotropen Filters mit dem oft benutzten Tool „AF-Tester“ sowie dem 3DMark06 und mit einer Spielszene aus Half-Life 2, wobei auch selbst erstellte Videos zur Kontrolle herangezogen werden. Auf den Ego-Shooter greifen wir auch bei den Untersuchungen des Anti-Aliasings zurück. Zudem werden wir die Sample-Positionen in dem Tool „FSAA-Viewer“ vergleichen. Zusätzlich kommt erneut der 3DMark06 zum Einsatz, der mit seinen Analysetools einige interessante Möglichkeiten bietet.












Auf der G80-GPU hat sich beim Anti-Aliasing so Einiges getan und dem Käufer wird nun von Beginn an eine deutlich größere Auswahl an Einstellungen angeboten. Sowohl beim 2-fachen als auch beim 4-fachen Anti-Aliasing haben die Kalifornier auf der GeForce 8800 keine Veränderungen vorgenommen und es bei den sinnvollen Konfigurationen des G71 belassen. Neu hingegen sind vier weitere Einstellungen, wobei man leider nur eine im FSAA-Viewer begutachten kann – die restlichen drei werden nicht angezeigt. So gibt es auf dem G80 zusätzlich zwei 8-fach- sowie zwei 16-fach-Anti-Aliasing-Modi. 8xQAA ist dabei ein Sparse-Grid-AA mit insgesamt acht Multi-Sampling-Samples, das somit nur die Polygone bearbeitet. Darüber hinaus existiert ein 8xAA-Modus, der mit der „Coverage Sample Anti-Aliasing (CSAA)“-Kompression arbeitet (vier Farb-/Z-Samples, acht Coverage-Samples), die wir im Technik-Part näher erläutert haben. Zusätzlich gibt es eine weitere CSAA-Einstellung mit 16 Samples, die auf den Namen „16xAA“ hört. 16xQAA ist ebenfalls ein neuer CSAA-Modus, der im Gegensatz zu 16xAA acht Farb-/Z-Samples nutzt (16xAA vier Farb-/Z-Werte, beide Modi 16 Coverage-Samples). Reine oder Hybridmodi mit Super-Sampling-Anteil wie 8xSAA auf einem G71 gibt es beim Nachfolger G80 offiziell nicht mehr. Ob man diese weiterhin mit Hilfe von Tools aktivieren kann, ist unbekannt.















Im 3DMark06 kann man sich in der Theorie anschauen, wie Anti-Aliasing auf einer GPU in Aktion aussieht. Da nVidia beim G80 an den Einstellungen 1xAA, 2xAA und 4xAA keinerlei Änderungen gegenüber dem G71 vorgenommen hat, weisen die Screenshots dieselben Ergebnisse auf. Das Anti-Aliasing ist dem der Konkurrenz ebenbürtig. Je nach Winkel glättet die eine oder die andere Grafikkarte etwas besser – einen Sieger gibt es nicht. Abseits der meist benutzten Einstellungen hat nVidia allerdings viel Neues eingebracht und kann damit auch überzeugen. Optisch gibt es zwischen dem 8xQAA mit „reinem“ MSAA und dem 8xAA mit CSAA nur minimale Unterschiede. 8xQAA sieht in einigen Stellen minimal besser aus, im wirklichen Spielablauf werden die Differenzen aber kaum auffallen. Im Vergleich zur direkten Konkurrenz ATi muss sich nVidia mit den beiden 8-fach-Modi nun nicht mehr verstecken. Die Kantenglättung ist im Großen und Ganzen mit der 6xAA-Einstellung auf einem R5x0 identisch. Bei manchen Winkeln bietet die nVidia-GPU das bessere Bild, aber der Unterschied ist nur gering und kaum der Erwähnung wert.
Gegenüber dem G71 bietet man mit 8xAA und 8xQAA die bessere Polygonkantenglättung, der Käufer hat aber keine Möglichkeit mehr, die Hybridmodi mit Super-Sampling-AA einzuschalten, welches zusätzlich die Texturen bearbeitet. Dies ist zwar schade, der Verlust ist unserer Meinung nach aber aufgrund der guten Alternative zu verkraften. Gespannt waren wir auf die Bilder mit den beiden 16-fach-Modi, da diese neue Bestwerte erhoffen lassen. Hier wurden wir aber enttäuscht. Die Differenz zwischen 16xAA und 16xQAA ist, wie beim acht-fachen Anti-Aliasing, beinahe nur mit der Lupe festzustellen. Es gibt durchaus einige wenige Unterschiede, sie sind aber marginal. Hier müssen wir allerdings anmerken, dass das jedoch Absicht von nVidia ist. Denn mit 8xAA und 16xAA möchte man eine Kantenglättung anbieten, die nur gering bis gar nicht schlechter als 8xQAA und 16xQAA aussieht, aber ein gutes Stück schneller den Dienst verrichtet. Im Vergleich zu 8xAA ist erneut nur an einigen Stellen ein Unterschied festzustellen.


















Bis zum 4-fachen Anti-Aliasing gibt es zwischen dem G71 sowie dem neuen G80 keinerlei Unterschiede bei der Kantenglättung in Half-Life 2 – einzig auffällig sind die teils zu hellen Texturen auf der neuen nVidia-GPU, was allerdings mit hoher Wahrscheinlichkeit ein Treiberfehler ist. Die Differenzen zwischen 8xAA sowie 8xQAA sind erneut kaum vorhanden, ironischerweise scheint das Spiel dabei mehrere Winkel darzustellen, die mit 8xAA besser geglättet werden. Zu demselben Fazit kommt man beim Vergleich zwischen 16xAA und 16xQAA, wobei letzteres wieder aufholen kann, dabei aber nicht unbedingt besser aussieht. So ihre Schwierigkeiten haben beide 8xAA-Modi auf dem G80 damit, gegen das sechs-fache Sparse-Grid-MSAA auf dem R580 anzukommen. Dieses bietet eine leicht bessere Kantenglättung, woran auch 16xAA und 16xQAA nichts ändern können. Wie die Screenshots vom 3DMark06 jedoch zeigen, kann sich das Bild sehr schnell umdrehen. Bezüglich der Kantenglättung der Polygone haben alle vier AA-Einstellungen keine Schwierigkeiten, gegen das Anti-Aliasing der G71-GPU bestehen und sich im hausinternen Duell an die Spitze setzen zu können.
AF kontrolliert















„Wow, was ist das?“ war ganz ehrlich gesagt unser erster Gedanke, als wir den anisotropen Filter der G80-GPU im AF-Tester begutachteten. Die Texturfilterung auf der GeForce 8800 ist bereits mit der Standardeinstellung des Treibers winkelunabhängig! Dabei war es uns selbst durch Ausprobieren aller Einstellungen nicht möglich, ein winkelabhängiges AF, wie es vom G71 bekannt ist, zu aktivieren – hier müssen wir nVidia ein großes Lob aussprechen! Dabei haben es sich die Kalifornier mit der Winkelunabhängigkeit nicht allzu leicht gemacht und scheinen viel Arbeit in den Algorithmus gesteckt zu haben. Denn im Vergleich zum winkelunabhängigen AF auf dem R580 sieht die AF-Blume auf dem G80 nochmals um Einiges besser aus. Während das ATi-Pendant bei manchen Winkeln recht stark in die Winkelabhängigkeit zurück fällt, zeigt der G80 diesbezüglich keinen Aussetzer. Somit sollte die volle AF-Sample-Zahl bei jedem Winkel gewährleistet sein.
Interessantes gibt es auch von den Optimierungen des anisotropen Filters zu berichten, die nVidia auf der GeForce 8800 GTX stark zurück geschraubt hat. So ist die „Anisotrope-Mip-Filter-Optimierung“ nicht mehr vorhanden, womit sich insgesamt nur noch zwei „Verschlimmbesserungen“ einschalten lassen. Standardmäßig wird der ForceWare-Treiber auf dem G80 mit der Texturfiltereinstellung „Qualität“ sowie mit aktivierter „Trilinearen Optimierung“ ausgeliefert, die auf den Texture Stages 1-7 einen brilinearen Filter erzeugt, der unter Umständen zu Bugwellen führen kann. Die „Anisotrope Muster-Optimierung“ ist von Haus aus nicht aktiv. Mit dieser Default-Einstellung sind die ersten drei Screenshots vom AF-Tester produziert worden. Die mit dem Zusatz „HQAF“ versehenen Bildern sind bei „Hoher Qualität“ ohne jeglichen Optimierungen aufgenommen worden.
Insgesamt scheint es dem 16xAF auf dem G80 (ähnlich wie beim R5x0) leicht an Präzision zu fehlen. In einem Spiel fällt dies allerdings nicht auf. Rein vom AF-Tester aus gesehen, bietet der G80 somit die beste Texturfilterung, die man auf dem Markt finden kann – selbst besser als der anisotrope Filter des legendären NV25. Ob dies auch in der Praxis reichen wird, die Konkurrenz zu überflügeln, versuchen wir nun zu klären.















Im integrierten Filtertester vom 3DMark06 fällt schon beim ersten Blick auf, dass das winkelabhängige AF auf dem G71 nicht den Hauch einer Chance hat, gegen die Konkurrenz aus dem eigenen Hause und die von ATi bestehen zu können. Da einige Winkel nur mit 2xAF bearbeitet werden, andere dagegen mit den vollen 16xAF, ergibt sich ein sehr „unrundes“ Bild. Beim Vergleich zwischen 16xAF auf dem R580 und 16xAF auf dem G80 wird nun das Unmögliche möglich: Die leichten Probleme bei der Winkelabhängigkeit auf dem ATi-Chip deckt der 3DMark06 ohne Skrupel auf.
Im Vergleich Default- gegen High-Quality-Einstellung auf dem G80 fällt auf, dass es beinahe nichts gibt, was auffallen könnte. Das gekürzte MipBand aufgrund des brilinearen Filters kann man an wenigen Stellen sehen, jedoch muss schon gezielt nach der Optimierung suchen – hier müssen wir allerdings anmerken, dass ein brilinearer Filter auf Screenshots grundsätzlich nur schwer oder gar nicht zu sehen ist, in Bewegung dann aber negativ auffällt.















Auch in Half-Life 2 disqualifiziert sich die winkelabhängige Texturfilterung des G71 auf der Stelle. Die Schräge wird nur mit 2-fachem AF gefiltert und stört den Gesamteindruck des Spieles extrem. Besser macht es dagegen das High-Quality-AF des R580, der deutlich mehr Schärfe ins Spiel bringt. Ebenfalls einen hervorragenden Eindruck hinterlässt der G80 mit der Standardeinstellung des Treibers. Nicht nur, dass alle Winkel mit dem vollen AF-Grad bearbeitet werden. Darüber hinaus kann man vermuten, dass der Texturfilter auf der neuen GeForce-Karte weniger zum Flimmern neigt als auf dem R580. Weiter unten dazu mehr. Mit der maximal möglichen Einstellung auf dem G80 kann man zwar Differenzen erkennen, diese sind aber nur bei genauem Hingucken auszumachen. Da diese in Bewegung besser auffallen, haben wir mehrere Videos angefertigt, die wir aufgrund der Größe aber nicht zur Verfügung stellen können.
Und auf diesen Videos kann man erkennen, dass die anisotrope Filterung des G80 bereits in der Standardeinstellung des Treibers der Konkurrenz von ATi einiges Voraus hat. Auf dem R580 werden beinahe alle Winkel behandelt, allerdings flimmert es sichtbar munter vor sich hin – der G71 ist in der High-Quality-Einstellung gar noch empfindlicher. Anders dagegen der G80, der nicht ganz kritiklos rendert, aber um Einiges ruhiger als alle derzeit auf dem Markt erhältlichen Grafikkarten seine Arbeit verrichtet. Bei einer genauen Analyse sieht man das MipBand aufgrund der trilinearen Optimierung, davon abgesehen zeigt das AF der GeForce 8800 aber kaum Schwächen und sorgt damit für ungebremsten Spielspaß. In der High-Quality-Einstellung ist das MipBand nicht mehr zu erkennen, womit der G80 vom so genannten „Lehrbuch-AF“ nicht mehr weit weg ist.
Zu guter Letzt haben wir alle drei Grafikkarten mit einem speziellen „Moiré-Tester“, der jegliches Flimmern sofort sichtbar macht, einen Härtetest unterzogen. Und auch hier kann der G80 sich nicht nur von der Konkurrenz weit absetzen, er triumphiert regelrecht über den G71 und den R580. Während auf den letztgenannte GPUs selbst bei maximal möglicher Texturfilterung das Bild munter vor sich her flimmert, zeigt der G80 schon in der Default-Einstellung ein ruhiges Bild. Dieses bleibt zwar nicht gänzlich vom Flimmern verschont, jedoch fällt dieser Störfaktor um einiges geringer als bei allen anderen GPUs auf.
Somit bietet der G80-Grafikprozessor in der Default-Einstellung des Treibers die beste Texturfilterung von allen derzeit erhältlichen 3D-Beschleunigern. Eine Winkelabhängigkeit ist nicht vorhanden und das Flimmerproblem wurde beinahe gänzlich behoben. Zudem fallen die aktiven Optimierungen nur gering auf. Aufgrund dessen werden wir alle zukünftigen Grafikkarten, die mit einer G8x-GPU ausgerüstet sind, mit den Standardeinstellungen des Treibers testen. „High-Quality“ bietet zwar ein leicht besseres Bild, wäre aber noch weniger vergleichbar zu den restlichen Grafikkarten, was nicht Sinn eines fairen Vergleichstest sein kann. Da es auf dem R5x0 von ATi ebenfalls möglich ist, eine beinahe winkelunabhängige Texturfilterung zu aktiveren, werden wir dieses Feature in Zukunft nutzen, um die grafischen Unterschiede der einzelnen Karten möglichst gering zu halten. In diesem Artikel arbeiten die GPUs der Kanadier allerdings noch mit dem schnelleren anisotropen Filter, was wir in einem in Kürze erscheinenden Artikel aber ändern werden.
Schlussendlich bleibt zum Thema Bildqualität nur noch eines zu sagen: „Gut gemacht, nVidia!“. Das Anti-Aliasing ist gut, der anisotrope Filter gar sehr gut. Wer nicht scheut, viel Geld für eine Grafikkarte mit einer guten Bildqualität (und hohem Stromverbrauch) auszugeben, kommt derzeit an der GeForce 8800 GTX oder GeForce 8800 GTS nicht vorbei.
AA- und AF-Skalierung
Die beste anisotrope Filterung und das beste Anti-Aliasing nutzen einem nichts, wenn die Performance bei hohen Einstellungen ins Unendliche einbricht. Aus diesem Grund haben wir uns zwei Spiele in der Auflösung 1600x1200 angeschaut und versuchen herauszufinden, welche Einstellung wieviel Leistung kostet.
AA-Skalierung 1600x1200 - F.E.A.R.
Angaben in Bildern pro Sekunde (FPS)
|
AA-Skalierung 1600x1200 - COD 2
Angaben in Bildern pro Sekunde (FPS)
|
Interessanterweise brechen sowohl der G71 als auch der G80 in F.E.A.R. bei Verwendung von Anti-Aliasing mit prozentual demselben Leistungsverlust ein, obwohl zwei verschiedene GPU-Generationen miteinander verglichen werden. Der Performanceverlust von 16xQAA ist in etwa mit dem von 8xSAA auf dem G71 zu vergleichen. Sehr performant agiert sowohl das 8xAA als auch das 16xAA. Deutlich besser skaliert die GeForce 8800 GTX in Call of Duty 2. Mit der höchstmöglichen Einstellung verliert man knapp weniger als 30 Prozent der vorhandenen Leistung, was ein sehr guter Wert ist.
AF-Skalierung 1600x1200 - F.E.A.R.
Angaben in Bildern pro Sekunde (FPS)
|
AF-Skalierung 1600x1200 - COD 2
Angaben in Bildern pro Sekunde (FPS)
|
Obwohl man annehmen könnte, dass der G80 aufgrund der winkelunabhängigen Texturfilterung beim Einsatz von AF viel an Leistung verliert, muss man dies ganz schnell verneinen – gar das Gegenteil ist der Fall! Mit der anisotropen Filterung skaliert die GeForce 8800 GTX weit besser als die gesamte Konkurrenz, was wahrscheinlich den doppelt ausgelegten TMUs anzurechnen ist. In F.E.A.R. beträgt der Verlust bei maximaler Qualität unbemerkbare zwei Prozent, in Call of Duty 2 sind es geringe 12 Prozent.
Auflösungsskalierung - F.E.A.R.
Angaben in Punkten
|
Auflösungsskalierung - Prey
Angaben in Bildern pro Sekunde (FPS)
|
Auch bei der reinen „Rohleistung“, sprich ohne Anti-Aliasing sowie die anisotrope Filterung, kann die GeForce 8800 GTX ihre Muskeln spielen lassen und verliert in der extrem hohen Auflösung 2560x1600 im Vergleich zur GeForce 7900 GTX und Radeon X1950 XTX deutlich weniger an Leistung. Die Hälfte der Ausgangsleistung steht in dieser Auflösung noch zur Verfügung, während es bei den beiden älteren Grafikkarten meistens nur noch ein Viertel ist. Bis zu 1280x1024 kann man gar sagen, dass der G80 auf einem Athlon 64 FX-60 komplett CPU-limitiert ist.
Begriffserklärung:
- AAA=Adaptive Anti-Aliasing; glättet Alpha-Test-Texturen auf einem R5x0
- TSSAA=Transparency Super-Sampling-Anti-Aliasing; glättet Alpha-Test-Texturen auf einem G7x/G80
- CSAA=Coverage Sampling Anti-Aliasing; neue Art der Kantenglättung auf einem G80, die eine spezielle Kompression nutzt, um weniger Performance zu verlieren
Impressionen
nVidia GeForce 8800 GTX
Mit der GeForce 8800 GTX holen die kalifornischen GPU-Spezialisten zum ganz großen Schlag aus und wollen nicht nur – wie bereits gezeigt – die Bildqualität, sondern auch die Geschwindigkeit in bisher unerreichte Höhen schrauben. Dazu kommt noch die Möglichkeit, Effektphysik auf der GPU zu berechnen und, ganz nebenbei, zudem die Unterstützung von Direct3D 10, der neuen Grafik-API, die mit Windows Vista Einzug halten wird. Doch dies alles musste entwickelt, hergestellt und vertrieben werden und das hat natürlich seinen Preis. nVidia gibt für Europa eine unverbindliche Preisempfehlung von 600 Euro an. Ein Blick in die Preismaschine Geizhals verrät, dass erste Shops die GeForce 8800 GTX bereits ab zirka 570 Euro listen – ob diese dann verfügbar sein werden, ist natürlich eine andere Frage.
Viele werden sicherlich ins Staunen geraten, wenn sie die GeForce 8800 GTX zum ersten Mal „live“ begutachten können. Die PCB-Ausmaße von 23 cm, die die ehemaligen High-End-Beschleuniger von nVidia alle aufweisen konnten, werden von der GeForce 8800 GTX bei weitem überschritten. Die Platine misst satte 28 cm Länge und wird somit längst nicht in jeden Tower problemlos hineinpassen. Während die Referenzkarten von nVidia bis jetzt immer auf ein grünes und somit firmenfarbenes PCB setzten, kommt die GeForce 8800 GTX in schwarzer Farbe daher. Ein großer Dual-Slot-Kühler, der ein Wenig an das Pendant auf der GeForce 6800 Ultra erinnert, sorgt für niedrige Temperaturen.



Das Kühlsystem belegt einen Großteil der Platine und ist mit einem 70 mm großen Radiallüfter ausgestattet. Die Schaufelräder ansich fallen sehr klein aus, was auf eine große Drehzahl schließen lassen könnte. Unter Windows ist die GeForce 8800 GTX der Radeon X1950 XTX in Sachen Lautstärke dann allerdings ebenbürtig. Sprich man hört die Karte überhaupt nicht aus einem geschlossenen Gehäuse heraus. Auch unter Last dreht der Quirl nur minimal auf und wird zu keiner Zeit aufdringlich. Der Kühler besteht aus einer geradezu riesigen Alukühlplatte, die nicht nur die G80-GPU, sondern zusätzlich den VRAM (768 MB GDDR3, produziert von Samsung mit einer Zugriffszeit von 1,1 ns) kühlt. Fast die ganze Kühlfläche ist aus Aluminium gefertigt, einzig ein eingelassener Kupferblock sitzt direkt auf dem Heatspreader der GPU. Darüber hinaus setzt nVidia auf eine Heatpipe, die die Wärme effizient vom Kern weg leitet.






Das Prinzip des Kühlsystems ist schnell erklärt. Der Radiallüfter saugt die kühle Luft aus dem Tower an und leitet sie über den Kühlblock und über die eigentliche GPU. Die dadurch erhitzte Luft wird dann durch mehrere Lüftungsschlitze auf dem Slotblech nach Außen gepustet, weswegen sich das Gehäuseinnere nicht unnötig aufheizt. Auf dem Slotblech findet man zwei Dual-Link-fähige DVI-Anschlüsse sowie einen HDTV-Ausgang vor. Einen HDMI-Anschluss sucht man leider vergebens. Nichtsdestotrotz ist die GeForce 8800 GTX HDCP-kompatibel, da auf jeder Karte ein entsprechendes Key-ROM eingesetzt wird.






Auffällig sind die zwei SLI-Anschlüsse. Für das handelsübliche SLI wird weiterhin nur ein Anschluss mit einer Bridge nötig sein. Der zweite Anschluss ermöglicht es, eine separate Grafikkarte – dies muss nicht unbedingt eine GeForce 8800 GTX sein – nur für Physikberechnungen mit Hilfe von HavokFX zu nutzen. Während für eine GeForce 7950 GX2 noch ein PCIe-Stromanschluss ausreichend ist, funktioniert das Top-Modell der GeForce-8800-Reihe nur mit zwei dieser Anschlüsse, da der Stromverbrauch gestiegen ist. Wenn man keinen Anschluss belegt, startet die Karte nicht und ein kleiner, auf der Karte verbauter Buzzer gibt ein Alarmsignal von sich. Belegt man nur einen, startet die Karte zwar, arbeitet aber wesentlich langsamer.
Asus EN8800 GTX
Asus schickt ihre Adaption der nVidia GeForce 8800 GTX, die auf den Namen EN8800 GTX hört, für einen Preis von etwa 570 Euro ins Rennen. Die Karte entspricht nicht nur optisch, sondern auch funktional zu einhundert Prozent dem Referenzdesign. Einzig der Lüfteraufkleber, der nun ein Motiv aus dem Spiel „Ghost Recon: Advanced Warfighter“ trägt, wurde ausgetauscht. Asus stattet die EN8800 GTX mit einem reichhaltigen Softwarepaket aus: Neben einer Treiber-CD und dem Handbuch findet der Käufer den 3DMark06 sowie die Spiele „GTI Racing“ und das bekannte „Ghost Recon: Advanced Warfighter“ vor. Auch wenn man für diese Ausstattungsmerkmale durchaus positive Worte finden kann, so enttäuscht die Kabelausstattung. Mehr als einen DVI-zu-D-SUB- sowie einen S-Video-auf-YUV- und einen PCIe-Stromkabeladapter legt Asus dem High-End-Modell nicht bei. Immerhin ist eine praktische CD-Mappe in dem Karton enthalten.





Testsystem
Testsystem:
- Prozessor
- AMD Athlon 64 FX-60 (2,6 GHz, Dual-Core)
- Motherboard
- Asus A8N32-SLI Deluxe (nForce4 SLI x16) Haupt-Testplatine und für SLI-Systeme
- Asus A8R32-MVP Deluxe (RD580, Xpress 3200) für CrossFire-Systeme
- Arbeitsspeicher
- 2x 1024 MB Corsair TwinX1024-3500LL PRO (2-3-2-5)
- Grafikkarten
- ATi Radeon X1950 XTX (650/1000)
- ATi Radeon X1950 CrossFire-Edition (650/1000)
- ATi Radeon X1900 XTX (650/775)
- ATi Radeon X1900 CrossFire-Edition (625/725)
- ATi Radeon X1900 XT (625/725) (Simuliert durch CrossFire-Edition)
- ATi Radeon X1900 XT 256 MB (625/725)
- ATi Radeon X1900 GT (575/600)
- ATi Radeon X1800 XT (625/750)
- ATi Radeon X1800 XL (500/500)
- ATi Radeon X1600 XT (590/690)
- ATi Radeon X1600 Pro (500/390)
- ATi Radeon X1300 Pro (600/400)
- nVidia GeForce 8800 GTX (575/1350/900)
- nVidia GeForce 7950 GX2 (500/600)
- nVidia GeForce 7950 GT (550/700)
- nVidia GeForce 7900 GTX (650/800)
- nVidia GeForce 7900 GT (450/660)
- nVidia GeForce 7900 GS (450/660)
- nVidia GeForce 7800 GTX 512 (550/850)
- nVidia GeForce 7800 GTX (430/600)
- nVidia GeForce 7800 GT (400/500)
- nVidia GeForce 7600 GT (560/700)
- nVidia GeForce 7600 GS (400/400)
- Peripherie
- AOpen AAP-1648Pro-DVD-Laufwerk
- Samsung S-ATA 2-HDD mit 200 GB Speicherplatz (NCQ aktiviert)
- Treiberversionen
- nVidia ForceWare 84.43
- nVidia ForceWare 91.31 (GeForce 7950 GX2)
- nVidia ForceWare 91.33 (GeForce 7900 GS)
- nVidia ForceWare 91.47 (GeForce 7950 GT, GeForce 7900 GTO)
- nVidia ForceWare 96.94 (GeForce 8800 GTX)
- ATi Catalyst 6.4
- ATi R580+ Launch-Treiber (Radeon X1950 XTX)
- ATi Catalyst 6.8 (Radeon X1900 XT 256 MB)
- Software
- Microsoft Windows XP Professional SP2
- Microsoft DirectX 9.0c
Benchmarks
Folgende Benchmarks kamen während unseres Tests zum Einsatz:
- Synthetische Benchmarks:
- 3DMark05 Version 1.2.0
- 3DMark06 Version 1.0.2
- Spielebenchmarks:
- Splinter Cell: Chaos Theory
- Fear
- Serious Sam 2
- Doom 3
- The Chronicles of Riddick
- Call of Duty 2
- Battlefield 2
- Quake 4
- Half-Life 2: Lost Coast
- Oblivion
- SpellForce 2
- Tomb Raider: Legend
- Prey
- Call of Juarez
Alle Benchmarks werden mit maximalen Details ausgeführt, damit die Grafikkarte möglichst hoch belastet wird. Als Einstellungen haben wir uns dabei für 1280x1024 und 1600x1200 entschieden. Damit zollen wir den modernen High-End-Beschleuniger Tribut, die durch ihre Rechenkraft niedrigere Auflösungen als 1280x1024 CPU-limitiert werden lassen. Neben den reinen Auflösungen lassen wir den Benchmarkparcours auch mit 4-fachem Anti-Aliasing sowie 16-fachen anisotropen Filter durchlaufen, wobei wir auf ATi-Grafikkarten zusätzlich das sogenannte Adaptive Anti-Aliasing (AAA) und auf nVidia-GPUs das Transparency Super-Sampling-Anti-Aliasing (TSSAA) hinzuschalten, damit flimmernde Alpha-Test-Texturen geglättet werden – moderne 3D-Beschleuniger bieten eine ausreichende Leistung, um die bessere Kantenglättung flüssig darzustellen. Grafikkarten ohne entsprechende Features – wie beispielsweise ATis Radeon-X8x0-Serie oder nVidias GeForce-6x00-Reihe – erbringen eine bessere Leistung bei einer gleichzeitig schlechtere Bildqualität, die nicht das Niveau der modernen 3D-Karten erreicht.
Achtung: Moderne SLI- und CrossFire-Systeme bieten dem Kunden eine dermaßen gewaltige Rechenleistung, dass selbst der schnellste Prozessor damit hoffnungslos überfordert ist und demzufolge beinahe alle Spiele CPU-limitiert sind, was bei immer schneller werdenden 3D-Beschleunigern ein großes Problem darstellt. Aus diesem Grund haben wir unsere Testmethoden für Multi-GPU-Systeme geändert, um derartigen Problemen so gut wie möglich vorzubeugen. Testläufe ohne Anti-Aliasing sowie dem anisotropen Filter fallen komplett aus dem Rahmenprogramm, da diese Qualitätseinstellung für zwei Grafikkarten keine Herausforderung mehr ist. Somit werden die Tests ausschließlich mit 4xAA sowie 16xAF in 1280x1024 und 1600x1200 durchgeführt.
Darüber hinaus werden wir die Grafikkarten mit einer noch höheren Einstellung belasten, um zu zeigen, zu welchen Leistungen ein SLI- oder CF-System im Stande ist. Auf den nVidia-Grafikkarten wird der 8xSAA-Modus verwendet, bei welchem nicht ausschließlich Multi-Sampling-AA, sondern zusätzlich Super-Sampling-AA zum Einsatz kommt, was nicht nur Alpha-Test-Texturen glättet, sondern auch wirksam gegen Shader-Aliasing sowie Texturflimmern (unabhängig, ob dieses durch den anisotropen Filter oder hochfrequenten Texturen hervorgerufen wird) hilft. Bei einer ATi-Karte schalten wir auf sechs-faches Anti-Aliasing hinauf und aktivieren zusätzlich das HQ-AF, was einen (beinahe) winkelunabhängigen Texturfilter zur Folge hat, welcher die meisten Winkel mit dem vollen AF-Grad bearbeitet. Aber Vorsicht, diese beiden Modi sind NICHT miteinander vergleichbar, weswegen wir die nVidia- und ATi-GPUs in den Diagrammen strikt voneinander trennen! Beide Qualitätseinstellungen liefern eine unterschiedliche Bildqualität und Performance und sollen nur zeigen, was mit zwei Hochleistungsgrafikkarten möglich ist.
Nach sorgfältiger Überlegung und mehrfacher Analyse selbst aufgenommener Spielesequenzen sind wir zu dem Schluss gekommen, im ForceWare-Treiber für nVidia-Karten die Qualitätseinstellungen auf High Quality anzuheben, da man nur mit diesem Setting das Texturflimmern effektiv bekämpfen kann – dies trifft aber nur auf die G7x-Generation zu, die G8x-GPUs werden mit den Standardeinstellungen des Treibers getestet, weil die Bildqualität stark zugenommen hat. Zudem ist dieser Modus vergleichbar mit der Einstellung „Catalyst A.I. Standard“ auf den ATi-Pendants, wodurch bei der Bildqualität größtenteils ein Gleichstand erreicht wird.
Treibereinstellungen: nVidia-Grafikkarten (G7x)
- Systemleistung: Hohe Qualität
- Vertikale Synchronisierung: Aus
- MipMaps erzwingen: keine
- Trilineare Optimierung: Aus
- Anisotrope Mip-Filter-Optimierung: Aus
- Optimierung des anisotropen Musters: Aus
- Negativer LOD-Bias: Clamp
- Gamma-angepasstes AA (G7x): Ein
- Transparenz AA (G7x): Supersampling
Treibereinstellungen: nVidia-Grafikkarten (G8x)
- Texturfilterung: Qualität
- Vertikale Synchronisierung: Aus
- MipMaps erzwingen: keine
- Trilineare Optimierung: Ein
- Anisotrope Muster-Optimierung: Aus
- Negativer LOD-Bias: Clamp
- Gamma-angepasstes AA (G7x): Ein
- Transparenz AA (G7x): Supersampling
Treibereinstellungen: ATi-Grafikkarten
- Catalyst A.I.: Standard
- Mipmap Detail Level: High Quality
- Wait for vertical refresh: Always off
- Adaptive Anti-Aliasing (R5x0): On
- High Quality AF: Off (On bei einem CF-System im Hohe-Qualität-Modus)
Theoretische Benchmarks
Fillrate Tester
- Dieses nützliche kleine Programm dient dazu, die Füllraten einer Grafikkarte zu messen. Im Gegensatz zu den bzw. im 3DMark integrierten Füllraten-Tests, die im Fall von Single-Texturing vornehmlich die Bandbreite messen, kann dieses Programm recht differenzierten Aufschluss über verschiedene Arten von Füllrate geben, unter anderem auch die Pixelshader-Füllraten, welche wir hier betrachten wollen.
Da die verwendeten Shader teilweise recht kurz und bandbreitenintensiv sind, haben wir die Auflösung möglichst weit erhöht, um den Fokus etwas mehr auf die Füllrate zu verlagern. Da hier mehrere mathematische Operationen pro Pixel nötig sind, wird die Füllrate durch die Erhöhung der Auflösung stärker belastet als die Bandbreite.
Getestet wurde in 1600x1200 in 32Bit mit 24Bit Z- und 8Bit Stencilbuffer und 60 Hz Refreshrate. - Download: Fillrate Tester [24]
VillageMark
- Der VillageMark wurde von PowerVR entwickelt und diente dazu, die Vorzüge des Kyro 2 zu verdeutlichen, da in jenem Benchmark der Overdraw mit einem Faktor von bis zu 10 besonders groß ist. Viele, besonders ältere Grafikkarten, berechnen hier auch die Oberflächen, die durch andere verdeckt sind und daher eigentlich nur verschwendete Bandbreite und Füllrate bedeuten, so dass dieser grafisch eigentlich nicht sehr aufwendige Benchmark doch öfter als man zunächst denkt zu einem Stolperstein wird. Deswegen ist es von größter Bedeutung in diesem Benchmark, eine gut funktionierende Technik zum Entfernen verdeckter Oberflächen (HSR = Hidden Surface Removal) zu besitzen.
Getestet wurde mit folgender Kommandozeile: [InstallDir]\D3DVillagemark.exe -benchmark=1 -width=xxxx -height=xxxx -bpp=32" - Weitere Informationen: PowerVR.com [25]
- Download: PowerVR.com [26]
VillageMark v1.20
Angaben in Bildern pro Sekunde (FPS)
|
Fablemark
- Der Fablemark wurde, wie auch der nachfolgende Templemark, von PowerVR entwickelt und dient trotz eines sehr hohen Anteils an Overdraw der Zurschaustellung der Stärken des Kyro-Chips was den Stencil-Buffer angeht.
Natürlich wird auch auf allen anderen Karten die Stencil-Performance stark gefordert, so dass dieser Test ein Indiz für kommende Spiele sein kann, die vor dem eigentlichen Rendering einen Z-/Stencil-only Pass einlegen, um vorab jeglichen Overdraw zu vermeiden.
Getestet wurde mit folgender Kommandozeile: [InstallDir]\D3DFablemark.exe -benchmark=1 -width=xxxx -height=xxxx -bpp=32" - Weitere Informationen: PowerVR.com [27]
- Download: PowerVR.com [28]
FableMark v1.0
Angaben in Bildern pro Sekunde (FPS)
|
ShaderMark
- Der ShaderMark liegt zur Zeit in der aktuellen Version 2.1 vor und wurde von Tommti-Systems [29] entwickelt. Dank zahlreichen Updates befindet sich der Benchmark immer noch auf der Höhe der Zeit und misst die Performance der Shader-Einheiten moderner Grafikkarten. Dabei unterstützt das Programm auch das Shader-Model 3.0, weswegen es sich gut zu einem Vergleich aktueller Architekturen eignet. Getestet werden dabei bis zu 25 unterschiedliche Shader-Anweisungen unter der Auflösung 1600x1200, die allesamt in der Hochsprache HLSL (High Level Shader Language) geschrieben sind.
- Download: ShaderMark.de [30]
D3DRighmark Beta 4
- Auch wenn theoretische Benchmarks, weil diese keine „reale“ 3D-Umgebung darstellen, suboptimal für die Bestimmung der allgemeinen Performance sind, so zeigen solche Programme sehr gut, wie schnell oder langsam eine Grafikkarte in einem gewissen Teilbereich ist. Der „D3DRightmark“ in der Version „Beta 4“, der gleich mehrere dieser Teilbereiche untersucht, gehört derselben Kategorie an. Es wird nicht nur die Vertex-Shader-3.0-Performance, sondern ebenfalls mit Hilfe von unterschiedlichem Shader-Code, der in HLSL geschrieben ist und FP32-Genauigkeit vorsieht, die Pixel Shader 3.0 gemessen. Darüber hinaus wird zusätzlich ein Test der „Hidden Surface Removal“-Mechanismen durchgeführt, ebenso ein Pixel-Filling- und Point-Sprites-Test. Als Auflösung verwenden wir 1600x1200 ohne Kantenglättung und Texturfilterung. Da das Diagramm für die Ergebnisse des D3DRightmark sehr lang ist, haben wir die Werte in einem Klapptext versteckt. Ein einfaches Draufklicken genügt, um die Benchmarks sehen zu können.
- Download: D3DRightmark Beta 4 [31]
D3DRightmark Beta 4
Angaben in Bildern pro Sekunde (FPS)
|
Synthetische Benchmarks
3DMark05
- Der 3DMark05 liegt technisch nach wie vor auf sehr hohem Niveau. So kommen große Texturen mit der Auflösung 2048x2048, gemischt mit der Benutzung des Shader-Model 3.0, 2.x oder 2.0, zum Einsatz. Das letztes Jahr erschienene Programm setzt auf komplexe Lichteffekte, dynamische Schatten, aufwendige Bump Mapping-Effekte und benötigt vor allem eine hohe Geometrieleistung. Im Ergebnis spiegelt sich allerdings nur die Geschwindigkeit der Grafikkarte wieder, da diese selbst bei aktueller Hardware immer den Flaschenhals darstellt. Der wohl größte Nachteil beim 3DMark05 sind die weitläufigen Treiberoptimierungen aller aktuellen Grafikkartenhersteller. Diese gehen soweit, dass sich die Endergebnisse je nach Treiber im zweistelligen Prozentbereich verändern, somit können qualitätsmindernde Optimierungen nicht ausgeschlossen werden. Zudem basiert der synthetische Benchmark auf keinerlei Spieleengine, weshalb er keine reale Situation darstellt. Weitere Details zu diesem Programm gibt es in einem unserer ausführlichen Artikel [32].
- Download: 3DMark05 [33]


3DMark05 - 1280x1024
Angaben in Punkten
|
3DMark05 - 1600x1200
Angaben in Punkten
|
3DMark05 - 2560x1600
Angaben in Punkten
|
3DMark06
- Die allseits bekannte Benchmarkserie von Futuremark ist mittlerweile in der Version 2006 erschienen und hört dementsprechend auf die Bezeichnung „3DMark06“. Von den sechs Testszenen messen vier Sequenzen die Performance der Grafikkarte und zeigen eine Grafikpracht, die ihres gleichen sucht. Um jene zu erreichen setzen die Finnen auf modernste 3D-Technologie, weswegen nicht nur massiv das Shader-Model 3.0 verwendet wird, auch extrem aufwendige Texturen, spektakuläre Partikeleffekte, komplexe Schattenberechnungen und als weiteres Highlight „High Dynamic Range Rendering“ – kurz HDRR – werden eingesetzt. Dabei setzt Futuremark auf FP16-HDR, das die derzeit Best mögliche Bildqualität liefert, aber auch aufwendig zu berechnen ist. Somit können Grafikkarten ohne FP16-Blending-Einheiten, unter anderem die X8x0-Serie von ATi, zwei Testszenen nicht ausführen, weswegen die Punktzahl dieser GPUs generell niedrig ausfällt. Darüber hinaus können nur Grafikkarten, die MSAA auf ein FP16-Rendertarget ausführen können, die HDRR-Sequenzen mit Anti-Aliasing berechnen. Grafikkarten ohne diese Fähigkeit erzeugen bei Einsatz von Kantenglättung keine Punktzahl und werden deswegen nicht berücksichtigt. Weitere Details zu diesem Programm gibt es in einem unserer ausführlichen Artikel. [34]


3DMark06 - 1280x1024
Angaben in Punkten
|
3DMark06 - 1600x1200
Angaben in Punkten
|
3DMark06 - 2560x1600
Angaben in Punkten
|
Spielebenchmarks
Battlefield 2
- Battlefield ist wohl zweifellos eines der beliebtesten und meist gespielten Multiplayer-Spiele aller Zeiten. Der Nachfolger Battlefield 2 knüpft an das Erfolgsrezept an und kombiniert eine schicke Grafik mit einem relativ einfachen, aber sehr spaßigem Spielkonzept. Die Grafik überzeugt durch relativ moderne Shader-Effekte, lebt jedoch größtenteils durch aufwenige Texturen sowie einem überzeugenden Partikel- und Rauchsystem, wodurch eine dichte Atmosphäre erzeugt wird. Die Details werden für die Messungen auf das Maximum gestellt und wir setzen das Tool „BF2Bench“ [35] ein, da nur jenes realistische und reproduzierbare Ergebnisse erzeugt. Die mehrere Minuten lange Timedemo zeigt aus einer freien Kamerasicht mehrere Panzer-, Flugzeug- und Soldatengefechte.


Battlefield 2 - 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Battlefield 2 - 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Call of Duty 2
- Der Weltkriegsshooter „Call of Duty 2“ besticht nicht nur mit einer dichten Atmosphäre und einer Menge Spielspaß, auch die Grafik weiß zu gefallen. So wurde für das Spiel eine komplett neue Grafik-Engine geschrieben, bei welcher die Entwickler viele „Grafikregister“ gezogen haben. So setzt das Spiel auf viele Shader-Effekte und ist dank der hervorragenden Texturen und den sehr guten Gesichtsanimationen eine Augenweide. Am meisten beeindruckt in dem First-Person-Shooter die Rauch- und Nebeldarstellung, die wahrlich einzigartig ist – solch einen realistischen Rauch gab es bis jetzt in keinem PC-Spiel. Doch die Grafikpracht fordert ihren Tribut an den 3D-Beschleuniger und frisst die vorhanden Ressourcen der GPU wie zum Frühstück. Zudem ist Call of Duty 2 eines der ersten Spiele, die von einem 512 großen VRAM profitieren können. Die von uns ausgesuchte Timedemo zeigt einen Abschnitt aus der „Russenkampagne“, die vor allem durch die Darstellung des Schnees sowie der Landschaft extrem Hardwarefordernd ist. Mehrere Schusswechsel und Rauchgranaten sind mit von der Partie, weswegen sich die Timedemo sehr gut für einen Testparcours eignet.


Call of Duty 2 - 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Call of Duty 2 - 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Call of Duty 2 - 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Call of Juarez
- Auch wenn der First-Person-Shooter „Call of Juarez“ ohne John Wayne auskommen muss, so ist das Programm zweifellos eines der wenigen Western-Spiele, das eine große Aufmerksamkeit auf sich ziehen konnte. Eine gut erzählte Story, zwei interessante Charaktere, die unterschiedlicher nicht sein könnten, viele Pistolen-Duelle und natürlich eine Grafik, die sich vor der gesamten Konkurrenz nicht zu verstecken braucht. Praktischerweise bietet das Spiel damit eine Menge fürs Auge, was auch nicht spurlos an der Grafikkarte vorbei geht. Hochauflösende Texturen sowie Shadow-Maps, aufwendige Partikeleffekte und Qualm-Darstellung, hübsche Animationen und darüber hinaus High-Dynamic-Range-Rendering im qualitativ hochwertigen FP16-Format. Bei den Messungen ohne Anti-Aliasing haben wir in Call of Juarez High-Dynamic-Range-Rendering aktiviert, während das Feature unter Einsatz der Kantenglättung deaktiviert ist, da die G7x-GPU von nVidia auf ein FP16-Rendertarget kein Multi-Sampling-Anti-Aliasing ausführen kann. Stattdessen wird als qualitativ schlechterer Ersatz Bloom herangezogen. Da die nVidia-GPUs trotz aktueller Treiber derzeit kein TSSAA in Call of Juarez darstellen, entfernen wir die entsprechenden Karten solange aus den Diagrammen, bis der Bug in zukünftigen ForceWare-Versionen behoben worden ist.


Call of Juarez - 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Call of Juarez - 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Call of Juarez - 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Doom 3
- Angst? Schock? Dunkelheit? Grafikpracht? All dies gibt es wohl zu Genüge im Gruselshooter Doom 3. John Carmack, einer der Chefentwickler des Spiels und eine legendäre Persönlichkeit, wenn es um spektakuläre Grafik-Engines geht, hat bei seinem neuesten Werk die größte Aufmerksamkeit den Stencil-Schatten gewidmet. Dementsprechend dunkel ist das gesamte Spiel, damit die schablonenartigen Schatten gut auf den Spieler wirken. Aber dies waren noch nicht genug Effekte für den Entwickler ID-Software. So macht Doom 3 auch Gebrauch von den Pixelshader-Einheiten der Grafikkarten und setzt ebenfalls massiv auf Bump Mapping sowie Normal Maps. Zwar sind die Texturen verbesserungswürdig, aber trotzdem gehört Doom 3 zu den anspruchsvollsten Titeln des Jahres 2004 und ist somit prädestiniert für unseren Benchmarkparcours. Das Spiel setzt ID-typisch nicht auf DirectX als API, sondern auf OpenGL.


Doom 3 - 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Doom 3 - 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Doom 3 - 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
F.E.A.R.
- Doom 3 bekommt Konkurrenz – und was für Eine! Die Programmierer des neue Gruselshooters F.E.A.R. scheinen sich Doom 3 als großes Vorbild ausgesucht zu haben, wobei man allerdings fast alles besser zu machen scheint. Unter anderem wird die sehr beklemmende Atmosphäre durch eine Grafikqualität erreicht, die ihres Gleichen sucht. Shadereffekte in Massen, wunderschönes Bump-Mapping, sehr spektakuläre Schattenwürfe, detaillierte Texturen sowie hübsch aussehende Partikeleffekte und noch vieles mehr bekommt der Spieler zu Gesicht, weswegen F.E.A.R. bereits Pflicht für einen guten Benchmark-Parcours geworden ist. Wir verwenden mittlerweile für diese Zwecke die Vollversion, die über eine integrierte Benchmarkfunktion verfügt. Jene zeigt ein Gefecht sowie eine größere Explosion, die durch eine frei bewegende Kamera aufgenommen worden sind. Die Details sind, mit Ausnahme der Soft-Shadows, auf das Maximum gesetzt.


F.E.A.R. - 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
F.E.A.R. - 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
F.E.A.R. - 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
HL2: Lost Coast
- Half-Life 2 ist wohl zweifellos aufgrund seines legendären Vorgängers eines der meist erwarteten Spiele aller Zeiten gewesen. Nun ist es da und begeistert nicht nur in spielerischer Hinsicht, sondern auch durch seine Grafik, die unter anderem durch massiven „Shader Model 2.0“-Einsatz ermöglicht wird. Einige Monate nach der Erscheinung brachte Valve die kostenlose Technologiedemo „Lost Coast“ auf den Markt, die als Besonderheit High-Dynamic-Range-Rendering unterstützt und somit nicht nur einen deutlich höheren Lichtumfang sowie Lichtdynamik bietet, sondern auch die Hardware bis auf das Äußerste fördert. Valve hat dabei jedoch auf die Kompatibilität zu älteren Grafikkarten geachtet und setzt deswegen eine „minderwertige“ Form des HDRR ein, die nicht die optimale Bildqualität liefert. So liegen zwar die Texturen im FP16-Format vor – beziehungsweise INT16 für Grafikkarten ohne FP-Filtering –, allerdings verzichtet Valve auf FP16-Blending. Aus diesem Grund können auch X8x0-Grafikkarten in Lost Coast HDRR darstellen. Die selber erstellte Timedemo zeigt mehrere Feuergefechte mit Soldaten sowie einem Hubschrauber und verdeutlicht eindrucksvoll den optischen Gewinn durch HDRR.


HL2: Lost Coast - 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
HL2: Lost Coast - 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
HL2: Lost Coast - 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Oblivion
- Bereits der Vorgänger „Morrorwind“ hat bei vielen Spielefans eine richtige Begeisterung hervorgerufen und bei dem Nachfolger „Oblivion“ scheint dies nicht anders zu sein. Für kaum ein Spiel findet man derzeit mehr Diskussionen im Internet. Aber nicht nur spielerisch, auch grafisch kann Oblivion überzeugen und fährt, um dieses Ziel zu erreichen, schwere Geschütze auf. Noch niemals zuvor wurde HDRR mit dynamischem Tone-Mapping derartig realistisch eingesetzt. Darüber hinaus kann das Spiel mit schönen Schatteneffekte sowie stellenweise hoch auflösenden Texturen und Partikeleffekte glänzen. Dementsprechend ist Oblivion geradezu prädestiniert für einen guten Benchmarkparcours. Die verwendete Szene zeigt nicht nur eine aufwendige Beleuchtung, auch sind mehrere Sträucher und Bäume zu sehen, die vor allem die GPU extrem stark belasten. Bei den Messungen ohne Anti-Aliasing haben wir in Oblivion High-Dynamic-Range-Rendering aktiviert, während das Feature unter Einsatz der Kantenglättung deaktiviert ist, da viele Grafikkarten auf ein FP16-Rendertarget kein Multi-Sampling-Anti-Aliasing ausführen können. Stattdessen wird als qualitativ schlechterer Ersatz Bloom herangezogen.


Oblivion - 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Oblivion - 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Oblivion - 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Prey
- Kinder in jungen Jahren verkleiden sich zu Karneval gerne als Indianer. Viele ältere Artgenossen spielen dagegen lieber den First-Person-Shooter Prey und helfen dem etwas mürrischen Indianerhelden Tommy, die Welt vor einer außerirdischen Macht zu retten. Dies tut Tommy nicht nur mit gefundenen beziehungsweise abgenommenen Alien-Waffen, sondern zusätzlich mit der altbewährten Doom-3-Engine, die für Prey aber kräftig aufgebohrt worden ist. Mit anderen Worten: Die Grafik ist kaum wieder zu erkennen. Hochauflösende Texturen, schicke Shader-Effekte, aufwendige Schattenberechnungen und noch vieles mehr machen das Spiel zu einem wahren Augenschmaus. Die selbst aufgenommene Timedemo zeigt sowohl einen Abschnitt innerhalb als auch außerhalb eines Gebäudes und deckt insgesamt einen Großteil des Spielgeschehens ab. Waffenfeuer, viele Gegner und Tommys Fähigkeit, sich außerhalb seines eigenen Körpers zu bewegen, fehlen nicht.


Prey - 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Prey - 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Prey - 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Quake 4
- Die bekannte Quake-Reihe von ID-Software ist jedes mal ein Highlight für einen „First Person Shooter“-Fan, da die Spiele nicht nur einen hohen Unterhaltungswert bieten, sondern auch mit einer Grafikpracht daherkommen, die des öfteren die Messlatte ein gutes Stück höher legt. Die aktuelle Version, Quake 4, wurde allerdings von Raven Software programmiert und nutzt eine leicht weiterentwickelte Doom-3-Engine. Somit liegt die Grafik auf einem hohen Niveau, kann aber keine neue Maßstäbe setzen. Nichtsdestotrotz bietet das Spiel mit aufwenigen Charaktertexturen und vielen Schattenspiele einiges fürs Auge. Die ausgesuchte Timedemo zeigt mehrere Feuergefechte sowie spektakuläre Schatten- und Farbspiele. Nach dem Patchen des Spiels auf die Version 1.2 ist auch der Bug verschwunden, dass weder die Spielerschatten, noch die Waffeneffekte dargestellt werden. Somit entsprechen die ermittelten Ergebnisse nun dem „wahren“ Spielverlauf.


Quake 4 - 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Quake 4 - 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Quake 4 - 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
The Chronicles of Riddick
- „The Chronicles of Riddick“ lehnt sich an den Kinofilm „Riddick: Chroniken eines Kriegers“ an und basiert auf der OpenGL-API. Dabei gehört Riddick zu einer der größten Überraschungen des Jahres und bietet dementsprechend auch eine sehr fordernde und vor allem spektakuläre Grafik. Dabei kommen nicht nur die modernen Shadereinheiten aktueller Grafikkarten zum Zuge, auch durch hochauflösende Texturen sowie feinste Bump-Mapping-Effekte geraten heutige GPUs ins Schwitzen. Die verwendete Timedemo Panoptical 1 zeigt einen reellen Spielausschnitt aus Riddick, welcher mehrere Schusswechsel, Explosionen sowie Rauch beinhaltet, und zeigt somit eine für das Spiel realistische Performancedarstellung.


The Chronicles of Riddick - 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
The Chronicles of Riddick - 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Riddick - 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Serious Sam 2
- „Ballern bis der Zeigefinger glüht!“ lautet wohl zweifellos die Divise in dem First-Person-Shooter „Serious Sam“, der vor einigen Jahren nicht nur einen großen Erfolg feierte, sondern auch mehr als nur beliebt bei den Spielern klassicher 3D-Shooter geworden ist. Der Nachfolger, der auf die simple Bezeichnung „Serious Sam 2“ hört, verspricht ebenfalls ein ähnlich erfolgreiches Vergnügen zu werden und kombiniert den Ballerspaß mit einer hübschen Optik, die vor allem durch eine große Anzahl an Vertex-Shader-Operationen, scharfen Texturen, bunten Effekten und einer schier unendlichen Gegnermasse geschaffen wird. Die selbst aufgenommene Timedemo zeigt dabei eine normale Spielszene mit großen Gegner-Scharen und massig Explosionen sowie Gefechtsfeuer. Bei den Messungen ohne Anti-Aliasing haben wir in Serious Sam 2 High-Dynamic-Range-Rendering aktiviert, während das Feature unter Einsatz der Kantenglättung deaktiviert ist, da viele Grafikkarten auf ein FP16-Rendertarget kein Multi-Sampling-Anti-Aliasing ausführen können.


Serious Sam 2 - 1280x960
Angaben in Bildern pro Sekunde (FPS)
|
Serious Sam 2 - 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Serious Sam 2 - 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
SpellForce 2
- Unter Strategiefans machte sich das Spiel „SpellForce“ bereits einen guten Namen und wie es zur Zeit aussieht, wird der Nachfolger „SpellForce 2“ in dessen Fußstapfen treten können. Ein Grund für den Erfolg ist die moderne Grafikengine, die für den zweiten Teil einen komplett neuen Motor spendiert bekommen hat. Und SpellForce 2 kommt mit einer Grafikpracht daher, die ersteinmal übertroffen werden muss. Detaillierte Texturen, moderne Shader-Effekte und hochauflösende Schatten; der Käufer bekommt eine Menge für das verwöhnte Auge geboten. Als Benchmarksequenz verwenden wir das Intro zur ersten Mission der Kampagne. Dieses zeigt einen Kameraschwenk sowie zwei Personen in einem Gespräch und vor allem viele Alpha-Test-Texturen, die für jede Grafikkarte in unseren Qualitätseinstellungen eine wahre Herausforderung sind.


SpellForce 2 - 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
SpellForce 2 - 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Splinter Cell 3
- „Chaos Theory“ ist der Titel des dritten Teils der bekannten Schleichreihe „Splinter Cell“ vom Publisher Ubi Soft und setzt auf ein stark modifiziertes Grundgerüst der zweiten Unreal-Grafikengine auf. Diese wurde für den neuesten Splinter Cell-Spross deutlich umgeändert und unterstützt nun neben dem Shader-Model 3.0 unter anderem auch High Dynamic Range-Effekte. Somit ist Splinter Cell 3 das zweite Spiel neben Far Cry, welches einen deutlich erweiterten Wertebereich der erfassbaren Lichtintensität aufweisen kann. Weiterhin kann das Spiel mit schönen Schatten- sowie Bump Mapping-Effekten auftrumpfen. Die selbst erstellte Timedemo zeigt einen kleinen Ausschnitt aus der ersten Mission, die den Hauptprotagonisten Sam Fischer über einen dunklen Strand bei Regen und durch eine mit schicken Lichteffekten verzierte Höhle führt. Bei den Messungen ohne Anti-Aliasing haben wir in Splinter Cell 3 High-Dynamic-Range-Rendering aktiviert, während das Feature unter Einsatz der Kantenglättung deaktiviert ist, da viele Grafikkarten auf ein FP16-Rendertarget kein Multi-Sampling-Anti-Aliasing ausführen können.


Splinter Cell 3 - 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Splinter Cell 3 - 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Splinter Cell 3 - 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Tomb Raider: Legend
- Lara Croft is back – wohl zweifellos die bekannteste und wahrscheinlich auch beliebteste Frau in einem PC-Spiel. Doch „Tomb Raider: Legend“ glänzt nicht nur mit der Spielfigur, auch das eigentliche Spielgeschehen kann in dem letzten Teil der Serie, im Gegensatz zu den Vorgängern, überzeugen. Mit von der Partie ist eine neue Grafikengine, die durchaus überzeugen kann. So bekommt der Käufer im „Next-Gen-Modus“ nicht nur viele Polygone geboten, auch Shader-3.0-Anweisungen, hochauflösende Texturen und schicke Schattenspiele kommen in Tomb Raider: Legend zum Einsatz. Als Benchmarksequenz haben wir das Intro des ersten Levels verwendet, welches den Absturz eines Flugzeuges und eine gewagte Kletteraktion zeigt.


TR: Legend 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
TR: Legend 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
TR: Legend - 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Performancerating
Kommen wir nun abschließend zum Performancerating. Dadurch soll es erleichtert werden, alle Ergebnisse auf einen Blick zusammengefasst zu bekommen. Da die synthetischen Benchmarks in dem Testparcours (sprich der 3DMark05 sowie 3DMark06) über keine Spiele-Engine verfügen und somit keine realistische Aussagen über die Geschwindigkeit in 3D-Titeln wiedergeben, haben wir diese Applikationen aus dem Rating herausgenommen. Zudem finden sowohl Call of Juarez als auch Prey derzeit noch keine Berücksichtigung, da wir nicht alle Grafikkarten mit den neuen Applikationen testen konnten.
Performancerating 1280x1024
Angaben in Prozent
|
Performancerating 1600x1200
Angaben in Prozent
|
Performancerating 2560x1600
Angaben in Prozent
|
Performancerating Qualität
Rating 1280x1024 4xAA/16xAF
Angaben in Prozent
|
Rating 1600x1200 4xAA/16xAF
Angaben in Prozent
|
Rating 2560x1600 4xAA/16xAF
Angaben in Prozent
|
Sonstiges
Lautstärke
Da quasi alle aktuellen Modelle über eine herstellerseitige Lüftersteuerung verfügen, unterscheiden wir bei den Messungen den 2D- und den 3D-Betrieb. Für die Last-Messungen wird der 3DMark06 in der Endlosschleife ausgeführt und nach dreißig Minuten die Lautstärke notiert. Beide Messungen werden im Abstand von 15 cm zur Grafikkarte durchgeführt. Um nur die Lautstärke der jeweiligen Grafikkarte messen zu können, wurden beim Test die Gehäuselüfter vom Netz getrennt. Die Messung erfolgt für das gesamte Testsystem.
Lautstärke
Angaben in Dezibel
|
Nanu, ist der Rechner denn schon an? Ja, in der Tat. Denn die GeForce 8800 GTX agiert unter Windows flüsterleise. Selbst bei genauem Hinhören kann man die Grafikkarte nicht aus dem geschlossenen Gehäuse heraushören – sehr gut! Dabei liegt die G80-GPU gleich auf mit der Radeon X1950 XTX, die ebenso lautlos ihren Dienst verrichtet. Wer nun aufgrund der 681 Millionen Transistoren befürchtet, dass die GeForce 8800 GTX im 3D-Modus aufdreht, den können wir nur beruhigen. Ja, die Grafikkarte wird durchaus etwas lauter, störend ist der Radiallüfter aber noch lange nicht. Mit 52 Dezibel platziert sich der 3D-Beschleuniger im guten Mittelfeld. Hinter der Radeon X1950 XTX, aber noch vor der GeForce 7950 GX2. Auch geräuschempfindliche Naturen können somit beruhigt zur GeForce 8800 GTX greifen.
Temperatur
Ähnlich den Messungen zur Lautstärke werden auch die Temperaturmessungen durchgeführt. Fast alle aktuellen Grafikkarten besitzen Sensoren, die per Treiber oder Hersteller-Tool ausgelesen werden können. Die Kern-Temperatur wird dabei im Ruhezustand im Windows-Desktop und unter Last nach dreißig Minuten 3DMark06 abgelesen. Zudem messen wir mit Hilfe eines Infrarot-Thermometers die Chiptemperatur auf der Rückseite der Grafikkarte.
Temperatur
Angaben in °C
|
Im 2D-Modus reiht sich die GeForce 8800 GTX mit gemessenen 63 Grad Celsius zwar ans untere Ende des Testfeldes ein, bedenklich ist diese Temperatur aber noch lange nicht. Dies ist wohl die Kehrseite des lautlos agierenden Lüfters. Unter Last bleibt die G80-GPU mit 81 Grad Celsius erstaunlich kühl, was wahrscheinlich dem großen Kühlsystem zu verdanken ist. Die Radeon X1950 XTX liegt mit 83 Grad knapp hinter der GeForce 8800 GTX, die GeForce 7950 GX2 ist mit 88 Grad Celsius dagegen deutlich wärmer. Auch auf der Chiprückseite behält die GeForce 8800 GTX einen kühlen Kopf. Mehr als 71 Grad konnten wir nicht messen, womit die High-End-GPU gleichauf mit dem Top-Modell von ATi liegt. Die GeForce 7950 GX2 ist mit 82 Grad weit abgeschlagen.
Stromverbrauch
Für die Messungen der Stromaufnahme wird ein handelsüblicher Verbrauchs-Monitor, den man sich auch beim örtlichen Stromversorger ausleihen kann, genutzt. Gemessen wird die Gesamt-Stromaufnahme des Testsystems. Auch hier gilt die Teilung zwischen Idle- und Last-Betrieb. Letzterer wird durch Verwendung des 3DMark06 unter der Auflösung 1600x1200 sowie 4-fachem Anti-Aliasing und 16-fachem anisotropen Filter simuliert.
Stromverbrauch
Angaben in Watt (W)
|
Dass 681 Millionen Transistoren, die in der 90-nm-Technologie gefertigt werden, nicht spurlos an jeder Kritik vorbeigehen können, schien klar. Lautstärke und Temperatur hat die Karte erstaunlicherweise mühelos zu unserer Zufriedenheit hinter sich bringen können. Doch trifft es die nVidia GeForce 8800 GTX schlussendlich im Stromverbrauch. Die Ergebnisse fallen allerdings nicht so hoch aus, wie wir vermutet hatten.
Die G80-GPU benötigt unter Windows 217 Watt (gemeint ist hier der komplette Testrechner) und stellt somit einen neuen Negativrekord auf. Abgelöst wird damit die GeForce 7950 GX2, die diesen Titel mit einem Verbrauch von 191 Watt bis jetzt inne hatte. Die Radeon X1950 XTX liegt mit 168 Watt weit dahinter.
Unter Last setzt sich die GeForce 8800 GTX ebenfalls ans obere Ende des Testfeldes. 310 Watt zieht der Rechner aus der Steckdose, etwa 30 Watt mehr als ein System mit GeForce 7950 GX2. Die Radeon X1950 XTX begnügt sich mit 277 Watt. Für Stromsparer ist die GeForce 8800 GTX also nicht geeignet, wovon aber auch nicht auszugehen war.
Übertaktbarkeit
Vielen dort draußen wird die gerade neu gekaufte Grafikkarte noch nicht schnell genug sein. Ein probates Mittel, dieses Bedürfnis nach noch mehr Geschwindigkeit zu befriedigen, ist die Hardware zu übertakten. Als kleine Stabilitätsprobe ließen wir den 3DMark05, der besonders grafiklastig ist, laufen und testeten nachfolgend den höchsten Takt mit Hilfe von F.E.A.R, HL2: Lost Coast sowie Quake 4. Jedoch muss man vor den Messungen anmerken, dass sich die Ergebnisse nicht auf jede Karte desselben Typs übertragen lassen, da die Güte von Chip zu Chip unterschiedlich ist.
Übertaktbarkeit
Angaben in Bildern pro Sekunde (FPS)
|
Die Übertaktungsergebnisse der G80-GPU fallen auf der GeForce 8800 GTX enttäuschend aus, da der Rechenkern anscheinend bereits bei den von Haus aus eingestellten Taktraten am Limit läuft. Mehr als 600 MHz waren nicht möglich, bevor sich erste Bildfehler zeigten. Besser lief es beim GDDR3-Speicher von Samsung, der auch 1000 MHz noch ohne Probleme mitmachte. Dadurch fallen die Performanceverbesserungen recht ernüchternd aus und einzig F.E.A.R. kann gut zulegen.
HDTV-Wiedergabe
Zum Einsatz in dieser Disziplin kam der schon altbekannte Film-Trailer namens „Step into Liquid“, der eine Länge von einer Minute und 56 Sekunden hat und in der Auflösung von 1920x1080 Pixel (1080p) vorliegt. Wer unseren Test auf seinem System nachahmen möchte, kann das Video direkt bei Microsoft herunterladen [36] (Direktlink - 114 MB), benötigt aber zusätzlich jeweils die neuesten Treiber aus dem Hause nVidia [37] und ATi [38], den Media Player in der Version 10 [39] und ein spezielles Hotfix [40], damit der Player die HDTV-Beschleunigung auch unterstützt. Die CPU-Last wurde während des Abspielens von uns mittels ThrottleWatch und einem selbst geschriebenen Skript aufgezeichnet.
Die CPU-Auslastung während des Abspielens eines WMV-HD-Videos ist auf der GeForce 8800 GTX erstaunlicherweise relativ hoch und liegt auf dem Level einer Radeon X1950 XTX. Eine GeForce 7950 GX2 belastet den Prozessor ein gutes Stück weniger. Probleme bei der Wiedergabe sind dennoch nicht aufgetreten.
Preis-Leistung-Verhältnis
Neben der Leistung, der Bildqualität und den sonstigen Eigenschaften einer modernen Grafikkarte spielt der Preis für die meisten Käufer eine entscheidende Rolle. Denn was nützt einem die schnellste GPU, wenn sie schlicht unbezahlbar ist? Aus diesem Grund haben wir ein Diagramm mit allen 3D-Beschleunigern aus dem Testparcours zusammengestellt und die günstigsten Preise bei Geizhals [41] herausgesucht. Dabei wird der Preisindex nicht nur nach dem günstigsten Preis erstellen, die Hardware muss auch erhältlich sein. Wir weisen darauf hin, dass sich der Preis der bevorzugten 3D-Karte täglich ändern kann, weswegen eine dauerhafte Korrektheit nicht garantiert werden kann. (Stand der Preise: 7.11.2006)
Preisliste
Angaben in Euro
|
nVidia gibt für die GeForce 8800 GTX eine offizielle Preisempfehlung von 600 Euro aus. Ein Blick zu Geizhals verrät, dass die Karten wahrscheinlich etwas günstiger verkauft werden, wobei natürlich noch kein Shop ein Modell offiziell auf Lager hat. Dieser Preis beläuft sich auf etwa 570 bis 580 Euro.
Im Folgenden wird nun das Preis-Leistung-Verhältnis der im Test vertretenen Karten bestimmt. Dabei wird das Performance-Rating durch den Preis dividiert und mit 1000 Multipliziert. Das Ergebnis repräsentiert die Leistung, die man kaufmännisch gerundet für einen Euro erhält. Das Preis-Leistung-Verhältnis wurde für verschiedene Auflösungen und Qualitätseinstellungen ermittelt.
Preis/Leistung 1600x1200 4xAA/16xAF
Angaben in Prozent
|
Preis/Leistung 1280x1024
Angaben in Prozent
|
Preis/Leistung 1600x1200
Angaben in Prozent
|
Preis/Leistung 1280x1024 4xAA/16xAF
Angaben in Prozent
|
SLI-Preview
Mit der GeForce-6-Serie führte nVidia die Multi-GPU-Technologie ein, die auf den Namen SLI hört und viele aktuelle Spiele, die primär GPU-limitiert sind, deutlich beschleunigen kann. Bei dem neuen Flaggschiff GeForce 8800 GTX darf SLI natürlich auch nicht fehlen und dementsprechend wollen wir unseren Lesern ein kleines SLI-Preview nicht vorenthalten. Ein richtiges Review war leider nicht möglich, da das Asus-Exemplar der GeForce 8800 GTX zu früh zurück zum Hersteller musste. Ein ausführlicher Bericht wird in Kürze aber nachgeliefert.



SLI auf der GeForce 8800 GTX funktioniert genauso wie bei allen anderen Grafikkarte. Eine SLI-Bridge wird mit einem SLI-Connector auf jeweils einem 3D-Beschleuniger verbunden – ob man den ersten oder zweiten auf dem G80 nimmt, ist dabei gleichgültig –, man installiert den passenden Treiber und schon kann der Spaß beginnen. Als kleinen Parcours haben wir uns die 3D-Applikationen 3DMark05, Doom 3, F.E.A.R., Half-Life 2: Lost Coast sowie das Rollenspiel Oblivion ausgesucht. Als Qualitätseinstellungen verwenden wir 2560x1600 mit 4-fachem Anti-Aliasing sowie 16-facher anisotroper Filterung, damit die CPU nur eine möglichst kleine Rolle spielt.
SLI-Benchmarks - 2560x1600 4xAA/16xAF
Angaben in Bildern pro Sekunde (FPS)
|
Wie man eindeutig erkennen kann, ist das SLI-Gespann der zwei GeForce-8800-GTX-Karten das derzeit mit Abstand schnellste Duo, das man sich auf dem Markt zulegen kann. Selbst eine einfache GeForce 8800 GTX hält zwei „GeForce 7900 GTX“-Karten meistens in Schach und kann sich teilweise gar absetzen – maximaler Spielspaß zu einem hohen Preis ist garantiert.
Fazit
Nach langer Wartezeit ist die neue nVidia G80-GPU in Form der GeForce 8800 GTX als Ablösung der „alten“ Garde GeForce 7950 GX2, die mit dem heutigen Tag ebenso aus dem Programm gefallen ist wie die GeForce 7900 GTX, eingetroffen. Dabei erlebt man schon die ein oder andere Überraschung, bevor man überhaupt den Rechner einschaltet. So haben mit einer Unified-Shader-Architektur wohl nur die Allerwenigsten gerechnet. Ebenso lange unbekannt wie auch spannend sind die restlichen Veränderungen an der GPU. 128 Stream-Prozessoren, 64 Texture-Mapping-Units, FP32-Blending für 128-Bit-High-Dynamic-Range-Rendering inklusive Anti-Aliasing und, was man natürlich nicht vergessen sollte, die native Unterstützung für den API-Standard der Zukunft, Direct3D 10. Doch wie hat sich die Grafikkarte nun im gesamten Test geschlagen?
Über die Performance kann man eigentlich nicht viel diskutieren, denn in dieser Disziplin ist die GeForce 8800 GTX, wie es sich für eine „Next-Generation-Grafikkarte“ gehört, der gesamten Konkurrenz einfach nur meilenweit voraus. Dabei tritt allerdings in niedrigen Qualitätseinstellungen ein Problem auf, mit dem sicher viele Käufer zu kämpfen haben werden: Die CPU limitiert selbst in jenen Settings, wo die bisherigen Spitzenmodelle schon anfingen einzubrechen. Dementsprechend werden wir in Kürze einen Nachtest mit einem Core 2 Extreme X6800 durchführen, um das Potenzial der Einzelkarte sowie die des SLI-Gespanns besser zeigen zu können.
Ohne Anti-Aliasing sowie der anisotropen Filterung limitiert, wie bereits erwähnt, beinahe durchgehend die CPU. So ist die GeForce 8800 GTX im Durchschnitt 15-20 Prozent schneller als die GeForce 7950 GX2, was zwar schon ein beachtlicher Wert, aber noch nicht die maximal mögliche Leistung ist. Deutlich besser sieht es dagegen in 2560x1600 aus, da die GPU-Last dort um einiges höher ist. Satte 30 Prozent kann sich die GeForce 8800 GTX von der 7950 GX2 absetzen – dies lässt erahnen, in welchen Dimensionen der 3D-Beschleuniger in noch höheren Qualitätseinstellungen agieren wird.
Mit der Kantenglättung sowie der Texturfilterung kann sich die GeForce 8800 GTX weiter von der GeForce 7950 GX2 absetzen. In 1280x1024 sind es noch 20 Prozent, während es in 1600x1200 bereits 25 Prozent sind. So richtig in Fahrt kommt die GeForce 8800 GTX aber erst in 2560x1600. Einen Vorsprung von satten 35 Prozent kann sich der neue High-End-Beschleuniger erkämpfen – ein sehr guter Wert, wenn man bedenkt, dass die GeForce 7950 GX2 eigentlich aus zwei Grafikkarten besteht. Die Radeon X1950 XTX folgt mit einer Differenz von 40 Prozent und kann der GeForce 8800 GTX zu keiner Zeit etwas entgegensetzen.
Und die GeForce-8800-Reihe hat nicht nur in der Performance, sondern auch in der Bildqualität einen großen Sprung nach vorne gemacht. Das neue Anti-Aliasing ist nicht nur schnell, es bietet größtenteils auch eine bessere Polygonkantenglättung als das ohnehin gute 6-fache Anti-Aliasing auf einer aktuellen Radeon-Grafikkarte. Die Coverage-Sampling-Varianten 8xAA sowie 16xAA sind dabei noch sehr schnell und liegen nicht weit vom gewohnten, vier-fachen Anti-Aliasing entfernt. Etwas schade ist das Fehlen des 8xSAA-Modus', der auf einem G7x nicht nur Polygonkanten glättet, sondern ebenfalls Texturflimmern vermindert. Ehrlich gesagt ist dies bei einem G80 aber kaum noch nötig.
Noch mehr begeistern konnte allerdings der anisotrope Filter, der auf einer GeForce 8800 in allen Qualitätseinstellungen durch die Bank winkelunabhängig ist. Darüber hinaus fallen die „Optimierungen“, im Gegensatz zum G71, kaum negativ auf. Ebenso hat nVidia dem Texturflimmern mit dem G80 den Kampf angesagt. Bereits in der Default-Einstellung des Treibers flimmern die Texturen weniger als auf einer GeForce 7900 oder einer ATi Radeon X1000. Die GeForce 8800 bietet somit bereits in der Default-Einstellung eine deutlich bessere Bildqualität als die GeForce 7900 in der Einstellung Hohe Qualität. Vor einer Radeon X1000 muss sich der G80 genauso wenig verstecken. Und noch mehr, er kann die ATi-Karte in diesem Punkt problemlos ausstechen. Für diese Verbesserungen müssen wir nVidia ein großes Lob aussprechen!
Auch Abseits der Performance und der Bildqualität gibt es an der nVidia GeForce 8800 GTX kaum etwas zu bemängeln. Als positiv kann man die Kühlkonstruktion ansehen, die in allen Lebenslagen zu überzeugen weiß, was längst nicht bei jeder High-End-Karte der Fall ist. Einzig der Stromverbrauch fällt bei der GeForce 8800 GTX sowohl unter Last als auch im 2D-Modus überdurchschnittlich hoch aus und belastet somit zusätzlich den eigenen Geldbeutel und die Umwelt. Bei der nächsten Generation wäre es schön, wenn man eine leichte Rückentwicklung erkennen könnte.
Schlussendlich lässt sich neben dem Stromverbrauch eigentlich kein wirklicher Schwachpunkt entdecken, egal wie intensiv man sucht. Das GeForce-Modell ist zweifellos die schnellste Grafikkarte auf dem Markt, bietet die beste Bildqualität und ist mit der Unterstützung von Direct3D 10 sowie der Möglichkeit, Effektphysik schnell zu berechnen, bestens für die Zukunft geeignet. Zwar fällt der Preis mit 600 Euro sehr hoch aus, jedoch ist die GeForce 8800 GTX allen anderen 3D-Beschleunigern zweifellos ein gutes Stück voraus und zudem werden bei guter Verfügbarkeit die Preise relativ schnell sinken. Alles in allem ein sehr beeindruckendes Stück Hardware, das es sich verdient hat, mit unserem „Hardware-Hammer“ ausgezeichnet zu werden.

















