Mittlerweile ist es knapp ein Jahr her, dass Nvidia die G80-GPU-Generation der Öffentlichkeit vorgestellt hat [1]. Damals buhlten die GeForce 8800 GTS sowie das Topmodell, die GeForce 8800 GTX, um die Gunst der Käufer, die die beiden Grafikkarten auch in kürzester Zeit erobern konnten. Und das mit Recht. Die 3D-Beschleuniger rannten nicht nur in Sachen Geschwindigkeit regelrechte Kreise um die Konkurrenz, auch die Bildqualität machte gegenüber der Vorgängergeneration einen großen Sprung nach vorne. Dass die G80-GPU obendrein auch noch der erste Rechenkern war, der mit einer Direct3D-10-Unterstützung daher kam, war da beinahe schon nebensächlich.
Doch die Zeit steht glücklicherweise nicht still und seit November 2006 ist viel passiert: Nvidia präsentierte die Mid-Range-Reihe GeForce 8600 sowie die Low-End-Derivate der GeForce-8500- und GeForce 8400-Serie und der direkte Konkurrent AMD blieb eben so wenig untätig und platzierte nach einer langen Wartezeit die Radeon-HD-2000-Grafikkarten auf dem Markt. Danach schien es, als würden sich AMD und Nvidia etwas ausruhen, doch hinter den Kulissen ging es durchaus weiter heiß her. Denn in den USA und Kanada war man schon seit langer Zeit damit beschäftigt, eine Überarbeitung (Refresh) des G80 und des R600 fertigzustellen. Und so verwunderte es uns nach gut zwölf Monaten dann nur wenig, als vor einigen Tagen in unserem Postfach eine Einladung von Nvidia zu einem Editors Day in den USA eintrudelte. Ziel der Reise: Die Pressevorstellung der GeForce 8800 GT.
Mittlerweile ist das NDA (Non-Disclosure Agreement – Schweigeabkommen) gefallen und die Geheimnisse um die G92-GPU, über die es bereits seit Monaten diverse Gerüchte gab, dürfen gelüftet werden. Ein richtiger High-End-Chip ist es nicht geworden, stattdessen versorgt Nvidia mit dem G92 das Performance-Segment.
Nvidia hat uns freundlicherweise zwei Exemplare der GeForce 8800 GT zur Verfügung gestellt, die wir nach unserem Ersteindruck am Tag der Vorstellung [2] nun in diesem Artikel ausführlich und inklusive SLI untersuchen werden. Da Nvidia die öffentliche Vorstellung der Grafikkarte um zwei Wochen vorgezogen hat und wir erst letzte Woche aus dem Hauptquartier des Grafikchipspezialisten mit zwei G92-Karten im Gepäck zurückgekehrt sind, war es uns leider nicht möglich, wie sonst üblich pünktlich zum Launch unseren Lesern einen entsprechenden Artikel anzubieten.
Ist der 3D-Beschleuniger wirklich ein Preis-Leistungs-Champion, wie man bisher vermutete? Und was bringt die überarbeitete G92-GPU für Vorteile gegenüber dem erfolgreichen G80-Vorgänger? Auf den folgenden Seiten werden wir diese und noch weitere Fragen beantworten. Wir wünschen viel Spaß beim Lesen.
Bevor wir uns mit der G92-GPU und ihrer Architektur im Detail beschäftigen, möchten wir mit den obligatorischen Spezifikationen des neuen Chips starten.
| Radeon HD 2900 XT | GeForce 8800 GTX | GeForce 8800 GT | GeForce 8800 GTS (320MB) | |
| Logo |
|
|
|
|
| Chip | R600 | G80 | G92 | G80 |
| Transistoren | ca. 700 Mio. | ca. 681 Mio. | ca. 754 Mio. | ca. 681 Mio. |
| Fertigung | 80 nm | 90 nm | 65 nm | 90 nm |
| Chiptakt | 742 MHz | 575 MHz | 600 MHz | 500 MHz |
| Shadertakt | 742 MHz | 1350 MHz | 1512 MHz | 1200 MHz |
| Pixel-Pipelines | X | X | X | X |
| Shader-Einheiten (MADD) | 64 (5D) | 128 (1D) | 112 (1D) | 96 (1D) |
| FLOPs (MADD/ADD) | 475 GFLOPs | 518 GFLOPs* | 508 GFLOPs* | 346 GFLOPs* |
| ROPs | 16 | 24 | 16 | 20 |
| Pixelfüllrate | 11872 MPix/s | 13800 MPix/s | 9600 MPix/s | 10000 MPix/s |
| TMUs | 16 | 64 | 56 | 48 |
| TAUs | 32 | 32 | 56 | 24 |
| Texelfüllrate | 11872 MTex/s | 36800 MTex/s | 33600 MTex/s | 24000 MTex/s |
| Vertex-Shader | X | X | X | X |
| Unified-Shader in Hardware | √ | √ | √ | √ |
| Pixelshader | SM 4 | SM 4 | SM 4 | SM 4 |
| Vertexshader | SM 4 | SM 4 | SM 4 | SM 4 |
| Geometryshader | √ | √ | √ | √ |
| Speichermenge | 512 GDDR3 | 768 GDDR3 | 512 GDDR3 | 640 GDDR3 (320 GDDR3) |
| Speichertakt | 828 MHz | 900 MHz | 900 MHz | 800 MHz |
| Speicherinterface | 512 Bit | 384 Bit | 256 Bit | 320 Bit |
| Speicherbandbreite | 105984 MB/s | 86400 MB/s | 57600 MB/s | 64000 MB/s |
*Die von uns angegebenen GFLOP-Zahlen der G80-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.
Mit der Einführung der G80-Chiparchitektur im November 2006 ist Nvidia ohne Zweifel ein großer Wurf gelungen. Denn wirkliche Schwachstellen scheint die GPU nicht zu haben. Sie ist schnell, bietet moderne Features, eine gute Bildqualität, eine ansprechende Wiedergabe von HD-Videos und eine gute Skalierbarkeit, mit der die Kalifornier problemlos diverse Preissegmente bedienen können. So wundert es wohl kaum, dass Nvidia bei dem Refresh-Chip G92, der erstmals auf der GeForce 8800 GT eingesetzt wird, nur marginale Änderungen vorgenommen hat – eine Notwendigkeit dazu bestand schlicht und ergreifend nicht (und wäre für einen Refresh-Chip zudem auch arg ungewöhnlich).
Der G92 wird im modernen 65-nm-Verfahren bei TSMC gefertigt und beherbergt satte 754 Millionen Transistoren. Er ist demzufolge die komplexeste GPU, die jemals produziert worden ist. Umso erstaunlicher, dass der G92 nicht so viele Ausführungseinheiten wie der altgediente G80 besitzt. Auf dem G92 sind lediglich sieben und nicht acht dem G80 sehr ähnliche Shadercluster verbaut, weswegen die GPU auf insgesamt 112 Shadereinheiten zurückgreifen kann. Im Gegensatz zum R600 von ATi sind die ALUs auf dem G92 keine Vektorprozessoren im eigentlichen Sinne mehr, sondern voneinander unabhängige Skalareinheiten (1D), die pro Takt eine Komponente (entweder Rot, Grün, Blau oder den Alphawert) bearbeiten können.
Das Direct3D-10-Rechenwerk (Direct3D 10.1 wird nicht unterstützt) ist nach dem Unified-Shader-Prinzip aufgebaut, weshalb es keine getrennten Pixel-, Vertex- und Geometry-Einheiten mehr gibt. Stattdessen kann jede ALU alle Berechnungen ausführen. Jede Shadereinheit ist in der Lage, pro Takt eine MADD- (Multiply-ADD) sowie eine MUL-Operation (Multiplikation) durchzuführen. Während MADD durchgängig für das so genannte „General Shading“ benutzt werden kann (sprich für sämtliche anstehende Shaderoperationen), sieht dies bei MUL anders aus. MUL ist zusätzlich als Special Function Unit (SFU), Perspektivenkorrektur oder als Attributinterpolator tätig und kann nur selten für General Shading verwendet werden. Dementsprechend fällt die reale Shaderleistung (oft gemessen in GFLOPs) niedriger aus, als man anhand der nackten Zahlen (wenn man das MUL miteinbezieht) vermuten könnte.
Die 112 Shadereinheiten agieren auch auf dem G92 nicht in derselben Taktdomäne wie die restlichen Chipkomponenten. So haben die ALUs wie beim G80 eine eigene Taktdomäne spendiert bekommen, die mit einer extrem hohen Frequenz angesteuert wird. Bei der GeForce 8800 GT liegt diese bei 1512 MHz. Erreicht wird diese Takterhöhung von Nvidia, in dem man bei der Designphase die entsprechenden Transistoren quasi „per Hand“ optimiert und für einen solchen Taktbereich auslegt.
Modifiziert gegenüber dem G80 hat Nvidia die Textureinheiten beim G92, die nun identisch zu denen im G84 sowie im G86 sind. Beim G80 hatte Nvidia einen einfachen, aber effektiven Trick angewandt, um Transistoren sparen zu können. So verdoppelte man schlicht und ergreifend die Anzahl der Filter- im Gegensatz zu den Adressierungseinheiten, womit man eine extrem schnelle Texturfilterung möglich machte (entweder einen trilinear oder einen bilinear anisotrop gefilterten Pixel innerhalb eines Taktes). Beim G92 hat man weniger auf den Die-Platz geachtet und diesen Nachteil (der je nach Sichtweise ein Vorteil sein kann) ausgebessert. So kann der G92 nicht nur 56 Texel pro Takt filtern, sondern sie auch adressieren.
Unangetastet hat man dagegen den Aufbau der Raster Operation Processors (ROPs) gelassen. Einzig die Anzahl hat man auf dem G92 variiert. Während auf dem G80 sechs ROP-Partitionen mit jeweils vier ROPs verbaut sind, sind auf dem G92 nur noch vier (also insgesamt 16 ROPs) vorhanden. Eine dieser Partitionen kann insgesamt vier Pixel mit Farb- sowie Z-Werten (Tiefeninformationen) pro Takt fertigstellen. Wie ab der GeForce-FX-Serie gewohnt, bieten die GeForce-ROPs bei reinen Z-Berechnungen die Möglichkeit, die Rechenkraft um ein Vielfaches zu steigern. So lange einzig und allein Tiefeninformationen berechnet werden, können nicht 16, sondern 128 Samples pro Takt zur weiteren Nutzung bereitgestellt werden. Bei 4xMSAA bleiben noch 32 Samples pro Takt übrig. Die ROPs (sowie die TMUs) werden auf der GeForce 8800 GT mit 600 MHz angesteuert. Dies ist für die G92-Architektur durchaus als moderat zu bezeichnen, wie auch Nvidia zugibt. Genügend Spielraum bei den Taktraten nach oben scheint noch vorhanden.
Wer sich mit der G8x-Architektur auskennt, der weiß, dass durch die Deaktivierung einer ROP-Partition automatisch Einfluss auf den Memorycontroller genommen wird. Jede ROP-Partition ist direkt mit einem Framebuffer verbunden. Dieses Manko besteht auch beim G92 und ist ohne Zweifel sein mit Abstand größter Hemmschuh. Während beim G80 sechs 64 Bit breite Speicherkanäle existieren, sind es beim G92 – analog der Anzahl der ROPS – nur noch vier. Somit bietet der G92 dem Käufer ein lediglich 256 Bit breites Speicherinterface an, das in vier 64-Bit-Speicherkanäle aufgeteilt ist. Jeder Speicherkanal ist an zwei Speicherbausteine angeschlossen, die je nach Version des 3D-Beschleunigers (256-MB- oder 512-MB-Variante) 32 MB oder 64 MB groß sind.
Auf den ersten Blick nicht ersichtlich, hat Nvidia nach eigenen Angaben darüber hinaus einige interne Schaltungen im G92 optimiert. So soll der Scheduler (Zeitplaner) für die Shadereinheiten verbessert worden sein, was für eine effektivere Auslastung der ALUs sorgen soll. Darüber hinaus soll die Effizienz der GPU in Verbindung mit Anti-Aliasing sowie einer hohen Auflösung verbessert worden sein: Der Performanceverlust soll geringer ausfallen. Das SLI-Anti-Aliasing wurde zusätzlich optimiert, was in einer besseren Performance resultieren soll. Verzichten müssen die G92-Käufer weiterhin auf „Double Precision“ (64- anstatt 32-Bit-Genauigkeit), das bei GPGPU-Programmen eine wichtige Rolle spielt. Double Precision soll erst in der nächsten GPU-Generation nach dem aktuellen IEEE-754-Standard unterstützt werden.
Der separate „NVIO“ (Nvidia Input Output), der für die Bildschirmausgabe sowie die SLI-Steuerung auf einer G80-Karte zuständig ist, entfällt bei der GeForce 8800 GT und wandert wieder in die GPU selber. Diese wurde darüber hinaus um den von der GeForce 8600 und der GeForce 8400 bekannten „Video Processor 2“ erweitert, weswegen man den G92 als „PureVideo HD“-fähig bezeichnet. Somit kann die GPU der CPU die Mehrarbeit bei MPEG2- sowie H.264-HD-Filmen abnehmen, weswegen es selbst auf schwächeren CPUs kein Problem darstellt, einen HD-Film anzuschauen. VC-1 wird dagegen weiterhin nur teilweise beschleunigt, da laut Nvidia der Decodierungsprozess für einen Prozessor einfacher zu erledigen ist als der von H.264-Material. Dies trifft zwar durchaus zu, trotzdem wünschen wir uns in Zukunft eine volle VC-1-Beschleunigung. Denn derart anspruchslos für eine CPU sind entsprechende Filme wahrlich nicht.
Eine weitere nennenswerte Neuerung beim G92 ist die Kompatibilität zum PCIe-2.0-Standard. Bisherige Grafikkarten waren PCIe-1.1-kompatibel und konnten in jede Richtung mit je acht Gigabyte pro Sekunde mit dem PCIe-Bus kommunizieren. PCIe 2.0 (oder auch PCIe Gen2 genannt) verdoppelt nun die Bandbreite auf 16 GB pro Kanal – AGP 4x gegen AGP 8x lässt grüßen. Selbst Nvidia gibt jedoch an, dass Spiele und sogar 3-Way-SLI in naher Zukunft nur bedingt bis eher gar nicht von der höheren Bandbreite profitieren werden. Nvidia sieht PCIe 2.0 aber als einen großen Schritt bei GPGPU-Anwendungen (Cuda), die je nach Programmierung einen starken Geschwindigkeitsschub von PCIe 2.0 erfahren sollen. Entgegen diverser Gerüchte wurde beim neuen Standard der maximale Stromverbrauch pro PCIe-Slot nicht verändert. Dieser liegt bei einem PCIe-x16-Slot immer noch bei 75 Watt.
Zusammengefasst gibt Nvidia die neuen Features und Überarbeitungen als Grund für die höhere Transistorenanzahl des G92 gegenüber dem G80 an (754 Millionen zu 681 Millionen Transistoren). Namentlich die Verwendung vom VP2, die modifizierten Textureinheiten, PCIe Gen2 sowie die Integration des NVIO in die GPU. Doch überkompensieren diese Änderungen tatsächlich derart drastisch den theoretischen Rückgang der Transistorenanzahl durch Entnahme eines Shader-Clusters? Wir spekulieren an dieser Stelle einmal und behaupten, dass der G92 nicht nur sieben Shadercluster und vier ROP-Partitionen, sondern wie der G80 acht Shadercluster und sechs ROP-Partitionen besitzt. Denn uns kommt die Anzahl der Transistoren trotz der Verbesserungen des G92 zu hoch vor (NVIO sollte zum Beispiel nur eine kleine einstellige Millionenzahl kosten). Ob der G92 wirklich mehr Einheiten besitzt als die GeForce 8800 GT offenbart, wird aber nur die Zeit zeigen können.
Mit der GeForce 8800 GT möchte Nvidia wiederholen, was ihnen zuletzt mit der GeForce 4 TI 4200 und ATi mit der Radeon X1950 Pro gelungen ist: Eine kostengünstig zu fertigende und somit preiswerte Grafikkarte, die geschwindigkeitsmäßig nur leicht hinter den High-End-Modellen zurück liegt und sich weit von den Mid-Range-Karten absetzen kann. Dass dies längst nicht bei jeder GPU-Generation möglich ist, sollte klar sein, denn nicht nur eine wirtschaftlich lohnenswerte GPU ist Voraussetzung für dieses Vorhaben, darüber hinaus muss der Rechenkern auch schnell genug sein. Nvidia gibt an, dass solch eine Grafikkarte etwa alle vier bis fünf Jahre möglich ist – und nun soll es wieder soweit sein.
Die offizielle Preisempfehlung der GeForce 8800 GT für Deutschland beginnt bei 229 Euro, wobei einige Shops die GeForce 8800 GT bereits für etwa 220 Euro gelistet haben. Lieferbar ist die Karte für diesen Preis aber nicht. Der durchschnittliche Kostenpunkt beläuft sich derzeit auf etwa 240 Euro, eine Lieferbarkeit ist aktuell aber erst bei 260 Euro und mehr gewährleistet. Da sich sehr viele Interessenten auf die GeForce 8800 GT stürzen, haben Nvidia und die Boardpartner eine Woche nach dem Launch Probleme, ausreichende Mengen zu fertigen, und lassen sich den Ansturm auf die Karte gerne mit ein paar Euros extra vergüten.
Das – wie sollte es anders sein – grüne PCB misst auf der GeForce 8800 GT eine Länge von 23 cm und entspricht somit der Größe einer High-End-Grafikkarte der letzten Generation. Die Grafikkarte sollte in sämtliche aktuell im Handel befindlichen Standardgehäuse ohne größere Schwierigkeiten hineinpassen. Das PCB ist sowohl auf der Vorder- als auch auf der Rückseite mit diversen Bauteilen bestückt; Freiräume gibt es nur wenige. Das Single-Slot-Kühlsystem umfasst die gesamte Vorderseite der GeForce 8800 GT. Einzig einige Lüftungsschlitze gewährleisten einen knappen Einblick auf den 3D-Beschleuniger. Die maximale Stromaufnahme der Grafikkarte liegt laut Nvidia bei 105 Watt, weswegen ein PCIe-Stromstecker vorhanden ist. Dieser ist auch auf einem PCIe-2.0-Mainboard von Nöten, da der PCIe-Slot immer noch auf 75 Watt limitiert ist.
Bei den Kühlermaterialien setzt Nvidia größtenteils auf kostengünstiges Aluminium. Mehrere Alulamellen sollen den Wärmetransport verbessern. Direkt auf der GPU sitzt ein eingelassener Kupferkühlblock, der wiederum durch eine Heatpipe mit dem Aluminiumkühler verbunden ist. Zu unserer Überraschung setzt Nvidia bei der GeForce 8800 GT auf einen kleinen 55-mm-Radiallüfter, der im hinteren Drittel des Kühlsystems montiert ist. Die Funktionsweise ist schnell erklärt: Der Radiallüfter saugt die kühle Luft aus dem Tower durch die Lüftungsschlitze an, leitet diese über die GPU und bläst die aufgewärmte Luft wieder aus den vorderen Lüftungsschlitzen hinaus. Der Speicher ist in dem Kühlsystem mit einbezogen. Unter Windows taktet sich die GeForce 8800 GT wie sämtliche Vorgängerprodukte mit der G8x-GPU nicht herunter, sondern agiert weiterhin mit den maximalen Taktraten. Schade. Für die Lüftersteuerung muss man Nvidia hingegen ein großes Lob aussprechen. Die Grafikkarte fällt zu keiner Zeit unangenehm auf und bleibt selbst nach einer längeren Lastphase leise. Mehr dazu im Abschnitt Lautstärke.
Der 512 MB große VRAM wird von Qimonda mit einer Zugriffszeit von 1,0 ns produziert. Die acht Speicherchips sind allesamt auf der Vorderseite des PCBs montiert. Auf dem Slotblech montiert Nvidia zwei Dual-Link-fähige DVI-Ausgänge, die HDCP-kompatibel sind und den Kopierschutz auch in hohen Auflösungen wie 2560x1600 anwenden können. Eine Möglichkeit, um wie bei der Radeon-HD-2000-Serie von ATi den Ton über einen speziellen DVI-zu-HDMI-Adapter wiederzugeben, sucht man auf der GeForce 8800 GT leider vergebens. Darüber hinaus kann man einen handelsüblichen Fernseher per HDTV-Ausgang mit der Grafikkarte verbinden.
Testsystem:
Folgende Benchmarks kamen während unseres Tests zum Einsatz:
Alle Benchmarks werden mit maximalen Details ausgeführt, damit die Grafikkarte möglichst hoch belastet wird. Als Einstellungen haben wir uns dabei für 1280x1024 und 1600x1200 (sowie 2560x1600 bei Grafikkarten mit 512 MB oder mehr und einer entsprechenden Leistung) entschieden. Damit zollen wir den modernen High-End-Beschleuniger Tribut, die durch ihre Rechenkraft niedrigere Auflösungen als 1280x1024 CPU-limitiert werden lassen. Neben den reinen Auflösungen lassen wir den Benchmarkparcours auch mit 4-fachem (und falls möglich acht-fachem) Anti-Aliasing sowie 16-fachen anisotropen Filter durchlaufen. TSSAA (Nvidia) oder AAA (ATi) zur Glättung von Alpha-Test-Texturen nutzen wir aufgrund von Kompatibilitätsproblemen nicht mehr in unserem Benchmarkparcours.
Achtung: Moderne SLI- und CrossFire-Systeme bieten dem Kunden eine dermaßen gewaltige Rechenleistung, dass selbst der schnellste Prozessor damit hoffnungslos überfordert ist und demzufolge beinahe alle Spiele CPU-limitiert sind, was bei immer schneller werdenden 3D-Beschleunigern ein großes Problem darstellt. Aus diesem Grund lassen wir Testläufe ohne Anti-Aliasing sowie dem anisotropen Filter komplett weg, da diese Qualitätseinstellung für zwei Grafikkarten keine Herausforderung mehr ist. Somit werden die Tests ausschließlich mit 4xAA (beziehungsweise 8xAA) sowie 16xAF in 1280x1024, 1600x1200 und 2560x1600 durchgeführt.
Nach sorgfältiger Überlegung und mehrfacher Analyse selbst aufgenommener Spielesequenzen sind wir zu dem Schluss gekommen, im ForceWare-Treiber für Nvidia-Karten die Qualitätseinstellungen auf High Quality anzuheben, da man nur mit diesem Setting das Texturflimmern effektiv bekämpfen kann – dies trifft aber nur auf die G7x-Generation zu, die G8x-GPUs werden mit den Standardeinstellungen des Treibers getestet, weil die Bildqualität stark zugenommen hat. Zudem ist dieser Modus vergleichbar mit der Einstellung „Catalyst A.I. Standard“ auf den ATi-Pendants, wodurch bei der Bildqualität größtenteils ein Gleichstand erreicht wird.
Treibereinstellungen: Nvidia-Grafikkarten (G7x)
Treibereinstellungen: Nvidia-Grafikkarten (G8x, G9x)
Treibereinstellungen: ATi-Grafikkarten (R(V)5x0)
Treibereinstellungen: ATi-Grafikkarten (R(V)6x0)
Fillrate Tester
VillageMark
Villagemark v2.1
Angaben in Bildern pro Sekunde (FPS)
|
Fablemark
Fablemark v1.0
Angaben in Bildern pro Sekunde (FPS)
|
ShaderMark
D3DRighmark Beta 4
Die allseits bekannte Benchmarkserie von Futuremark ist mittlerweile in der Version 2006 erschienen und hört dementsprechend auf die Bezeichnung „3DMark06“. Von den sechs Testszenen messen vier Sequenzen die Performance der Grafikkarte und zeigen eine Grafikpracht, die ihres gleichen sucht. Um jene zu erreichen setzen die Finnen auf modernste 3D-Technologie, weswegen nicht nur massiv das Shader-Model 3.0 verwendet wird, auch extrem aufwendige Texturen, spektakuläre Partikeleffekte, komplexe Schattenberechnungen und als weiteres Highlight „High Dynamic Range Rendering“ – kurz HDRR – werden eingesetzt. Dabei setzt Futuremark auf FP16-HDR, das die derzeit Best mögliche Bildqualität liefert, aber auch aufwendig zu berechnen ist. Somit können Grafikkarten ohne FP16-Blending-Einheiten, unter anderem die X8x0-Serie von ATi, zwei Testszenen nicht ausführen, weswegen die Punktzahl dieser GPUs generell niedrig ausfällt. Darüber hinaus können nur Grafikkarten, die MSAA auf ein FP16-Rendertarget ausführen können, die HDRR-Sequenzen mit Anti-Aliasing berechnen. Grafikkarten ohne diese Fähigkeit erzeugen bei Einsatz von Kantenglättung keine Punktzahl und werden deswegen nicht berücksichtigt. Weitere Details zu diesem Programm gibt es in einem unserer ausführlichen Artikel. [22]
3DMark06 – 1280x1024
Angaben in Punkten
|
3DMark06 – 1600x1200
Angaben in Punkten
|
3DMark06 – 2560x1600
|