Man staunte nicht schlecht, als Nvidia im November des Jahres 2006 die G80-GPU in Form der GeForce 8800 GTX sowie der GeForce 8800 GTS [1] einführte. Und das zu Recht. Denn die Grafikkarte war zum damaligen Zeitpunkt nicht nur die mit Abstand schnellste GPU auf dem Markt, sondern konnte zudem noch bezüglich der Bildqualität neue Maßstäbe setzen und kam mit einem Featureset daher, das für das folgende Jahr absolut ausreichend war. „Das GeForce-Modell ist zweifellos die schnellste Grafikkarte auf dem Markt, bietet die beste Bildqualität und ist mit der Unterstützung von Direct3D 10 sowie der Möglichkeit, Effektphysik schnell zu berechnen, bestens für die Zukunft geeignet“ lautete der Schlusssatz in unserem Launch-Review und wir vergaben für die G80-Architektur gar einen Award – eine Premiere für eine Launch-Karte!
Etwa anderthalb Jahre später hinterlässt die GeForce 8800 GTX weiterhin ihre Spuren. Der 3D-Beschleuniger gehört immer noch zu den besten Single-GPU-Karten und kann die meisten aktuellen Spiele in höchster Qualität darstellen. Es gibt mit der GeForce 8800 Ultra – die ebenfalls mit dem G80 ausgestattet ist – nur ein einziges Produkt, was die GeForce 8800 GTX übertrumpfen kann. Mit solch einem Erfolg hatten wir damals nicht annähernd gerechnet. Es ist also kein Wunder, dass der Grafikchipspezialist Nvidia mit ihrer Next-Gen-GPU nicht das Rad neu erfinden möchte, sondern stattdessen auf Altbewährtes setzt. GT200 ist der Name des Refresh-Chips, der die schwere Aufgabe haben wird, in die Fußstapfen des Vorgängers zu treten.
Mit dem GT200 führt Nvidia ein neues Namensschema für die Grafikkarten ein, damit der Kunde besser zwischen den Leistungsstufen der 3D-Beschleuniger unterscheiden kann. Die Spitzenmodelle gehören der GeForce-GTX-200-Serie an und betiteln sich exakt mit GeForce GTX 280 beziehungsweise GeForce GTX 260. Während die GeForce GTX 280 ab dem heutigen Tag im Handel erhältlich sein sollte, muss man sich für die abgespeckte GeForce GTX 260 noch etwa eine Woche gedulden.
Nvidia konnte uns freundlicherweise ein Exemplar der GeForce GTX 280 für einen Test zur Verfügung stellen, das wir ausführlich untersuchen werden. Dabei achten wir nicht nur auf die Performance, sondern ebenso auf die Bildqualität sowie die Effizienzverbesserungen der Architektur. Ein weiteres Sample des Flaggschiffs erreichte uns von Zotac, das jedoch etwas spät eingetroffen ist. Deswegen beschränken wir uns bei der Karte auf die SLI-Benchmarks. Ist die GeForce GTX 280 mit der GT200-GPU ein würdiger Nachfolger für die GeForce 8800 GTX und GeForce 8800 Ultra? Diese Frage werden wir auf den folgenden Seiten klären.
Bevor wir uns mit der GT200-GPU und ihrer Architektur im Detail beschäftigen, möchten wir mit den obligatorischen Spezifikationen des neuen Chips starten.
| Radeon HD 3870 X2 | GeForce 8800 Ultra | GeForce 9800 GTX | GeForce GTX 280 | GeForce GTX 260 | |
| Logo |
|
|
|
|
|
| Chip | R680 (2x RV670) | G80 | G92 | GT200 | GT200 |
| Transistoren | ca. 2x 666 Mio. | ca. 681 Mio. | ca. 754 Mio. | ca. 1,4 Mrd. | ca. 1,4 Mrd. |
| Fertigung | 55 nm | 90 nm | 65 nm | 65 nm | 65 nm |
| Chiptakt | 825MHz | 612 MHz | 675 MHz | 602 MHz | 576 MHz |
| Shadertakt | 825MHz | 1.512 MHz | 1.675 MHz | 1.296 MHz | 1.242 MHz |
| Shader-Einheiten (MADD) | 2x 64 (5D) | 128 (1D) | 128 (1D) | 240 (1D) | 192 (1D) |
| FLOPs (MADD/ADD) | 2x 528 GFLOPs | 581 GFLOPs* | 643 GFLOP/s* | 933 GFLOP/s | 715 GFLOPs |
| ROPs | 2x 16 | 24 | 16 | 32 | 28 |
| Pixelfüllrate | 2x 13200 MPix/s | 14688 MPix/s | 10800 MPix/s | 19264 Mpix/s | 16128 MPix/s |
| TMUs | 2x 16 | 64 | 64 | 80 | 64 |
| TAUs | 2x 32 | 32 | 64 | 80 | 64 |
| Texelfüllrate | 2x 13200 MTex/s | 39168 MTex/s | 43200 MTex/s | 48160 MTex/s | 36864 MTex/s |
| Shader-Model | SM 4.1 | SM 4 | SM 4 | SM 4 | SM 4 |
| Hybrid-CF/-SLI | X | X | √ | √ | √ |
| effektive Windows Stromsparfunktion | √ | X | X | √ | √ |
| Speichermenge | 2x 512 MB GDDR3 | 768 MB GDDR3 | 512 MB GDDR3 | 1.024 MB GDDR3 | 896 MB GDDR3 |
| Speichertakt | 900 MHz | 1.080 MHz | 1.100 MHz | 1.107 MHz | 999 MHz |
| Speicherinterface | 2x 256 Bit | 384 Bit | 256 Bit | 512 Bit | 448 Bit |
| Speicherbandbreite | 2x 57600 MB/s | 103680 MB/s | 70400 MB/s | 141696 MB/s | 111888 MB/s |
*Die von uns angegebenen GFLOP-Zahlen der G80/G92-Grafikkarten entsprechen dem theoretisch maximalen Output, wenn alle ALUs auf die gesamte Kapazität der MADD- und MUL-Einheiten zurückgreifen können. Dies ist auf einem G80 allerdings praktisch nie der Fall. Während das MADD komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Mit dem ForceWare 158.19 (sowie dessen Windows-Vista-Ableger) kann das zweite MUL zwar auch für General Shading verwendet werden, anscheinend aber nicht vollständig, da weiterhin die „Sonderfunktionen“ ausgeführt werden müssen. Deswegen liegen die reellen GFLOP-Zahlen unter den theoretisch maximalen.
Allgemeines:
Auch wenn es zuerst den Anschein macht, ist die GT200-GPU kein komplett neu entwickelter Chip, sondern der eigentliche Refresh der G80-GPU, der deutlich überarbeitet und vor allem im Bereich des GPU-Computings erweitert worden ist. Den G92 sehen wir nur bedingt als Refresh-Chip an, da es abseits des kleineren Fertigungsprozesses nur geringe Veränderungen am Chip gegeben hat. Somit bietet der GT200 zu einem Großteil die Vor- und die Nachteile der G80-Architektur, was aber sicherlich alles andere als schlecht ist, da eine entsprechend ausgestattete Grafikkarte wie die GeForce 8800 GTX selbst nach mehr als anderthalb Jahren immer noch nicht zum alten Eisen gehört.
Gleichzeitig hat man aber ebenso einen Nachteil geerbt, und zwar die fehlende Unterstützung von Direct3D 10.1. Stattdessen bleibt man bei der Direct3D-10-API stehen, was im Moment aufgrund fehlender Software kein Nachteil ist, was sich aber durchaus in einigen Monaten ändern kann. Assassin's Creed [2] hat in der Ursprungsversion schon einen kleinen Ausblick darauf gegeben, was man mit Direct3D 10.1 für Vorteile gegenüber der Grund-API erreichen kann.
Die GT200-GPU wird erneut bei TSMC gefertigt und weiterhin im altbewährten 65-nm-Prozess hergestellt. Mit einem 55-nm-Chip würde man Wafer-Fläche (und damit Geld) sparen, jedoch kann es dann schnell zu Fertigungsproblemen kommen, da eine größtenteils neue Architektur auf einem noch unbekannten Fertigungsprozess erfahrungsgemäß kritisch ist. Die Zahl der Transistoren beläuft sich auf satte 1,4 Milliarden, womit man die Schaltkreise gegenüber dem G80 mehr als verdoppelt hat – ein Großteil davon wurde in die Verbesserung der GPU-Computing-Fähigkeiten gesteckt.
Der GT200 wird auf der GeForce-GTX-200-Serie eingesetzt, die aus zwei verschiedenen Modellen besteht: die GeForce GTX 260 sowie die GeForce GTX 280. Beide unterscheiden sich nicht nur in den Taktraten, sondern ebenfalls in der Anzahl der Ausführungseinheiten, die auf der GeForce GTX 260 teilweise deaktiviert, physikalisch aber noch vorhanden sind. Die Eckdaten der GT200-GPU hören sich beeindruckend an: 240 Shader-, 80 Textureinheiten, 32 ROPs, ein 512 Bit breites Speicherinterface und einen Gigabyte großen Framebuffer. Doch was für Veränderungen hat es in der internen Organisation gegeben?
Der GT200 bietet erstmals zwei verschiedene Betrachtungsweisen der Architektur an, je nachdem was auf der Grafikkarte ausgeführt wird. Nvidia spricht deswegen gerne von zwei verschiedenen Betriebsmodi, in denen dieselben Einheiten auf teils unterschiedliche Namen hören. So gibt es den „Graphics Processing Mode“ (GPM), der in einer herkömmlichen 3D-Anwendung zum Einsatz kommt, sowie einen „Parallel Compute Mode“ (PCM) für GPU-Computing-Berechnungen mittels CUDA.
Streaming Multiprocessors (SM):
Der GT200 verfügt über 240 skalare Shadereinheiten, die Nvidia auf den Namen Streaming Processors (SP) getauft hat und die pro Takt einen Farbwert (Rot, Grün, Blau oder Alphawert) berechnen können. Dabei hat man aber nicht nur Stur die Anzahl der Einheiten beziehungsweise der Shadercluster erhöht, sondern zudem die interne Organisation etwas verändert. Ein Shadercluster auf dem G80 besteht aus insgesamt 16 einzelnen ALUs, die wiederum in zwei Achter-Blöcke aufgeteilt sind. Der GT200 baut nun immer noch auf dasselbe Konzept auf, wobei die Kalifornier aber zehn Shadercluster (TPC, Texture Processing Cluster im GPM; Thread Processing Cluster im PCM) verbauen.
Bei diesen wurde die Anzahl der „Streaming Multiprocessors (SM)“ von zwei auf drei erweitert – es gibt also nicht mehr zwei sondern drei ALU-Blöcke –, wobei die Menge der „Stream Processors (SP)“, sprich der einzelnen ALUs, gleich geblieben ist. Somit kommt man nun auf 240 Shadereinheiten, da jeder Shadercluster auf 24 einzelne ALUs zurückgreifen kann und es zehn Cluster gibt. Jeder Streaming Multiprocessor verwaltet insgesamt acht ALUs, die in zwei Vierer-Blöcke aufgeteilt sind.
Eine Neuerung im GT200 ist ein 16k großer Local-Memory-Speicher, der genau zwischen den vier ALUs platziert ist und auf die die Recheneinheiten zugreifen können. Somit kann eine ALU die fertig berechneten Daten in dem Zwischenspeicher ablegen, auf die eine andere ALU dann zu einem späteren Zeitpunkt zurückgreifen kann und der GT200 so den langsameren Umweg über den externen Speicher spart. Vor allem bei GPU-Computing und bei der Physikbeschleunigung soll der Zwischenspeicher einen großen Performanceschub bringen.
Eine reine Erhöhung der Recheneinheiten nutzt aber nichts, wenn man diese nicht auslasten kann. Dazu hat Nvidia den Thread Scheduler verbessert, der die einzelnen Streaming Processors mit den Rohdaten füttert. Jeder Streaming Multiprocessor auf dem GT200 kann dazu Threads in Gruppen von 32 parallelen Threads („Warps“) erzeugen, verwalten und ausführen. Der G80 war dagegen auf 24 Warps beschränkt, womit die Zahl der ausführbaren Threads auf dem GT200 von 12.228 auf 30.720 gestiegen ist.
Die Kommunikation zwischen den einzelnen Shadercluster erfolgt mittels MIMD (Multiple Instruction, Multiple Data), es können also mehrere Berechnungen auf mehrere Daten angewendet werden. Unter den einzelnen Streaming Multiprocessors herrscht dagegen SIMT (Single Instruction, Multiple Threads), was stark an SIMD angelehnt ist (Single Instruction, Multiple Data). Gleichzeitig legt dies ein ganz interessantes Detail an die Oberfläche.
Die ALUs vom GT200 sind, wie bereits erwähnt, skalare Einheiten. Das heißt, dass jede ALU pro Rechentakt eine einzelne Komponente (Rot, Grün, Blau oder Alphawert) berechnen kann. Jeder einzelne Shadercluster kann auf dem GT200 pro Taktzyklus nun mit unterschiedlichen Komponenten versorgt werden, je nach dem welche gerade am dringendsten benötigt wird. Die Shadercluster an sich sind also völlig flexibel. Etwas starrer scheinen dagegen die Streaming Multiprocessors zu sein, die aufgrund von SIMT pro Takt auf sämtliche ALUs also nur ein und dieselbe Komponente berechnen können. Es ist somit nicht möglich, dass innerhalb eines Shadercluster in einem Takt verschiedene Komponenten berechnet werden können. Nach einem Takt können die skalaren ALUs dann aber wieder einen anderen Farbwert berechnen. Nichtsdestotrotz sollen die SM aufgrund des effizienten Thread Schedulings beinahe durch die Bank voll ausgelastet sein.
Jede einzelne ALU kann auf dem G80 pro Takt ein MADD (Multiplikation sowie Addition) sowie ein MUL (Multiplikation) berechnen. Das hat sich auf dem GT200 nicht geändert, jedoch konnte man die Auslastung massiv steigern. Während das MADD auf dem G80 komplett für „General Shading“ genutzt werden kann, hat das zweite MUL meistens andere Aufgaben und kümmert sich um die Perspektivenkorrektur oder arbeitet als Attributinterpolator oder Special-Function-Unit (SFU). Die MUL-Leistung für das General Shading beträgt auf dem G80 geringe 15 Prozent, was sich nur in seltenen Fällen bemerkbar macht.
Der GT200 kann dagegen das MUL in etwa zu 93 Prozent bis 94 Prozent für General Shading benutzen, weswegen man die theoretischen GFLOPs-Angaben zwischen den beiden Architekturen nur bedingt miteinander vergleichen kann. Wie der GT200 nun die SFU-Aufgaben erledigt, ist aber noch unklar. Logischerweise entfallen die Aufgaben auf einem GT200 nicht. Zusätzlich hat Nvidia die Registergröße pro Streaming Multiprocessor auf einem GT200 verdoppelt. Bei langen sowie komplexen Shaderprogrammen soll es die GPU so vermeiden können, die Daten auf den Speicher zu „swappen“.
Zu guter Letzt wurde nach eigenen Angaben die Geometry-Shader- sowie die Stream-Out-Performance stark erhöht.
Textureinheiten:
Die Textureinheiten auf dem GT200 bleiben ebenso wenig unangetastet, wobei man primär aber nur die Anzahl der Einheiten erhöht hat. Der alte G80 setzt insgesamt auf 64 Texture Mapping Units (TMU), die pro Takt 64 Pixel filtern und 32 Pixel adressieren können. Das 2:1-Verhältnis zwischen Filter- und Adressierungs-Einheiten hat den Vorteil, dass jede TMU pro Takt einen zwei-fachen bilinearen anisotrop gefilterten Pixel fertigstellen kann. Alternativ können 32 Acht-Bit-Integer- oder 32 16-Bit-Floating-Point Textur gefiltert werden. Auf dem G92 hat man das Verhältnis zwischen TAU und TFU dann wieder gleichgestellt, womit pro Takt 64 bilineare Acht-Bit-Integer oder 32 bilineare 16-Bit-FP-Texturen fertig gestellt werden können.
Der GT200 behält das Verhältnis des G92, baut die Textureinheiten aber auf 80 Stück aus, womit insgesamt 80 bilineare Pixel pro Takt adressiert sowie texturiert werden können (8 Bit Integer). Dementsprechend sind pro Takt 80 bilineare Texturen oder alternativ 40 bilineare FP16-Texturen möglich. Die Ankopplung der Textureinheiten an die Shadercluster hat Nvidia beim GT200 belassen. Somit existiert pro Shadercluster ein Texturcluster, der sich wiederum aus acht Textureinheiten zusammensetzt.
Nvidia hat darüber hinaus die Effizienz der TMUs erhöht, in dem man den Scheduler verbessert hat. So steigt die praktische Ausnutzung der theoretischen Leistung von 76,2 Prozent beim G92 auf 93,1 Prozent an.
Raster Operation Processor (ROP):
Auf dem GT200 hat man die sechs ROP-Partitions des G80 auf acht erweitert. Jede ROP-Partition besteht aus vier einzelnen ROPs, weswegen der GT200 dem Programmierer 32 ROPs zur Unterstützung bereit stellt. Die eigentlichen Fähigkeiten wie die Anti-Aliasing-Modi sind gleich geblieben. An dem Multi-Sampling-AA, Coverage-Sampling-AA sowie dem Transparency-AA hat sich auf dem GT200 also nichts getan. Blending-Operationen auf ein FP16- und FP32-Rendertarget sind weiterhin möglich, wobei durch die Bank auf jedes Format MSAA angewendet werden kann.
Eine dieser Partitionen kann insgesamt vier Pixel mir Farb- sowie Z-Werten (Tiefeninformationen für Sichtbarkeitsprüfungen) pro Takt fertigstellen. Wie ab der GeForce-FX-Serie gewohnt, beherrschen die GeForce-ROPs bei reinen Z-Berechnungen die Möglichkeit, die Rechenkraft um ein vielfaches zu steigern. So lange einzig Tiefeninformationen berechnet werden, können nicht 32, sondern 256 Samples pro Takt zur weiteren Nutzung bereit gestellt werden. Bei 4xMSAA bleiben noch 64 Samples pro Takt übrig, bei 8xMSAA dagegen 32 Samples.
Modifiziert hat man die ROPs auf dem GT200 beim „8-Bit unsigned Integer“-Format. Während der G80 in dem Fall pro Takt 24 Pixel pro Takt fertigstellen sowie Blending (wie zum Beispiel Alpha-Blending) auf 12 Pixel anwenden kann, hat man auf dem GT200 die Blending-Leistung verdoppelt, sodass nun pro Takt 32 Pixel ausgegeben und geblendet werden können.
Speicherinterface:
Das Speicherinterface war schon beim G80 an die ROP-Partitions angekoppelt, was sich auch beim GT200 nicht geändert hat. Da pro ROP-Partition in der G8x-Architektur ein 64 Bit breiter Speichercontroller angeschlossen ist, gibt es auf dem GT200 gleich acht 64-Bit-Controller, womit man auf ein Speicherinterface von 512 Bit kommt. Ein 64-Bit-Controller beherbergt zwei Speicherbausteine, womit insgesamt 16 Speicher-Module auf der GeForce GTX 280 nötig sind. Um auf einen Gigabyte großen VRAM zu kommen, muss jedes Modul eine Kapazität von 64 MB aufweisen.
Double Precision (DP):
Bei herkömmlichen Berechnungen reicht eine Rechenpräzision von 32-Bit eigentlich durchgängig aus, um zu dem gewünschten Ergebnis zu kommen. Anders sieht es dagegen bei GPGPU und GPU-Computing aus, wo es durchaus sein kann, dass für einige Aufgaben Single-Precision (32 Bit) nicht genügt und stattdessen mit Double Precision, also 64-Bit-Floating-Point, gerechnet werden muss.
Um das zu erreichen gibt es zwei Ansätze. Der einfache Ansatz ist, die ALUs „loopen“ zu lassen, also das man die 32-Bit-ALUs mehrmals an denselben Daten rechnen lässt, um Double Precision zu erreichen. Diese Methode kommt auf einer aktuellen ATi-GPU wie dem RV670 zum Einsatz, wobei der Chip dann vier Fünftel seiner Rechenleistung verliert. Anstatt 496 GFLOP/s erreicht eine Radeon HD 3870 bei Double Precision also nur noch etwas mehr als 99 GLFOP/s. Da bei GPGPU und GPU-Computing meistens jedoch mit Single-Precision und nur selten mit Double-Precision gerechnet werden muss, ist der Leistungsverlust zu verschmerzen. Zusätzlich ist es auf einer GPU möglich, im „Mixed Mode“ zu rechnen, also mit 32-Bit- und 64-Bit-Genauigkeit zur gleichen Zeit.
Den anderen und deutlich transistoraufwendigeren Weg geht Nvidia beim GT200. Die Kalifornier haben jeden Streaming Multiprocessor mit einer Double-Precision-MADD-Einheit ausgestattet. Der GT200 hat also 30 extra DP-MADD-ALUs, die nach der IEEE-754R-Spezifikation entwickelt worden sind. Die theoretische DP-Rechenleistung auf dem GT200 beträgt 90 GFLOP/s, womit man gar noch unter dem Wert eines RV670 liegt. Warum Nvidia deswegen kostenintensive DP-ALUs verbaut hat, ist uns unklar. Es ist aber gut möglich, dass die diskreten Einheiten zusätzliche Berechnungen innerhalb eines Taktes ausführen können, wofür die SP-ALUs auf dem RV670 noch weitere Loops benötigen.
Stromsparmechanismen:
Nvidia stattet den GT200 erstmals in der eigenen Firmengeschichte mit einem richtigen Stromsparmechanismus aus. Während der G8x sowie der G9x selbst unter Windows noch einen Großteil der Leistungsaufnahme benötigen, gibt es auf einem GT200 nun drei verschiedene „Strom-Modi“. Im Full-Performance-Mode stehen dem GT200 logischerweise sämtliche Kapazitäten zur Verfügung, weswegen die GeForce GTX 280 im schlimmsten Fall bis zu 236 Watt aus der Leitung zieht. Neu hinzugekommen ist ein „Blu-ray-DVD-Playback-Mode“, indem der GT200 nach eigenen Angaben nur noch 35 Watt benötigt. Im „Idle/2D-Modus“ soll die Leistungsaufnahme auf 25 Watt sinken.
Um das zu erreichen senkt der GT200 nicht nur massiv seine Taktraten sowie die Spannungen, darüber hinaus betreibt die GPU „Clock Gating“. Das bedeutet, dass der Rechenchip einzelne, nicht verwendete Blöcke abschalten kann, die somit keinen Strom mehr benötigen. Zwischen den verschiedenen Modi kann die GPU innerhalb von Sekundenbruchteile umschalten, weswegen es zu keinem Performanceverlust kommen soll. Überwacht wird die Aktivität der GPU von einem speziell dafür vorgesehenen „Auslastungsmonitor“, der je nach Bedarf den Modus wechseln kann.
Moderne Grafikkarten sollten nicht nur schnell sein, sie sollen auch ein exzellentes Bild liefern. Eine Möglichkeit, um dies zu erreichen, auch wenn der gelieferte Grafik-Content des Spieles nicht allzu gut ausfällt, ist die Aktivierung von Anti-Aliasing, welches die Polygonkanten glättet, und das Hinzuschalten des anisotropen Filters, der die Texturen auch in weiter Ferne noch scharf erscheinen lässt. Da ATi und Nvidia versuchen, in diesen Features den Konkurrenten zu übertreffen, erlebt man bei manch' neuer Chipgeneration eine positive Überraschung – wobei eine negative allerdings auch nicht ausgeschlossen werden kann –, da die Bildqualität sich verbessert hat. Aus diesem Grund gehört zu einem Grafikkarten-Review einer neuen Chipserie nicht nur das Testen der Geschwindigkeit, es sollte ebenfalls ein Blick auf die gelieferte Bildqualität geworfen werden.
Dabei werden wir beide Bildverbesserungsmechanismen nicht nur in der Praxis, sondern auch in der Theorie begutachten. So untersuchen wir die Qualität des anisotropen Filters mit dem oft benutzten Tool „AF-Tester“ sowie dem 3DMark05 (die entsprechenden Tools im 3DMark06 funktionieren mit aktuellen ATi- und Nvidia-Treibern leider nicht) und mit einer Spielszene aus Half-Life 2 (Texturfilterung) sowie Oblivion (Kantenglättung), wobei auch selbst erstellte Videos zur Kontrolle herangezogen werden. Auf den Ego-Shooter greifen wir auch bei den Untersuchungen des Anti-Aliasings zurück. Zudem werden wir die Sample-Positionen in dem Tool „FSAA-Viewer“ vergleichen. Zusätzlich kommt erneut der 3DMark05 zum Einsatz, der mit seinen Analysetools einige interessante Möglichkeiten bietet.
Während die G80-GPU diverse Verbesserungen beim Anti-Aliasing gegenüber der G7x-Generation aufweisen konnte, hat sich beim GT200 anscheinend nichts getan. Im FSAA-Viewer werden die Sampleposition bis hin zum acht-fachen Multi-Sampling-Anti-Aliasing exakt gleich angezeigt und selbst beim Coverage-Sampling-AA (CSAA) hat sich auf den ersten Blick nichts getan. Sämtliche Super-Sampling-Modi, die nicht nur Geometrie oder Alpha-Test-Texturen (Transparency-AA) bearbeiten, gibt es offiziell weiterhin nicht.
RV670
G92
GT200
Dasselbe Ergebnis zeigt sich sowohl im 3DMark05 als auch in Oblivion. Nvidia hat die Kantenglättung auf dem GT200 exakt gleich zum G92 gelassen und keine weiteren Verbesserungen vorgenommen. In der Praxis funktionieren sämtliche AA-Stufen, inklusive dem CSAA sowie dem TMSAA/TSSAA, einwandfrei.
Somit hat sich die Position zwischen ATi und Nvidia bezüglich des Anti-Aliasings nicht geändert. Bis zu dem herkömmlichen acht-fachem Anti-Aliasing (8xQAA, MSAA) liegen beide Konkurrenten gleich auf. Je nach Winkel sieht mal die eine und mal die andere Implementierung besser aus, einen Vorteil kann sich aber keiner der beiden Kontrahenten erkämpfen. Mit dem Coverage-Sampling-Anti-Aliasing bietet Nvidia eine interessante Methode an, die Bildqualität nach oben zu schrauben ohne allzu groß an Geschwindigkeit einzubüßen. Allerdings hat das CSAA den Nachteil, dass die Kantenglättung in einigen Spielen beziehungsweise Szenen nicht funktioniert und der Effekt auf 4xAA- oder 8xQAA-Niveau hinab fällt.
RV670
G92
GT200
Zusätzlich wirken einige Kanten mit CSAA etwas ungleichmäßig geglättet, was in Bewegung manchmal unangenehm auffällt und einen inkonsistenten Eindruck hinterlässt. Der Effekt hängt aber stark von der Spielszene ab und kann variieren. In der maximal möglichen Qualität kann ATi also immer noch einen Vorteil für sich verbuchen. Das 24x Edge-Detect-Anti-Aliasing steht derzeit unangefochten an der Spitze und lässt den 16xQAA-Modus von Nvidia hinter sich. Jedoch kann man beide Einstellungen nur schwer miteinander vergleichen, da bei 24xEDAA die Performance stark einbricht.
RV670
G92
GT200
Als Alternative gibt es eine 12xEDAA-Einstellung, die ein Kompromiss aus Bildqualität und Leistung ist. Die Glättung wird im Gegensatz zu 16xQAA konstant auf das Bild angewendet, wirkt dafür manchmal aber etwas gröber. Hier muss der persönliche Geschmack entscheiden, was einem besser gefällt.
RV670
G92
GT200
Wenn sich beim Anti-Aliasing nichts getan hat, kann man vermuten, dass es bei der anisotropen Filterung ebenso keine Veränderungen gegeben hat. Nichtsdestotrotz haben wir die Texturfilterung der GT200-GPU ausführlich untersucht, da es in dieser Disziplin schon des Öfteren einige wirksame Tricks gegeben hat, mit denen man immens an Füllrate sparen kann, aber ein wenig Bildqualität opfert – oft ohne dass es jemand mitbekommt.
Hier können wir aber gleich Entwarnung geben; Nvidia hat die Bildqualität nicht nach unten geschraubt. Der AF-Tester zeigt exakt das gleiche Ergebnis an wie bei einer G92-Karte. Weder die LOD-Einstellung, Präzision oder die Winkelunabhängigkeit hat Nvidia auf dem GT200 verändert, was aber alles andere als ein Nachteil ist. Denn der anisotrope Filter arbeitet bereits auf dem G92 beinahe perfekt und lässt die Konkurrenz in der maximalen Qualität schlecht dastehen.
RV670
G92
GT200
Dasselbe Bild ergibt sich bei den theoretischen Beobachtungen im 3DMark05 als auch im Spieleeinsatz im texturkritischen Half-Life 2. Selbst nach einer intensiven Suche können wir keine Unterschiede im Texturfilter zwischen den beiden Generationen ausmachen. Da man auf Bildern den anisotropen Texturfilter aber nur schlecht bewerten kann, haben wir darüber hinaus mehrere Videos von Half-Life 2 und einem „Moiré-Tester“, der ein regelrechter Härtefall ist, angefertigt und uns mehrmals angeschaut. Auch hier gilt dasselbe: Der GT200 filtert exakt gleich zum G80 beziehungsweise G92.
Während Nvidia beim Anti-Aliasing also knapp das Nachsehen hat, kann man sich beim anisotropen Filter vor die Konkurrenz aus dem Hause ATi setzen. In der Default-Einstellung der Treiber arbeiten die Radeon- und die GeForce-Modelle auf einem gleichwertigen Niveau, weswegen wir weiterhin in sämtlichen Grafikkarten-Artikeln die Default-Einstellungen der AF-Optimierungen (Nvidia) beziehungsweise Catalyst A.I. Standard (ATi) verwenden werden.
RV670
G92
GT200
Somit haben in den Standard-Einstellungen beide AF-Implementierungen ihre Vor- und Nachteile. Während auf einem RV670 die Übergänge der MipMaps trotz des brilinearen Filters kaum negativ auffallen, haben die ATi-Karten bei manchen Texturen mit einem Flimmern zu kämpfen. Auf einem GT200 ist es genau anders herum. Der brilineare Filter erzeugt sichtbare MipMap-Übergänge, dafür flimmern die Texturen nicht so immens. Die eine Person empfindet dabei voraussichtlich eher das Flimmern als schlimmer, während die andere die Bugwellen für das größte Problem erachtet. Allen recht machen kann man es nicht, weil die Texturfilter der beiden Konkurrenten dafür zu verschieden arbeiten. Dennoch denken wir, dass wir mit den Default-Einstellungen einen fairen Kompromiss gefunden haben, der keinen Hersteller benachteiligt.
In der maximal möglichen Qualität kann Nvidia dann ATi hinter sich lassen. Während der RV670 von Catalyst A.I. Off nur minimal profitiert und als einzigen Vorteil nun den trilinearen Filter aufweisen kann (womit die eh kaum sichtbaren Bugwellen nun endgültig wegfallen), flimmern die Texturen munter weiter vor sich hin. Der GT200 filtert dagegen in der High-Quality-Einstellung nahezu perfekt.
RV670
G92
GT200
Es gibt keine Bugwellen mehr, die Winkelunabhängigkeit ist sehr gut und zusätzlich verschwindet das Flimmern beinahe gänzlich – an einigen von Haus aus flimmernden Texturen (da die Frequenz zu hoch gewählt ist) kann logischerweise auch die beste AF-Implementierung nichts ändern. Hier ist also ATi bei der in Kürze erscheinenden RV770-GPU gefragt, die Bildqualität nach oben zu schrauben.
Die beste anisotrope Filterung und das beste Anti-Aliasing nutzen nichts, wenn die Performance bei hohen Einstellungen zu stark einbricht. Aus diesem Grund haben wir uns drei Spiele in der Auflösung 1920x1200 angeschaut und versuchen herauszufinden, welche Einstellung wieviel Leistung kostet.
AA-Skalierung 19x12 – F.E.A.R.
Angaben in Prozent
|
AA-SKalierung 19x12 – Oblivion
Angaben in Prozent
|
AA-Skalierung 1680x1050 – UT3
Angaben in Prozent
|
Wie man anhand der Diagramme gut erkennen kann, scheint es bezüglich der Effizienz des Anti-Aliasing bei der GT200-GPU gegenüber dem G92-Vorgänger keinerlei Verbesserungen gegeben zu haben. Zwar bricht die GeForce GTX 280 prozentual durch die Bank weniger ein als die GeForce 9800 GTX, jedoch kann man dies wohl mit der von Haus aus höheren Roh-Performance begründen. Somit ist die Performance des Anti-Aliasings auf der GeForce-GTX-200-Karte sehr gut, solange man keine Modi mit acht-fachem MSAA-Anteil verwendet. Dort hatte der G92 bereits Probleme, die beim GT200 zwar teils ausgemerzt wurden, aber immer noch nicht vollständig verschwunden sind.
So bricht zum Beispiel die Performance in F.E.A.R. auf der GeForce GTX 280 um knapp 300 Prozent gegenüber 1xAA ein, während der eigentlich viel schwächere RV670 auf der Radeon HD 3870 den identischen Leistungsverlust aufweist. In Oblivion verstärkt sich das Problem sogar: Der GT200 verliert 51 Prozent der Geschwindigkeit, während der RV670 nur 43 Prozent einbüßt. Jedoch agiert in dem Spiel auch schon das vier-fache Anti-Aliasing auf der Radeon HD 3870 effektiver.
In Unreal Tournament 3 tritt mehr oder weniger der „Worst Case“ für den GT200 ein. Erneut knapp 300 Prozent Leistungsverlust zeigt die GeForce GTX 280, während die Radeon HD 3870 „nur“ 250 Prozent der Performance verliert. Und das, obwohl bei 4xMSAA der GT200 noch um einiges effektiver als der RV670 arbeitet. Hier muss Nvidia in Zukunft noch einiges verbessern.
AF-SKalierung 12x10 – Crysis
Angaben in Prozent
|
AF-Skalierung 19x12 – Gothic 3
Angaben in Prozent
|
AF-Skalierung 19x12 – Stalker
Angaben in Prozent
|
Anders sieht es dagegen bei der Skalierung des anisotropen Filters aus, wo Nvidia sowohl mit dem G92 als auch mit der neuen GT200-GPU regelrechte Kreise um den RV670 dreht. Die Texturfüllrate auf einer derzeitigen ATi-GPU ist einfach viel zu gering, um bei einer anisotropen Texturfilterung (trotz diverser „Optimierungen“) nicht viel an Leistung zu verlieren. Zwischen einem G92 und einem GT200 gibt es dagegen nur minimale Differenzen.
Bei 16-facher anisotroper Filterung in der High-Quality-Einstellung verlieren beide GPUs in Crysis und Stalker prozentual gleich viel an Leistung. Einzig bei Gothic 3 skaliert der G92 etwas besser, was aber voraussichtlich daran liegt, dass der GT200 aufgrund der höheren Grund-Performance einfach mehr Geschwindigkeit verlieren kann. Eine weitere Möglichkeit könnte das Verhältnis zwischen Textur- und ALU-Leistung sein: So bietet der GT200 im Verhältnis mehr ALU- als Texturleistung als der G92 auf der GeForce 9800 GTX.
Auflösungsskalierung – CoH
Angaben in Prozent
|
Auflösungsskalierung – Crysis
Angaben in Prozent
|
Auflösungsskalierung – F.E.A.R.
Angaben in Prozent
|
Bei der reinen Auflösungs-Skalierung kann sich der GT200 durchgängig von dem G92 auf der GeForce 9800 GTX absetzen. Dies liegt unter anderem daran, dass Nvidia die Architektur des GT200 mehr auf hohe Auflösungen wie 2560x1600 getrimmt hat (verbessertes Z-Cull und eine bessere Z-Kompression) und dass der größere Speicher auf der GeForce GTX 280 zudem eine Rolle spielt.
Mit der GeForce GTX 280 hat Nvidia nach einer langen Wartepause wieder eine überarbeitete GPU vorgestellt, die mit einem einzelnen Rechenkern neue Rekordwerte aufstellen und der GeForce 9800 GX2 die Performancekrone abnehmen soll. Keine einfache Aufgabe für die Grafikkarte, da diese darüber hinaus auch erstmals richtig im GPGPU-Segment aufmischen und dort primär nicht nur ATi, sondern vor allem Intel entgegen treten wird. Das ganze wird natürlich seinen Preis haben: 550 Euro lautet die Preisempfehlung von Nvidia für eine GeForce GTX 280. Ab sofort sollten erste Exemplare bei den Händlern erhältlich sein.
Die GeForce GTX 280 misst – wie für eine High-End-Karte seit der GeForce 8800 GTX üblich – eine Länge von 28 Zentimeter und passt sich somit der Größe einer GeForce 9800 GX2 und einer Radeon HD 3870 X2 an. Probleme beim Einbau in ein handelsübliches Gehäuse sollte es dennoch nicht geben, da mittlerweile beinahe sämtliche Produkte auf den Einsatz längerer Grafikkarten vorbereitet sind. Einen kurzen Blick in den eigenen Tower sollte man aber trotzdem werfen, da es vor allem bei den Festplattenkäfigen zu Problemen kommen kann.
Wie schon bei der Dual-GPU-Karte GeForce 9800 GX2 liegt das schwarz gefärbte PCB der GeForce-GTX-280-Karte nicht wie von anderen Karten gewohnt offen frei, sondern wird von einem Metallkörper ummantelt, der die Wärme besser abtransportieren und somit die Kühlleistung erhöhen soll. Deswegen ist es nicht verwunderlich, dass die Karte beim Berühren wärmer als gewöhnlich erscheint. Die maximale Leistungsaufnahme von Nvidias neuem Flaggschiff liegt bei 236 Watt, weswegen für den Betrieb ein Acht-Pin- und ein Sechs-Pin-Stromkabel angeschlossen sein müssen. Zwei Sechs-Pin-Kabel werden nicht funktionieren.
Unter einer kleinen, entfernbaren Abdeckung findet der Käufer zwei SLI-Anschlüsse vor. Die GeForce GTX 280 ist also kompatibel zu 3-Way-SLI, sprich es können gleich drei 3D-Beschleuniger zusammen die Rechenleistung erhöhen. Das Kühlsystem besteht abseits der Metalummantelung aus einem großen Kühlkörper, der mit diversen Kühllamellen aus kostengünstigem Aluminium bestückt ist. Auf der GPU selber sitzt ein eingelassener Kühlblock, der aus teurerem, dafür aber effektiverem Kupfer besteht. Zusätzlich sind die beiden Kühleinheiten noch mit einer Heatpipe verbunden.
Als Lüfter vertraut Nvidia bei der GeForce GTX 280 auf ein 70-mm-Exemplar in Radial-Bauweise, der am hinteren Ende des Kühlsystems platziert ist. Da der Lüfter wie schon bei der GeForce 8800 GTS 512 nach unten hin abfallend etwas schräg verbaut ist, bläst dieser die beförderte Luft nicht gerade aus über die Kühllamellen, sondern direkt auf den Kühlblock der GPU. Die erwärmte Luft wird von der Grafikkarte am Ende des Kühlkreislaufes schlussendlich durch einige Lüftungsschlitze aus dem Gehäuse heraus transportiert. Der Lüfter weiß im Alltagsbetrieb unter Windows einigermaßen zu gefallen, wird unter Last jedoch unangenehm laut – mehr dazu im Abschnitt Lautstärke.
Der ein Gigabyte große GDDR3-Speicher wird von Hynix mit einer Zugriffszeit von einer Nanosekunde hergestellt. Der kleine Chip auf dem PCB, der beim Entfernen des Kühlers sichtbar wird, ist erneut der bereits von der GeForce 8800 GTX sowie GeForce 8800 Ultra bekannte NVIO (Nvidia Input Output), der sich um die Ansteuerung des HDTV- sowie der DVI-Ausgänge (alternativ HDMI oder DisplayPort) und der SLI-Bridge kümmert. Der Grund für den Zusatzchip ist, dass man so Routing-Probleme der Datenströme auf dem komplexen Chip verhindern kann.
Auf dem Slotblech montiert Nvidia zwei Dual-Link-fähige DVI-Ausgänge, die HDCP-kompatibel sind und den Kopierschutz selbst in hohen Auflösungen wie 2560x1600 anwenden können, sowie einen HDTV-Anschluss. Neben dem Bild kann über die DVI-Ausgänge auch der Ton übertragen werden, solange man ein SPDIF-Kabel mit dem Soundchip und der Grafikkarte verbindet. Diesbezüglich gab es bei der GeForce-GTX-Serie keine Verbesserungen und ATi kann in dieser Disziplin immer noch einen Vorteil genießen. Auf HDMI oder den neuen DisplayPort-Standard verzichtet Nvidia leider. Eine native GPU-Unterstützung für HDMI und den DisplayPort bieten die beiden GeForce-GTX-200-Karten. Über den DisplayPort kann der Farbraum nicht nur intern mit 10 Bit berechnet, sondern gar ausgegeben werden.
Zotac wird einer der ersten Hersteller sein, die die GeForce GTX 280 anbieten werden. Auch wenn der genaue Marktpreis noch offen ist, kann man davon ausgehen, dass sich die Kosten für den 3D-Beschleuniger bei etwa 550 Euro oder ein wenig darunter einpendeln werden. Ab sofort soll die Grafikkarte im Handel erhältlich sein. Die Zotac GeForce GTX 280 vertraut – wie auch alle anderen Exemplare – zuerst vollständig auf das Referenzdesign von Nvidia. Sowohl die Taktraten als auch das Kühlsystem sind völlig identisch zu den Vorgaben der Kalifornier. Zu einem späteren Zeitpunkt soll es mit der AMP!-Edition aber ebenfalls eine übertaktete Variante von Zotac geben.
Somit kommt die Grafikkarte mit einer Länge von 28 Zentimeter daher und sollte problemlos in die meisten im Handel erhältlichen Gehäusen passen. Das Kühlsystem umschließt mit einem Metallgehäuse beinahe die gesamte Karte und lässt die eigentlichen Bauteile unsichtbar werden. Zotac hat die Lüftersteuerung leider jedoch auch komplett gleich gelassen. So ist der Lüfter schon unter Windows aus einem geschlossenen Gehäuse heraus zuhören und wird unter Last recht aufdringlich – obwohl die Temperaturen absolut im grünen Bereich liegen.
Die Kabelausstattung lässt eigentlich keine Wünsche offen. So gibt es zwei Strom- (2x4-Pin auf 6-Pin sowie 2x6-Pin auf 8-Pin), einen DVI-auf-D-SUB- sowie einen DVI-auf-HDMI-Adapter. Darüber hinaus findet der Käufer des neuen Top-Modells eine S-Video-auf-S-Video/YUV-Kabelpeitsche und ein SPDIF-Kabel in dem Karton vor, durch dessen Hilfe man den Ton über die Grafikkarte durch den HDMI-Adapter ausgeben kann. Das Softwarepaket fällt zwar nicht gerade umfangreich aus, ist dafür aber hochwertig. Zotac legt der GeForce GTX 280 neben einer Treiber-CD noch das neue Spiel „Race Driver Grid“ bei – sehr gut!
Testsystem:
Folgende Benchmarks kamen während unseres Tests zum Einsatz:
Alle Benchmarks werden mit maximalen Details ausgeführt, damit die Grafikkarte möglichst hoch belastet wird. Als Einstellungen haben wir uns dabei für 1280x1024 und 1600x1200 (sowie 2560x1600 bei Grafikkarten mit 512 MB oder mehr und einer entsprechenden Leistung) entschieden. Damit zollen wir den modernen High-End-Beschleunigern Tribut, die durch ihre Rechenkraft niedrigere Auflösungen als 1280x1024 CPU-limitiert werden lassen. Neben den reinen Auflösungen lassen wir den Benchmarkparcours auch mit 4-fachem (und falls möglich acht-fachem) Anti-Aliasing sowie 16-fachen anisotropen Filter durchlaufen. TSSAA (Nvidia) oder AAA (ATi) zur Glättung von Alpha-Test-Texturen nutzen wir aufgrund von Kompatibilitätsproblemen nicht mehr in unserem Benchmarkparcours.
Nach sorgfältiger Überlegung und mehrfacher Analyse selbst aufgenommener Spielesequenzen sind wir zu dem Schluss gekommen, dass die Qualität der Texturfilterung auf aktuellen ATi- und Nvidia-Grafikkarten in der Standard-Einstellung in etwa vergleichbar sind (mit leichten Vorteilen für die GeForce-Produkte). Bei Nvidia verändern wir somit keinerlei Einstellungen und im ATi-Treiber belassen wir die A.I.-Funktion auf „Standard“.
Treibereinstellungen: Nvidia-Grafikkarten (G8x, G9x, GT200)
Treibereinstellungen: ATi-Grafikkarten (R(V)6x0)
Fillrate Tester
Fablemark
Fablemark – 1920x1200
Angaben in Bildern pro Sekunde (FPS)
|
ShaderMark
D3DRighmark Beta 4 und D3D10-Version
Die allseits bekannte Benchmarkserie von Futuremark ist mittlerweile in der Version 2006 erschienen und hört dementsprechend auf die Bezeichnung „3DMark06“. Von den sechs Testszenen messen vier Sequenzen die Performance der Grafikkarte und zeigen eine Grafikpracht, die ihresgleichen sucht. Um jene zu erreichen setzen die Finnen auf modernste 3D-Technologie, weswegen nicht nur massiv das Shader-Model 3.0 verwendet wird – auch extrem aufwendige Texturen, spektakuläre Partikeleffekte, komplexe Schattenberechnungen und als weiteres Highlight „High Dynamic Range Rendering“ – kurz HDRR – werden eingesetzt. Dabei setzt Futuremark auf FP16-HDR, das die derzeit Best mögliche Bildqualität liefert, aber auch aufwendig zu berechnen ist. Weitere Details zu diesem Programm gibt es in einem unserer ausführlichen Artikel. [9]
3DMark06 – 1280x1024
Angaben in Punkten
|
3DMark06 – 1600x1200
Angaben in Punkten
|
3DMark06 – 2560x1600
Angaben in Punkten
|
Nachdem der altgediente 3DMark06 schon einige Jahre auf dem Buckel hat und somit nicht nur die Grafik mittlerweile etwas angestaubt wirkt sondern darüber hinaus das CPU-Limit bei schnellen Grafikkarten immer mehr bemerkbar wird, wurde es höchste Zeit für einen Nachfolger. Der finnische Hersteller Futuremark hat dementsprechend nach einer langen Wartezeit den 3DMark Vantage auf den Markt gebracht, der von vornherein für die Direct3D-10-API programmiert worden ist. Grafisch bieten die zwei Spieletests dementsprechend viel fürs Auge, wobei vor allem der zweite Test Glanzpunkte setzen kann. Mit FP16-HDR, Tiefenunschärfe, Parallax Occlusion Mapping, einer physikalische Simulation auf der GPU, diversen Shadereffekten und noch vielem mehr bringt der 3DMark Vantage die 3D-Hardware problemlos ans Leistungslimit. Wir testen das Programm (falls die Grafikkarten es zulassen) im Performance-, High- und Extreme-Preset. Weitere Details zu diesem Programm gibt es in einem unserer ausführlichen Artikel. [10]
3DMark Vantage – 1280x1024
Angaben in Punkten
|
3DMark Vantage – 1680x1050
Angaben in Punkten
|
3DMark Vantage – 1920x1200
Angaben in Punkten
|
Der neueste Spross aus der bekannten „Call of Duty“-Reihe ist erstmals nicht im zweiten Weltkrieg angesiedelt, sondern einige Jahrzehnte später in der Zukunft. Dem Spielspaß tut dies aber keinen Abbruch, ganz im Gegenteil sogar. Die Atmosphäre ist in Call of Duty 4 dermaßen realistisch, dass man ohne Probleme in die Spielwelt eintauchen kann. Doch nicht nur spielerisch weiß der First-Person-Shooter zu gefallen, auch technisch macht man im Gegensatz zum (PC)-Vorgänger Call of Duty 2 einen großen Schritt nach vorne – und das, obwohl man immer noch dieselbe Grafikengine benutzt. Optisch liegt Call of Duty 4 jedoch auf einem vollkommen anderen Niveau: Schicke Shadereffekte sowie ein intelligenter Parallax-Mapping-Einsatz vertuschen die teils etwas schwachen Texturen. Schon Call of Duty 2 konnte beim Erscheinen mit einer einzigartigen Rauchdarstellung punkten; der Nachfolger steht dem zweiten Teil der Serie diesbezüglich in nichts nach und kommt mit einer Rauchpräsentation daher, die zu beeindrucken weiß. Auf Direct3D-10-Unterstützung muss man aber verzichten: Call of Duty 4 setzt noch alleinig auf den Vorgänger Direct3D 9.
Call of Duty 4 – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Call of Duty 4 – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Call of Duty 4 – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Spielerisch oder technisch bemerkenswerte Spiele geraten normalerweise schnell ins Blickfeld der Presse und werden auch von den Spielern meistens sehnlich erwartet. Anders war dies merkwürdigerweise bei „Clive Barker’ Jericho“, dessen Demo mehr oder weniger aus dem Nichts aufgetaucht ist. Spielerisch wird die Vollversion zwar erst noch beweisen müssen, ob Jericho auf Dauer wird überzeugen können, technisch macht die Demo aber bereits eines klar: Die Grafikengine ist auf der Höhe der Zeit und braucht sich vor keinem anderen Konkurrenten zu verstecken. Nicht nur die Technik an sich kann mit qualitativ hochwertigen Texturen, diversen Shader- sowie Partikeleffekten und FP16-High-Dynamic-Range-Rendering punkten, auch der Grafikcontent selber, sprich die künstlerische Gestaltung, zeugt von Originalität. Da die GeForce-7-Serie von Nvidia bekannterweise kein Multi-Sampling-Anti-Aliasing auf ein FP16-Rendertarget anwenden kann, muss die alte Grafikkartengeneration aus Kalifornien bei den Qualitätseinstellungen außen vor bleiben.
Clive Barker's Jericho – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Clive Barker's Jericho – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Clive Barker's Jericho – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Doom 3 bekommt Konkurrenz – und was für Eine! Die Programmierer des Gruselshooters F.E.A.R. scheinen sich Doom 3 als großes Vorbild ausgesucht zu haben – wobei man allerdings fast alles besser zu machen scheint. Unter anderem wird die sehr beklemmende Atmosphäre durch eine Grafikqualität erreicht, die ihresgleichen sucht. Shadereffekte in Massen, wunderschönes Bump-Mapping, sehr spektakuläre Schattenwürfe, detaillierte Texturen sowie hübsch aussehende Partikeleffekte und noch vieles mehr bekommt der Spieler zu Gesicht. Keine Frage, F.E.A.R. ist bereits Pflicht für einen guten Benchmark-Parcours geworden. Wir verwenden für diese Zwecke die Vollversion, die über eine integrierte Benchmarkfunktion verfügt. Jene zeigt ein Gefecht sowie eine größere Explosion, die durch eine frei bewegte Kamera aufgenommen wurden. Die Details sind, mit Ausnahme der Soft-Shadows, auf das Maximum gesetzt.
F.E.A.R. – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
F.E.A.R. – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
F.E.A.R. – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Das wohl zweifellos meisterwartete Rollenspiel im Jahre 2006 hört auf den Namen „Gothic 3“, was mit den beiden beliebten Vorgängern begründet ist. Auch wenn das Spiel – selbst nach einigen Patches – immer noch fehlerhaft ist, so erfreut es sich einer großen Beliebtheit in Deutschland, wie man gut an den Verkaufscharts erkennen kann. Doch neben dem eigentlichen Spielinhalt kann Gothic 3 zudem mit seiner Grafikengine punkten, die den Entwicklern sehr gut gelungen ist. So ist nicht nur die Weitsicht beeindruckend, auch die kleinen, liebevollen Details an Figuren und Gegenständen machen die Grafik zu etwas Besonderem. Dass die Engine damit nicht nur gut aussieht, sondern auch die Hardware sehr fordert, war bereits vor der Veröffentlichung klar. Allerdings bietet das Grafikgrundgerüst einen entscheidenden Nachteil: So kann derzeit kein Anti-Aliasing angewendet werden, weswegen das Feature in den Qualitätseinstellungen nicht aktiv ist; dort ist nur der anisotrope Filter im Einsatz.
Gothic 3 – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Gothic 3 – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Gothic 3 – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Die „Rainbow Six“-Reihe umfasst schon etliche Titel und ist eine der größten PC-Spiele-Serien weltweit. Die neueste Kreation hört auf den simplen Namen „Vegas“ und verdeutlich damit bereits, wo die Spezialeinheit diesmal im Einsatz ist. Und das die Stadt Las Vegas zu den farbenfrohesten Städten überhaupt gezählt werden kann, bezweifeln wohl nur die wenigsten. Dementsprechend bunt, aber auch sehr detailliert, ist die Grafikengine von Vegas, die zeitgleich nicht irgendeine, sondern wohlbekannt ist: Die Unreal Engine 3, die seit Ende des Jahres 2007 in „Unreal Tournament 3“ zum Einsatz kommt. Obwohl die Version in Vegas der in UT3 um einiges nachhinkt, so weiß die Grafik zu überzeugen. Sehr viele Details werden dargestellt, die man bis jetzt in keinem Spiel entdecken konnte; detaillierte Animationen runden das Ergebnis ab. Doch die Unreal Engine 3 hat einen großen Nachteil: So kommt „Deferred Shading“ (die Unreal Engine 3 an sich ist kein reiner Deffered Renderer, einzig der Schattenpart besitzt einen speziellen Algorithmus) zum Einsatz, das mit einer flotten Schatten- und Lichtberechnung zwar einige Vorteile bietet, aber unter der Direct3D-9-API Anti-Aliasing verhindert. Erst mit Direct3D 10 ist Deferred Shading und Kantenglättung möglich. Aktuelle Nvidia-Treiber ermöglichen, in dem Spiel aufgrund eines „Treiber-Hacks“ dennoch die Kantenglättung zu aktivieren.
Rainbow Six Vegas – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Rainbow Six Vegas – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Rainbow Six Vegas – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
„Stalker“ – neben Duke Nukem Forever wohl der Inbegriff des Wartens. Nach einer langen Zeit hat es der ukrainische First-Person-Shooter aber dennoch in die Regale geschafft und weiß trotz der schier ewigen Entwicklungszeit zu gefallen. Nicht nur spielerisch punktet das Spiel mit netten Ideen, auch die Atmosphäre kann sich sehen, beziehungsweise spüren lassen. Darüber hinaus ist die Grafikengine, die einen „Deferred Shading“-Algorithmus verwendet, gut gelungen. Das Spiel überzeugt vor allem mit schicken Wettereffekten und kann detaillierte Texturen aufweisen. Shader-Model-3.0-Effekte kommen zum Einsatz, ebenso hochwertiges FP16-HDR-Rendering, das für ein realitätsnahes Farbenspektrum sorgt. Ein weiteres Highlight sind die zahlreichen hochwertigen Licht- und Schatteneffekte, die man in dieser Form bis jetzt noch nicht zu sehen bekommen hat. Dies ist der Vorteil von Deferred Shading: Licht- und Schattenberechnungen können sehr schnell ausgeführt werden. Ein großer Nachteil ist jedoch, dass Direct3D-9-Beschleuniger deswegen kein Multi-Sampling-Anti-Aliasing ausführen können. Dazu benötigt es nicht nur eine D3D10-Grafikkarte, auch das Spiel muss mit der neuen API ausgestattet sein.
Stalker – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Stalker – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Stalker – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Klassische First-Person-Shooter sind in der heutigen Zeit selten geworden. Während es diese vor einigen Jahren noch in schieren Massen gab, ist ein „reinrassiger Ballerspaß“ mittlerweile etwas aus der Mode gekommen. Nichtsdestotrotz gibt es einige wenige Spiele, die dies mit großem Erfolg ignorieren und auf das alte Erfolgskonzept setzen. Eine dieser Serien hört auf den Namen „Unreal Tournament“, die von Epic, einer der bekanntesten Spieleschmieden, programmiert wird. Der neueste Spross hört auf den Namen Unreal Tournament 3, der im Gegensatz zu seinen Vorgängern spielerisch wieder mehr an das originale Unreal Tournament erinnert. Als technisches Grundgerüst kommt die Unreal Engine 3 zum Einsatz, die derzeit bereits in einigen anderen Spielen zu gefallen weiß. Dies ist auch in Unreal Tournament 3 nicht anders: Schicke und abwechslungsreiche Texturen, gute Partikeleffekte, ein sinnvolles (wenn auch manchmal etwas übertriebenes) Shading, High-Dynamic-Range-Rendering und noch vieles mehr machen aus „UT3“ eines der schönsten Spiele auf dem Markt. Noch nicht implementiert ist (obwohl die Unreal Engine 3 dazu durchaus in der Lage ist) die Unterstützung der Direct3D-10-API. Da die Unreal Engine 3 Deferred Shading benutzt, funktioniert kein Anti-Aliasing, weswegen die meisten Grafikkarten keine Kantenglättung nutzen können. Da die Direct3D-10-Hardware dazu aber in der Lage ist, hat Nvidia für die entsprechenden Grafikkarten einen kleinen Trick im Treiber angewendet, der Anti-Aliasing möglich macht. Dies machen wir uns zunutze und testen die GeForce-8-Karten ebenfalls mit aktivierter Kantenglättung. Als Benchmarksequenz verwenden wir die integrierte Flyby-Funktion der Karte „Gateway“. Diese erzeugt sehr hohe FPS-Werte, die im richtigen Spielgeschehen zu keiner Zeit auch nur annähernd erreicht werden – deswegen kann man von unseren Benchmarks nur bedingt auf das Spiel schließen.
Unreal Tournament 3 – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Unreal Tournament 3 – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Unreal Tournament 3 – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Was passiert, wenn ein Konsolentitel erfolgreich ist? Man portiert ihn natürlich für den PC! Und dies ist UbiSoft mit Assassin's Creed wohl auch ohne Zweifel gelungen, da man es nicht nur bei einer reinen 1:1-Umsetzung gelassen, sondern darüber hinaus noch einige weitere Spielinhalte eingefügt hat. Doch worum geht es in Assassin's Creed überhaupt? Man spielt den Auftragsmörder Altair, der neben seinem eigentlichen Hauptberuf gerne mit Pferden reitet, Passanten umschubst, spektakuläre Kämpfe ausübt und sich vor allem gerne in schwindelerregenden Höhen, also auf sämtlichen Dächern der verschiedenen Städte, herumtreibt. Und was braucht man dazu? Eine potente Grafikengine, die Assassin's Creed auch durchaus hat. Ein Highlight sind die Charakteranimationen, die einwandfrei umgesetzt sind. Zudem gibt es noch schicke Texturen, sehr schöne Licht- und Schatten-Spiele, eine gut hervorgehobene Weitsicht und noch so einiges mehr, das Assassin's Creed zu einem Fest für die Augen macht. UbiSoft hat es sich nicht nehmen lassen, einen Direct3D-10-Renderer für die PC-Version einzubauen. Dieser soll die Performance bei gleicher Qualität gegenüber der Direct3D-9-Version erhöhen und zudem die Grafikqualität ein wenig verbessern. Dies fällt vor allem bei den Schatten auf, die in der Direct3D-9-Grafik ziemlich „verfranzt“ aussehen.
Assassin's Creed – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Assassin's Creed – 1680x1050
Angaben in Prozent
|
Assassin's Creed – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
„Bioshock“, mehr oder weniger der inoffizielle Nachfolger von „System Shock 2“, hatte es bei seinem Erscheinen wahrlich nicht leicht. Die Erwartungen waren dermaßen hoch, dass es nahezu unmöglich schien, diese allesamt zu erfüllen. Im Vorfeld sprach man davon bereits als „bestes Spiel aller Zeiten“. Mittlerweile ist BioShock erschienen – ob es tatsächlich das beste Spiel aller Zeiten ist, kann man wohl noch ewig diskutieren. Eines ist aber eindeutig: Technisch ist Bioshock nicht nur sehr weit vorne, sondern wohl derzeit allen anderen Titeln voraus. Grund dafür ist die Unreal Engine 3, die die Entwickler modifiziert haben, um diese auf die eigenen Ansprüche anzupassen. Herausgekommen ist ein Direct3D-10-Renderer, der mit bisher noch nie dagewesenen Wassereffekten punkten kann. So interagiert das Wasser physikalisch korrekt mit dem Spieler, wenn dieser beispielsweise durch einen überfluteten Raum läuft. Darüber hinaus bietet Bioshock viele weitere optische Schmankerl: Schicke Partikeleffekte, spektakuläre Feuerdarstellung, realistische Schatten, schöne Oberflächen, Physikinteraktionen mit den Gegnern sowie der Umwelt und noch vieles mehr machen Bioshock grafisch zu einem Leckerbissen. Mit der Direct3D-10-API funktioniert bisher kein Anti-Aliasing, wie zuvor bereits mehrfach erwähnt wurde. Aktuelle Nvidia-Treiber ermöglichen in dem Spiel aufgrund eines „Treiber-Hacks“, dennoch die Kantenglättung im D3D-10-Modus zu aktivieren.
Bioshock – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Bioshock – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Bioshock – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Auch wenn der First-Person-Shooter „Call of Juarez“ ohne John Wayne auskommen muss, so ist das Programm zweifellos eines der wenigen Western-Spiele, die große Aufmerksamkeit auf sich ziehen konnten. Eine gut erzählte Story, zwei interessante Charaktere, die unterschiedlicher nicht sein könnten, viele Pistolen-Duelle und eine Grafik, die sich vor der gesamten Konkurrenz nicht zu verstecken braucht. Wir testen das Spiel in der aktuellen Version, die mit Direct3D-10-Unterstützung daherkommt. Die Vegetation ist um 30 Prozent dichter, es gibt 30 Prozent mehr Partikeleffekte, eine um 25 Prozent gestiegene Sichtweite, höher aufgelöste Texturen, höher aufgelöste Shadowmaps, Relief-Mapping wird eingesetzt und noch vieles mehr. Wie man bereits bemerkt, ist die Anforderung an die Grafikkarte ein gutes Stück weiter gestiegen, und das, obwohl das Spiel von Grund auf eigentlich für die ältere Direct3D-9-Schnittstelle programmiert worden ist. Nichtsdestotrotz hat das Spiel noch mit einem Problem zu kämpfen: So werden Teile der Vegetation nicht richtig dargestellt, was laut Techland am Alpha-to-Coverage-Verfahren liegt. Als Testsequenz nutzen wir die aktualisierte Vollversion und einen eigenen Spielstand.
Call of Juarez – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Call of Juarez – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Call of Juarez – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Auf den Patch 1.70 von Company of Heroes haben sicherlich viele Spieler gewartet, denn so bringt die aktuelle Version des Strategietitels nicht nur einige weitere Fehlerbeseitigungen mit sich, sondern führt auch die Unterstützung von Direct3D 10 ein. Die neue API kann man bei einer entsprechenden Grafikkarte im Spielmenü auswählen und schon erscheinen alle Levels in neuem Glanz. Darüber hinaus kann man die Terraindetails nun eine Stufe höher auf „Ultra“ schrauben, was einige Bodendetails hinzufügt und die Texturen sichtbar verbessert. Die Direct3D-10-Version bietet dem Spieler eine pixelgenaue Beleuchtung, Percentage Closer Filtering für die Soft Shadows auf allen D3D10-Beschleunigern, schönere Partikeleffekte sowie Alpha to Coverage für alle Bäume und Sträucher, die somit auch von herkömmlichen MSAA erfasst und bearbeitet werden. Als Benchmarksequenz verwenden wir den integrierten Benchmark.
Company of Heroes – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Company of Heroes – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Company of Heroes – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Crysis – alleine der Name sagt wohl schon alles. Kaum ein anderes Spiel hat bereits vor der Veröffentlichung so viel Aufmerksamkeit erhalten wie der First-Person-Shooter von Crytek, der als inoffizieller Nachfolger zum Actionhit Far Cry betrachtet wird. Far Cry sagt eigentlich auch schon alles: Denn kaum ein anderes Spiel lässt Spieler sofort an einen sonnigen Strand und an große Palmen denken. Und genau diesen (und noch viel mehr) sieht man in Crysis wieder – selbst wenn man ihn kaum wiedererkennen wird. Denn wie Far Cry setzt Crysis neue Maßstäbe in Sachen Grafik und hebt die Messlatte dabei gleich dermaßen hoch an, dass es wohl noch einige Zeit dauern wird, bis ein anderes Spiel der grafische Qualität von Crysis Paroli bieten wird. Die Direct3D-10-API, High-Dynamic-Range-Rendering, Parallax Occlusion Mapping, Soft Shadows, Motion Blur, Depth of Field, Soft Particles und noch eine Menge mehr bekommt man bei Crysis geboten. Dementsprechend hoch fallen die Hardwareanforderungen aus, die selbst den schnellsten Rechner problemlos ins Schwitzen bringen. Als Benchmark verwenden wir nicht den integrierten Benchmark, sondern setzen auf eine eigens erstellte Timedemo in dem grafiklastigen Level „Ice“. Wir testen die auf Version 1.21 aktualisierte Vollversion des Spiels. Auch wenn die Einstellung „Very High“ für viele (vor allem günstigere) Grafikkarten unspielbar ist, haben wir uns dennoch für die höchste Qualitätsstufe entschieden, um selbst mit zukünftigen Grafikkarten keine CPU-Limitierung bei gewährleisteter Vergleichbarkeit zu schaffen.
Crysis – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Crysis – 1680x1050
Angaben in Bildern pro Sekunde (FPS)
|
Crysis – 1920x1200
Angaben in Bildern pro Sekunde (FPS)
|
Das Actionspiel „Lost Planet“ gibt es in zwei verschiedenen Versionen: Eine Direct3D-9- und eine Direct3D-10-Variante; Letztere hat es in unseren Parcours geschafft. Das Spiel kann technisch nicht nur durch die D3D-10-Erweiterung und somit der Nutzung des Shader-Model 4 inklusive des neuen Geometry-Shaders glänzen, auch abseits der API weiß Lost Planet zu gefallen. Mit Soft Shadows (diese sind in Lost Planet zwar an die D3D10-Version gekoppelt, mit Direct3D 10 hat diese Schattenvariante aber nichts zu tun), FP16-High-Dynamic-Range-Rendering, detaillierten Texturen, massig Partikeleffekten und noch vielem mehr ist das technisch weit fortgeschrittene Spiel ein regelrechter Augenschmaus. Dass Lost Planet dabei noch eine Menge Spaß macht, könnte man fast schon als nebensächlich bezeichnen. Die Demoversion des Spiels bietet praktischerweise eine integrierte Benchmarksequenz, die einen Kameraflug aus der Sicht des Spielers durch zwei verschiedene Levels zeigt.
Lost Planet – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
Lost Planet – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
Lost Planet – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Mittlerweile sehen Strategiespiele zwar deutlich besser aus als noch vor einigen Jahren – so recht gelingen will es den Programmen aber nur selten, in die grafische Königsklasse, die meist von First-Person-Shootern besetzt wird, vorzudringen. Den Entwicklern von World in Conflict scheint dies nicht gereicht zu haben und man entwickelte eine Grafikengine, die sich vor keinem anderen Spiel zu verstecken braucht. World in Conflicht unterstützt die Direct3D-10-API und hat keine Schwierigkeiten, Kantenglättung unter der neuen Programmierschnittstelle anzuwenden. Schicke Shadereffekte zieren das Spiel (so wirft die Sonne beispielsweise Lichtstrahlen durch die Wolken, welche die Umgebung darunter beleuchten), ebenso detaillierte Texturen und eine realistische Schattendarstellung. Die Animationen der Spielcharaktere sind gut gelungen, was in Kombination mit einem kinoreifen Schnitt Kinoatmosphäre in den Zwischensequenzen aufkommen lässt. Als Testsequenz benutzen wir nicht die integrierte Benchmarkfunktion, da sich diese mitunter wenig berechenbar verhält. Stattdessen verwenden wir die Introsequenz zur ersten Kampagne der Demo.
World in Conflict – 1280x1024
Angaben in Bildern pro Sekunde (FPS)
|
World in Conflict – 1600x1200
Angaben in Bildern pro Sekunde (FPS)
|
World in Conflict – 2560x1600
Angaben in Bildern pro Sekunde (FPS)
|
Kommen wir nun abschließend zum Performancerating. Dadurch soll es erleichtert werden, alle Ergebnisse auf einen Blick zusammengefasst zu bekommen. Da die synthetischen Benchmarks in dem Testparcours (sprich der 3DMark06 sowie der 3DMark Vantage) über keine Spiele-Engine verfügen und somit keine realistische Aussagen über die Geschwindigkeit in 3D-Titeln wiedergeben, haben wir diese Applikationen aus dem Rating herausgenommen. Da in 2560x1600 mit acht-fachem Anti-Aliasing beinahe ausschließlich nur unspielbare FPS-Raten erreicht werden und dazu viele Grafikkarten in einigen Spielen gerne abstürzen, haben wir uns dazu entschlossen, das Rating in einem Klapptext zu verstecken. Wir bitten, diese Ergebnisse nur mit äußerster Vorsicht zu beachten.
Performancerating – 1280x1024
Angaben in Prozent
|
Performancerating – 1600x1200
Angaben in Prozent
|
Performancerating – 2560x1600
Angaben in Prozent
|
Rating – 1280x1024 4xAA/16xAF
Angaben in Prozent
|
Rating – 1280x1024 8xAA/16xAF
Angaben in Prozent
|
Rating – 1600x1200 4xAA/16xAF
Angaben in Prozent
|
Rating – 1600x1200 8xAA/16xAF
Angaben in Prozent
|
Rating – 2560x1600 4xAA/16xAF
Angaben in Prozent
|
Vor noch nicht allzu langer Zeit waren Grafikkarten eigentlich nur für eines zu gebrauchen: Die Beschleunigung einer 3D-Applikation, meistens eines Spieles. Lange Zeit hat sich daran nichts geändert, da es mit den Fixed-Function-Pipelines kaum möglich war, die fest verdrahteten Recheneinheiten so zu umwinden, um andere Berechnungen auf der Grafikkarte auszuführen. Doch schon seit einigen Generationen hat sich die Situation vor allem mit der Einführung der Shadereinheiten, die man, zu Beginn noch wenig flexibel, programmieren und so die ALUs für die eigenen Zwecke manipulieren konnte, geändert.
Das erste brauchbare „Nebenprodukt“ war die Videobeschleunigung, die mittlerweile zu einem Großteil von der GPU ausgeführt wird. Mit der Direct3D-9- oder spätestens der Direct3D-10-API und den somit nötigen Änderungen an der Hardware, kann man eine GPU, vor allem die Shadereinheiten, für diverse, parallel ausgelegte Berechnungen benutzen, die bei optimierter Software und dem richtigen Einsatzgebiet eine deutlich höhere Performance als die „Allzweckwaffe CPU“ erzeugen können. Durch die mittlerweile diversen möglichen Berechnungen abseits der 3D-Grafik ist eine ganze neue Wissenschaft entstanden, die auf den Namen GPGPU (General Purpose Computation on Graphics Processing Unit) hört und mit der Zeit immer mehr Anhänger findet.
Dazu benutzt man meistens eine bereits vorhandene API (OpenGL), um die selbst geschriebenen Programme auf der Grafikkarte auszuführen. Mittlerweile sind sowohl ATi als auch Nvidia einen Schritt weiter, und bieten für GPU-Anwendungen spezielle Schnittstellen an, die genau für diesen Zweck entwickelt worden sind und unter die Kategorie „GPU-Computing“ fallen. ATis Entwicklung hört auf den Namen CAL (Compute Abstraction Layer) und stellt nichts anderes als eine sehr hardwarenahe (und somit zwar optimierte, aber umständliche) Sprache dar. Nvidia ist dagegen schon einen Schritt weiter und bietet mit CUDA (Compute Unified Device Architecture) eine C-ähnliche Schnittstelle an, die die Programmierung einfacher gestalten soll und darüber hinaus den Vorteil bietet, dass sämtliche in CUDA geschriebene Programmen ohne Softwareanpassung (auch auf zukünftigen CUDA-kompatiblen GPUs) laufen werden.
Und dementsprechend spielt für beide Grafikchipentwickler das GPU-Computing-Gebiet eine immer größer werdende Rolle. Vor allem Nvidia scheint das neu entstandene Segment für sehr wichtig zu erachten. So werden in Zukunft diverse „CUDA-Programme“ auf den Markt kommen und darüber hinaus wurde die GT200-GPU nach eigenen Angaben erstmals (unter anderem) dafür entwickelt, dass CUDA-Anwendungen optimal laufen – die G8x-Architektur war dagegen primär für 3D-Programme ausgelegt, obwohl CUDA auf den GPUs schon ausgeführt werden kann. Wir vermuten, dass Nvidia einen recht beachtlichen Teil der 1,4 Milliarden Transistoren in die Optimierung für CUDA gesteckt hat.
Die ersten zwei Mainstream-CUDA-Programme für die breite Öffentlichkeit werden eine speziell angepasste Version von Folding@Home (für die es ebenfalls eine ATi-Version [11] gibt) sowie die Software „BadaBOOM Media Converter“ von Elemental Technologies sein, mit dessen Hilfe man schnell MPEG2-Videos in ein anderes Format (zum Beispiel für den Apple iPod oder das iPhone) umwandeln kann. Nvidia konnte uns freundlicherweise von beiden Programmen eine noch nicht finale Vorabversion zur Verfügung stellen, mit denen wir einen kleinen Einblick in die GPGPU-Zukunft von Grafikkarten geben können.
Zuerst wollen wir aber noch anmerken, dass die von uns ausgeführten Benchmarks voraussichtlich nicht komplett vergleichbar miteinander sind, da man je nach Berechnungsart (Grafikkarte, ATi/Nvidia, Prozessor) andere Programme benutzen muss, die zwar denselben Zweck erfüllen, aber möglicherweise einen anderen und nur bedingt vergleichbaren Weg gehen. Nichtsdestotrotz lässt sich auf diese Art und Weise gut darstellen, welche Vorteile man in dem Einsatzgebiet mit einer GPU haben kann.
Folding@Home
Angaben in Punkten
|
Fangen wir mit Folding@Home an, wo die GeForce GTX 280 regelrechte Kreise um die Konkurrenz zieht und die Arbeit mit Abstand am schnellsten verrichten kann. Die auf vier GHz übertaktete Quad-Core-CPU erzielen ein Ergebnis von 43,2 N/D (Nanosekunden pro Tag), während gar eine relativ langsame Radeon HD 3650 mit 54,8 N/D ein schnelleres Rechenergebnis erzielt. Die Radeon HD 3870 kann sich aufgrund der höheren Anzahl der ALUs um 258 Prozent von dem kleinen Bruder absetzen. Einen richtigen Riesensprung schafft dann die GeForce GTX 280, die 460 Prozent schneller agiert und sämtliche andere Hardware alt aussehen lässt.
BadaBOOM Media Converter
Angaben in Minuten, Sekunden
|
Obwohl das Ergebnis beim Transcodieren eines MPEG2-Videos in das MP4-Format für den iPod von Apple nicht ganz so vernichtend ausfällt, zeigt der Messwert, dass eine schnelle GPU auch in dieser Disziplin einer schnellen CPU weit überlegen ist. Während der Core 2 Quad mit vier GHz eine Minute und acht Sekunden zur Fertigstellung des Videos benötigt (AVS Video Converter, Multi-Core optimiert), hat die GeForce GTX 280 ihre Arbeit schon nach 21 Sekunden vollendet. Mit dem bekannten und oft genutzten Tool iTunes von Apple, das von mehreren CPU-Kernen nicht profitieren kann, dauert die Konvertierung gar mehr als sechs Minuten. Wenn man bedenkt, dass die umgewandelte Videodatei gerade einmal knapp zwei Minuten lang ist, kann man sich gut vorstellen, was bei einem Zwei-Stunden-Film passieren würde.
Unser erster eigener Ausflug in das GPU-Computing-Segment zeigt eindrucksvoll, zu was eine moderne GPU im Stande ist, wenn es sich um eine speziell optimierte Software handelt. Zwar werden GPU-Berechnungen bei längst nicht jedem Programm möglich und vor allem sinnvoll sein, jedoch kann man bei der richtigen Software aufgrund der parallel ausgelegten Berechnungen einen extrem großen Performanceschub erzielen. Vor allem die GeForce GTX 280 scheint durch ein CUDA-Programm regelrecht beflügelt zu werden und lässt zumindest in Folding@Home selbst eine ATi-Grafikkarte weit hinter sich. Der Hauptprozessor hat in der Disziplin nicht den Hauch einer Chance.
Da quasi alle aktuellen Modelle über eine herstellerseitige Lüftersteuerung verfügen, unterscheiden wir bei den Messungen den 2D- und den 3D-Betrieb. Für die Last-Messungen wird der Benchmark zu Unreal Tournament 3 in einer Endlosschleife ausgeführt und nach dreißig Minuten die Lautstärke notiert. Beide Messungen werden im Abstand von 15 cm zur Grafikkarte durchgeführt. Die Messung erfolgt für das gesamte Testsystem.
Lautstärke
Angaben in Dezibel
|
Ausgerechnet in der Disziplin der Lautstärke leistet sich die GeForce GTX 280 einen kleinen Ausrutscher. Obwohl das Kühlsystem optisch einen sehr guten Eindruck macht, agiert der Lüfter des neuen Flaggschiffs bereits unter Windows mit hörbaren 47 Dezibel ähnlich laut wie eine GeForce 9800 GX2. Zwar ist der Lärmpegel noch nicht störend, den meisten Silent-Nutzern wird eine GeForce GTX 280 aber zu laut sein. Aus einem geschlossenen Gehäuse kann man die Grafikkarte von den restlichen Komponenten heraushören, jedoch ist die Art des Geräusches mit einem tiefen Brummen relativ angenehm.
Unter Last ist es dann für das Kühlsystem nicht mehr möglich, die GT200-GPU bei einer geringen Drehzahl auf niedrigen Temperaturen zu halten und der Lüfter dreht dementsprechend nach kurzer Zeit deutlich auf. Wir messen eine Lautstärke von bis zu 58 Dezibel, womit die GeForce GTX 280 beinahe einen neuen Rekordwert aufstellt. Je nach Empfindlichkeit des Gehörs kann der 3D-Beschleuniger also selbst in Spielen etwas ablenkend sein. Eine GeForce 8800 Ultra oder GeForce 9800 GTX zeigen – zugegebenermaßen bei einer niedrigeren Leistungsaufnahme – wie es besser geht.
Somit disqualifiziert sich die GeForce GTX 280 für einen Silent-PC. Dafür wurde die Grafikkarte aber auch nicht konzipiert. Nötig ist das Geräuschniveau unserer Meinung nach nicht. Denn die Lüftersteuerung versucht die GPU-Temperatur bei 80 Grad Celsius zu halten, wobei moderne Rechenchips problemlos höhere Temperaturen vertragen können.
Ähnlich den Messungen zur Lautstärke werden auch die Temperaturmessungen durchgeführt. Fast alle aktuellen Grafikkarten besitzen Sensoren, die per Treiber oder Hersteller-Tool ausgelesen werden können. Die Kern-Temperatur wird dabei im Ruhezustand im Windows-Desktop und unter Last nach dreißig Minuten Unreal Tournament 3 abgelesen. Zudem messen wir mit Hilfe eines Infrarot-Thermometers die Chiptemperatur auf der Rückseite der Grafikkarte.
Temperatur
Angaben in °C
|
Unter Windows erzielt die GeForce GTX 280 einen sehr guten Temperaturwert von geringen 45 Grad Celsius, womit man sich ans obere Ende des Testfeldes setzt. Begründet ist das Ergebnis mit den neu eingeführten Stromsparmechanismen und dem relativ laut drehenden Lüfter. Im Vergleich dazu wird eine GeForce 8800 Ultra oder GeForce 9800 GTX um einiges wärmer, einzig die Radeon HD 3870 von ATi kann mit der GeForce-GTX-200-Karte mithalten. Unter Last greifen die Maßnahmen zur Reduzierung der Leistungsaufnahme nicht mehr und die GT200-GPU wird spürbar wärmer – erreicht aber auch dort ein gutes Resultat.
Die Lüftersteuerung hält die GPU-Temperatur bei 80 Grad Celsius, wodurch sich die Grafikkarte im Mittelfeld platzieren kann. Dies schafft das Kühlsystem aber nur durch eine höhere Drehzahl des Lüfters, der dann recht störend auffällt. Nötig ist das Verhalten dabei nicht, da moderne GPUs auch problemlos 90 Grad Celsius und mehr vertragen können. Mit dem erzielten Messwert kann sich die GeForce GTX 280 von einer Radeon HD 3870 absetzen, während die GeForce 8800 Ultra auf demselben Niveau ihren Dienst verrichtet. Die G92-GPU auf der GeForce 9800 GTX bleibt deutlich kühler.
Auf der Chiprückseite messen wir 64 Grad Celsius, was zwar eine hohe Temperatur bedeutet, aber absolut problemlos ist. Selbst in warmen Sommertagen rechnen wir nicht damit, dass es bei einer GeForce GTX 280 zu Überhitzungen kommt.
Für die Messungen der Leistungsaufnahme wird ein handelsüblicher Verbrauchs-Monitor, den man sich auch beim örtlichen Stromversorger ausleihen kann, genutzt. Gemessen wird die Gesamt-Leistungsaufnahme des Testsystems. Auch hier gilt die Teilung zwischen Idle- und Last-Betrieb. Letzterer wird durch Verwendung von Unreal Tournament 3 unter der Auflösung 2560x1600 simuliert.
Leistungsaufnahme
Angaben in Watt (W)
|
Bei den Messungen der Leistungsaufnahme können wir die Effizienz der erstmals bei der GeForce-GTX-200-Serie eingeführten Stromsparmechanismen in Aktion erleben. Dazu taktet sich die Grafikkarte nicht nur extrem herunter, zusätzlich werden auch einige Einheiten deaktiviert, was auf den Namen „Clock Gating“ hört. Dadurch erzielt der 3D-Beschleuniger mit den gemessenen 158 Watt (gemeint ist hier der gesamte PC) ein deutlich besseres Ergebnis als die GeForce 8800 Ultra und kann sich gar noch vor der GeForce 9800 GTX platzieren. Zwar reicht es nicht, eine Radeon HD 3870 (136 Watt) zu schlagen, aufgrund der Größenunterschiede zwischen den GPUs ist der Messwert aber dennoch als gut zu bezeichnen – hierzu gehört Nvidia ein Lob ausgesprochen, da man nun auch abseits von Hybrid-SLI auf jedem Mainboard Strom sparen kann.
Unter Last steigt die Leistungsaufnahme des Systems durch die 1,4 Milliarden Transistoren schwere GPU dann auf hohe 360 Watt, was den dritthöchste Verbrauch in unserem Testfeld aus macht. Nur eine Radeon HD 3870 X2 sowie eine GeForce 9800 GX2, auf denen jeweils zwei GPUs eingesetzt werden, ziehen mehr Strom aus der Steckdose. Im Vergleich zur GeForce 8800 Ultra steigt die Leistungsaufnahme der GeForce GTX 280 um 20 Watt, womit sich Nvidias neues Flaggschiff zur leistunghungrigsten Single-GPU aller Zeiten mausert. Für Stromsparer – die aber auch nicht in der Zielgruppe des 3D-Beschleunigers liegen – ist die Grafikkarte also nicht geeignet.
Laut Angaben von Nvidia handelt es sich bei der doch recht hohen Leistungsaufnahme der GeForce GTX 280 unter Windows um einen noch nicht näher spezifizierten Treiber-Bug. Diesen untersuchen die Kalifornier zur Zeit, da die benötigte Leistung des 3D-Beschleunigers im 2D-Modus eigentlich geringer sein sollte. Wenn Nvidia den Bug gefunden hat, werden wir so schnell wie möglich die neuen Werte unseren Lesern bekannt geben.
Vielen dort draußen wird die gerade neu gekaufte Grafikkarte noch nicht schnell genug sein. Ein probates Mittel, dieses Bedürfnis nach noch mehr Geschwindigkeit zu befriedigen, ist die Hardware zu übertakten. Als kleine Stabilitätsprobe ließen wir den 3DMark06, der besonders grafiklastig ist, laufen und testeten nachfolgend den höchsten Takt mit Hilfe von Company of Heroes, Stalker und World in Conflict. Jedoch muss man vor den Messungen anmerken, dass sich die Ergebnisse nicht auf jede Karte desselben Typs übertragen lassen, da die Güte von Chip zu Chip unterschiedlich ist.
Übertaktbarkeit
Angaben in Bildern pro Sekunde (FPS)
|
Da es sich beim GT200 um eine neue GPU handelt, gingen wir von vornherein davon aus, dass das Übertaktungspotenzial nur mäßig ausfallen wird – und so kommt es auch. Wir konnten die TMU-Domäne der GeForce GTX 280 von 602 MHz auf 648 MHz steigern, während die Shadereinheiten noch mit 1.404 MHz (Standard 1.296 MHz) einwandfrei arbeiten. Die maximal mögliche Frequenz des GDDR3-Speicher liegt bei unserem Exemplar bei 1.260 MHz, was eine Erhöhung von etwa 150 MHz entspricht. Durchschnittlich konnten wir die Leistung so um etwa sieben Prozent steigern, was von Applikation zu Applikation aber variieren kann.
Noch vor einigen Jahren standen sämtliche PCs vor der damals komplizierten Aufgabe, ein DVD-Video zu decodieren. Nachdem damals zuerst die CPU alleine ackern musste, und diese des Öfteren damit überfordert war, kam es bei den Grafikchipspezialisten in die Mode, ihre 3D-Beschleuniger mit speziellen Funktionen auszustatten, um dem Prozessor die Hauptarbeit des Dekodierens abzunehmen. Ein netter Nebeneffekt war, dass die Grafikkarten mit speziellen Algorithmen arbeiten konnten, der die Bildqualität ohne einen großen Leistungsaufwand verbessern konnte. DVDs sind mittlerweile schon längst keine Herausforderung mehr. Ein moderner PC steht mittlerweile vor deutlich schwereren Aufgaben: Das Decodieren von im VC-1- oder H.264-Codec befindlichen HD-Videos, die auf einer Blu-ray oder einer HD DVD aufgenommen worden sind (HD-Trailer haben zwar dieselben Codecs sowie eine identische Bildqualität, allerdings sind diese nicht verschlüsselt, weswegen die CPU-Auslastung um einiges geringer ausfällt). Wir haben uns als Film für „I am Legend“ (1080p, 24 Bilder pro Sekunde) entschieden, der im VC-1-Codec auf einer Blu-ray vorliegt. Wir messen sekündlich die CPU-Auslastung ab dem dritten Kapitel des Films und bilden jede fünfte Sekunde in einem Verlaufsdiagramm ab. Als Vertreter der H.264-Fraktion muss der Actionfilm „X-Men 3“ herhalten (1080p, 24 Bilder pro Sekunde). Für die Messungen haben wir die CPU auf 2,4 GHz heruntergetaktet sowie nur einen einzelnen CPU-Kern aktiv gelassen.
VC-1-Wiedergabe
Angaben in Prozent
|
Laut Angaben von Nvidia gibt es bei der GeForce-GTX-200-Serie bezüglich der HD-Videowiedergabe keine Verbesserungen gegenüber der GeForce-9000-Serie, da mit dem Video Processor 2, kurz VP2, derselbe Videoprozessor wie bei den Vorgängerkarten verbaut wird. Unterschiede in der Bildqualität gibt es also keine, was wir auch bestätigen können. Dafür können wir der GeForce GTX 280 jedoch eine leicht verbesserte CPU-Entlastung während des Abspielens eines HD-Films attestieren, auch wenn der Leistungssprung nicht dazu reicht, an den Unified Video Decoder (UVD) einer Radeon-HD-3000-Karte von ATi heranzukommen.
Beim H.264-Codec liegt die GeForce GTX 280 durchschnittlich 14 Prozent vor der GeForce 9800 GTX, während man sich der Radeon HD 3870 mit einer Differenz von nur drei Prozent knapp geschlagen geben muss. In einem VC-1-Video kann sich die GT200-GPU nur noch um fünf Prozent von dem Vorgänger absetzen, während man sich dem RV670-Chip auf der ATi-Karte geschlagen geben muss, da der VC-1-Codec immer noch nicht vollständig auf der GPU beschleunigt werden kann. Der Rückstand beläuft sich auf satte 74 Prozent. Probleme während der Wiedergabe gibt es dennoch keine.
H.264-Wiedergabe
Angaben in Prozent
|
Neben der Leistung, der Bildqualität und den sonstigen Eigenschaften einer modernen Grafikkarte spielt der Preis für die meisten Käufer eine entscheidende Rolle. Denn was nützt einem die schnellste GPU, wenn sie schlicht unbezahlbar ist? Aus diesem Grund haben wir ein Diagramm mit allen 3D-Beschleunigern aus dem Testparcours zusammengestellt und die günstigsten Preise bei Geizhals [12] herausgesucht. Dabei wird der Preisindex nicht nur nach dem günstigsten Preis erstellen, die Hardware muss auch erhältlich sein. Wir weisen darauf hin, dass sich der Preis der bevorzugten 3D-Karte täglich ändern kann, weswegen eine dauerhafte Korrektheit nicht garantiert werden kann. (Stand der Preise: 15.6.2008)
Preistabelle
Angaben in Euro (aufsteigend)
|
Die unverbindliche Preisempfehlung von Nvidia liegt für eine GeForce GTX 280 bei 550 Euro. Der kleinere Bruder GeForce GTX 260 sollte dagegen etwa um die 310 Euro kosten. Auch wenn wir den genauen Marktpreis der beiden 3D-Beschleuniger noch nicht kennen, gehen wir davon aus, dass sich die Kosten für das Flaggschiff kurz nach dem Launch bei etwa 500 Euro einpendeln werden. Die GeForce GTX 280 sollte noch diese Woche gut verfügbar sein, während die GeForce GTX 260 im laufe der nächsten Woche aufschlagen wird.
Im Folgenden wird nun das Preis-Leistungs-Verhältnis der im Test vertretenen Karten bestimmt. Dabei wird das Performance-Rating durch den Preis dividiert und mit 1000 Multipliziert. In Abhängigkeit zur höchsten Punktzahl, die automatisch mit 100 % angesetzt wird, ergeben sich die übrigen Verhältnisse. Das Ergebnis repräsentiert die Leistung, die man kaufmännisch gerundet für einen Euro erhält. Das Preis-Leistungs-Verhältnis wurde für verschiedene Auflösungen und Qualitätseinstellungen ermittelt.
Preis/Leistung 2560x1600 4xAA/16xAF
Angaben in Prozent
|
Mehr als anderthalb Jahre hat es nach der Präsentation der G80-GPU gedauert, bis der Grafikchipspezialist Nvidia eine wirklich neue Grafikkartengeneration in Form der GeForce-GTX-200-Serie auf den Markt gebracht hat. Zwar baut der GT200 erneut auf die G80-Architektur auf, jedoch hat man im Gegensatz zum G92 diverse Veränderungen vorgenommen, die neben der Spielegeschwindigkeit vor allem die GPU-Computing-Performance erhöhen sollen. Wir hatten nun einige Tage lang die Möglichkeit, das neue Flaggschiff, die GeForce GTX 280, auf Herz und Nieren zu prüfen.
Es war bereits von vornherein klar, dass es ohne Anti-Aliasing sowie der anisotropen Filterung schwer für die GeForce GTX 280 werden würde, sich von den Vorgängern abzusetzen. Dafür limitiert in vielen Fällen selbst eine auf 4 GHz übertaktete Quad-Core-CPU zu sehr. So liegt in 1280x1024 die neue Single-GPU-Karte sieben Prozent hinter der GeForce 9800 GX2 zurück und kann sich um 41 Prozent von der GeForce 8800 Ultra absetzen. In 1600x1200 sinkt der Rückstand zur Dual-GPU-Karte auf fünf Prozent, während die Differenz zum Ultra-Modell auf 45 Prozent ansteigt.
In 2560x1600 fühlt sich die GeForce GTX 280 so langsam pudelwohl, da die GT200-GPU mit einem veränderten Z-Cull-Verhalten und einer verbesserten Kompression auf höhere Auflösungen getrimmt worden ist. Die GeForce 9800 GX2 kann sich nur noch um unspürbare drei Prozent absetzen. Die GeForce 8800 Ultra liegt um gute 51 Prozent zurück. Mit den beiden qualitätssteigernden Features schafft es die GeForce GTX 280 in der Auflösung 1280x1024 erstmals, knappe zwei Prozent schneller als die GeForce 9800 GX2 zu rendern. Die GeForce 8800 Ultra verrichtet um 45 Prozent langsamer ihre Arbeit.
In 1600x1200 kann die GeForce GTX 280 den Vorsprung auf akzeptable 14 Prozent ausbauen, wobei die GeForce 8800 Ultra mit einer Differenz von 48 Prozent ein hartnäckiger Verfolger bleibt. In 2560x1600 sieht die GeForce 9800 GX2 mit einem Rückstand von 27 Prozent dann nur noch die Rücklichter der GT200-Karte. Die GeForce 8800 Ultra muss mit einer Differenz von 58 Prozent nun endgültig abreißen lassen.
Gespannt waren wir auf die Ergebnisse des acht-fachen Anti-Aliasing, da die G80- und G92-Architektur in der Disziplin immer große Nachteile gegenüber den RV670-Derivaten von ATi hatte. Zwar ist auch der GT200 kein Meister von 8xMSAA, der Chip erledigt seinen Job aber bedeutend besser als die Vorgänger. In 1280x1024 rendert die GeForce GTX 280 satte 48 Prozent schneller als die GeForce 9800 GX2 und 64 Prozent schneller als die GeForce 8800 Ultra. In 1600x1200 verkleinert sich die Differenz zur GeForce 8800 Ultra interessanterweise auf 57 Prozent, während die GeForce 9800 GX2 aufgrund des zu geringen Speichers weit zurück fällt. Mit der GeForce GTX 280 sind einige Spiele gar in 2560x1600 und acht-facher Kantenglättung recht flüssig spielbar – eine Premiere! Oft reicht die Performance dazu aber dann doch nicht aus.
Obwohl GPU-Computing mit CUDA ein noch neues Gebiet ist, auf dem es momentan weder viel Erfahrungen noch viele Anwendungsprogramme gibt, so wussten die Folding@Home- und die BadaBOOM-Software zu gefallen. Die Rechenleistung für CUDA und GPU-Computing scheint Nvidia auf der GT200-GPU stark erhöht zu haben, denn anders ist der schier riesige Vorsprung zur Radeon HD 3870 nicht zu erklären. Eine Quad-Core-CPU hat in Folding@Home nicht den Hauch einer Chance gegen den GT200, dasselbe gilt in nicht ganz so immensem Ausmaß beim Transcodieren eines Videos.
Kritik gefallen lassen muss sich Nvidia für das verbaute Kühlsystem, das leider alles andere als leise agiert. Schon unter Windows ist eine GeForce GTX 280 gut von den restlichen Komponenten zu unterscheiden. Zwar ist die Lautstärke nicht störend, allerdings zeigen sowohl die Konkurrenz als auch die Vorgängerkarten, dass es deutlich besser geht. Unter Last zeigt sich der Lüfter dann als kleiner Radaumacher, obwohl die GPU-Temperatur die 80-Grad-Schwelle nicht überschreitet. Für lautstärkeempfindliche Naturen ist die GeForce GTX 280 ohne Zweifel zu laut. Ein weiterer Nachteil ist die fehlende Direct3D-10.1-Unterstützung – auch wenn die dazu nötigen Programme derzeit noch Mangelware sind, so weiß man nie, ob man in den nächsten Monaten von der neuen API profitieren könnte.
Loben muss man Nvidia dagegen für den neu eingeführten Stromsparmechanismus im 2D-Modus, der den Verbrauch nicht ins Unendliche nach oben schießen lässt. Zwar funktioniert der Modus nicht so effektiv wie der auf einer Radeon-HD-3000-Karte (wobei man hier einen Treiber-Bug als Begründung angibt), Nvidia geht aber zumindest den Schritt in die richtige Richtung und bietet zudem mit Hybrid-SLI die optimale Lösung an. Unter Last zeigt sich der 3D-Beschleuniger dann schonungslos und zieht nochmals 20 Watt mehr aus der Leitung als eine GeForce 8800 Ultra.
Die GeForce GTX 280 hat es wahrlich nicht leicht. Der Grund dafür ist eigentlich nicht in der Grafikkarte selbst zu suchen, sondern in der Vorgänger-GPU, dem G80. Diese war nicht nur damals erstaunlich rechenstark, sondern ist selbst heutzutage immer noch eine gute Alternative – so etwas hat es seit dem R300 von ATi nicht mehr gegeben. Dementsprechend schafft es die GeForce GTX 280 zwar, sich von der GeForce 8800 Ultra und der GeForce 9800 GX2 (vor allem in hohen Qualitätseinstellungen) akzeptabel absetzen zu können, jedoch ist die Differenz nicht so groß wie zum damaligen Launch der GeForce 8800 GTX gegen die GeForce 7950 GX2.
Und genau das haben viele erwartet, wobei die Hoffnungen vor allem durch die lange Wartezeit und die eindrucksvollen Gerüchte geschürt worden sind. Es war für den GT200 von Beginn an kaum möglich, dieses zu hoch gesteckte Ziel zu erreichen. Realistisch betrachtet bietet die GeForce GTX 280 dem Käufer eine sehr hohe Spieleperformance auf Niveau der GeForce 9800 GX2 oder gar höher, ohne mit den ständigen Multi-GPU-Nachteilen wie zum Beispiel den notwendigen SLI-Profilen oder Mikrorucklern leben zu müssen. Die erträumte doppelte Performance zur GeForce 8800 Ultra bleibt weiterhin nur Wunschdenken.
Nvidia hat bei dem GT200 viel Arbeit in das GPU-Computing mittels CUDA gesteckt, was den Kaliforniern ersten Tests zu Folge gelungen ist. Die GeForce GTX 280 scheint sämtliche Konkurrenz weit hinter sich zu lassen und einen großen Performancesprung gegenüber der Vorgängergeneration gemacht zu haben. Es fehlt jedoch noch die eigentliche Software, um eine (wahrscheinliche) Stärke der GeForce-GTX-200-Karten zeigen zu können. Das soll sich in den nächsten Wochen laut Nvidia aber ändern, weswegen es derzeit nur schwer möglich fällt, ein wirkliches Fazit über die Grafikkarte zu ziehen.
Eine Enttäuschung ist die GeForce GTX 280 auf jeden Fall nicht, aber auch nicht die erhoffte (und unrealistische) Geschwindigkeitsrakete. Stattdessen hat Nvidia mit der GT200-GPU ein ordentliches Produkt abgeliefert, das sein wahres Potenzial erst in Zukunft wird zeigen können. Aber auch bis dahin führt für Enthusiasten kaum ein Weg an einer GeForce GTX 280 vorbei. Die GeForce 9800 GX2 ist aufgrund der Multi-GPU-Nachteile auf jeden Fall keine Alternative – selbst wenn der Preis niedriger ist.