Einleitung
Integrierte Grafik ist für viele, die sich mit der Materie beschäftigen und den PC nicht ausschließlich zum Surfen im Internet, als E-Mail-Station und bessere Schreibmaschine nutzen, ein direkter Disqualifikationsgrund bei modernen PCs. Nun kann sich aber CPU-Gigant Intel dank integrierter Grafik auch in diesem Bereich „Marktführer“ schimpfen und bietet die in Sachen Kostenersparnis und Leistungsaufnahme kaum zu schlagende Lösung sowohl im Desktop- als auch im Notebook-Markt mit großem Erfolg an. Zwar gibt es auch von ATi und nVidia, den beiden Platzhirschen bei sogenannten „diskreten“ (aus dem Englischen im Sinne von „separaten“) Grafiklösungen, integrierte Grafik, aber beiden ist damit nicht so ein Erfolg beschieden, wie es Intel vormachen kann. Aus diesem Grunde gibt es seit einiger Zeit nun nochmals abgespeckte, separate Grafiklösungen zwischen dem Low-Cost- und integrierten Grafiksegment. Im Gegensatz zum normalen Einsteigerbereich sind diese Lösungen, die auf die klangvollen Namenszusätze „TurboCache“ und „HyperMemory“ hören, zusätzlich zu den normalen Einschränkungen, die sich auf die allgemeine Leistungsfähigkeit im Vergleich zu teureren Lösungen auswirken, noch in ihrer Speicheraustattung beschnitten.
Die Austattung mit lokalem Speicher wurde wohl als interessanter Kostenfaktor für die Grafikkartenhersteller von ATi und nVidia ausgemacht, da Einsparungen in diesem Bereich zusätzlich zu einem möglichst günstigen Grafikkartenpreis den Vorteil haben, nicht das Portemonnaie der GPU- sondern vielmehr das der Speicherhersteller durch geringere Umsätze zu belasten.
Nachdem mit dem mittlerweile nicht mehr aktuellen AGP-Standard lediglich die Möglichkeit gegeben war, dynamisch aus dem Hauptspeicher Texturen zu nutzen, was sich aus Performancegründen bereits vor Jahren als uninteressant herausstellte, eröffnete die letztjährige Ankunft von PCI Express und der darin enthaltenen „PEG“-Ausbaustufe (PCI Express for Graphics) mit 16 sogenannten „Lanes“ weitere Möglichkeiten. So ist es mit den aktuellen HyperMemory- und TurboCache-Techniken möglich, Teile des Hauptspeichers zu allem zu nutzen, wofür auch der normale Grafikkartenspeicher herhalten muss. Der verbaute lokale Speicher dient lediglich als Beschleuniger (eben als „TurboCache“ oder „HyperMemory“) und es sind von S3 Graphics, die mit ihren PCI-Express-Produkten eine solche Technik ebenfalls nutzen wollen, bereits Ankündigungen ergangen, komplett auf lokalen Speicher verzichten zu wollen („Zero-Framebuffer“). Interessant wurde diese Technik zum Einen durch die seit Jahren immer weiter steigende Speicherbandbreite des Hauptspeichers, die allerdings auch die CPU gern für sich haben möchte, andererseits durch die Fähigkeit von PCI-Express, im Full-Duplex-Modus zu arbeiten. Mit den aktuell verfügbaren 16 Gassen sind Transferraten von bis zu 4 GByte pro Sekunde möglich (abzüglich einiger Prozent Kommando-Overhead) – im Gegensatz zu AGP aber gleichzeitig in Richtung vom Hauptspeicher zur Grafikkarten, als auch von der Grafikkarte zum Hauptspeicher. Diese Bandbreite, die zwar noch mit der CPU und anderen „Verbrauchern“ geteilt werden muss, beträgt bei aktuellen Chipsätzen bereits über 8 GByte/s. Werte, von denen Einsteigerkarten mit schmalem 64-Bit-DDR-Interface und Taktraten von üblicherweise um die 200 MHz in der Regel weit entfernt sind.
Wie groß der Vorteil dieser aktuellen Spar-Karten gegenüber integrierten Lösungen wie denen von Intel heute ist, wollen wir in diesem Review klären. Lohnt sich das Aufrüsten von quasi geschenkter, weil mitgelieferter, integrierter Grafik auf die im 50-Euro-Bereich angesiedelten TurboCache- und HyperMemory-Produkte und wenn ja, was kann man von ihnen erwarten? Oder ist es eventuell doch sinnvoller, einen höheren Betrag zu investieren und im Bereich knapp unter 100 Euro bereits echte Spiel-Karten zu erstehen?
Der Platzhirsch
Intel GMA900 und GMA950 (onboard)
Intel bietet seit langer Zeit bereits Grafikeinheiten an, die in die eigenen Mainboard-Chipsätze integriert sind. Seit der Einführung von DDR2-Speicher, dem Sockel 775 und der i9xx-Chipsatzgeneration kann sich die integrierte Grafiklogik rühmen, über Pixelshader-Einheiten nach dem DirectX-9-Mindeststandard zu verfügen. Konkret bedeutet das, dass selbst graphisch anspruchsvolle, aktuelle Spiele theoretisch ausgeführt werden können, ohne den Detailgrad drastisch senken zu müssen.
Um nicht nur in Punkto Features sondern auch in der allgemeinen Darstellungsgeschwindigkeit glänzen zu können, erhöhte Intel den Takt des Grafikkerns auf maximal 333 MHz bei der GMA900, die im i915G-Chipsatz zum Einsatz kommt und runde 400 MHz für die GMA950 im i945G, dem Refresh des bereits über ein Jahr alten Vorgängers. Mit diesen 333 respektive 400 MHz werden vier Rendering-Pipelines betrieben, die über jeweils eine TMU verfügen. Zudem kommt eine Technologie namens „Zone Based Rendering“ zum Einsatz, die ähnlich dem Tile-Based-Rendering von PowerVRs Kyro-Chips geeignet ist, die lokale Speicherbandbreite zu entlasten und insbesondere die bandbreitenintensiven Z-Buffer-Zugriffe zu reduzieren. Dies ist nötig, da integrierte Grafik im Allgemeinen nicht über ein eigenes Speicherinterface verfügt, sondern sich den vorhandenen Hauptspeicher mit den Zugriffen von CPU und restlicher Northbridge teilen muss.
Doch Vorsicht! Die ebenfalls in Notebooks verbaute GMA900 taktet in Abhängigkeit von anliegender Kernspannung und Speicherbestücktung von 133 bis 333 MHz und in manchen Notebooks ist die schnellste Betriebsstufe gar nicht implementiert, so dass mit einem potentiellen Leistungsverlust von knapp 40 Prozent gegenüber dem Nennwert gerechnet werden muss. Ferner verfügt der Chip über die Möglichkeit, Texturen bis zu 4:1 bilinear-anisotrop zu filtern. Bei Verzicht auf Anisotropie ist auch herkömmliche, trilineare Filterung möglich.
Was leider nicht den Weg in die Grafikeinheiten der i9xx-Chipsätze gefunden hat, ist eine Vertexeinheit. Nicht einmal eine softwareseitige Emulation wird DirectX hier vorgesetzt, so dass sich quasi nur eine halbe DirectX-9-GPU benutzen läßt. Das Nichtvorhandensein einer Vertexemulation im Treiber kann auch Probleme in Sachen Softwarekompatiblität verursachen, da üblicherweise Pixel- und Vertexeinheiten zusammen vorhanden sind. Wenn sich eine Software darauf verläßt, können die entsprechenden Vertexaufrufe ins Leere laufen oder aber die Pixelshader der Chipsätze nicht genutzt werden – je nachdem, was die jeweilige Software prüft.
Hier sollte Intel, die sich zwar an den Standard halten, der Situation vielleicht etwas entgegen kommen. So wirken die Pixelshader als Beigabe und reines Prestigeobjekt, um später einmal Windows „Vista“-Kompatibilität auf die Werbeprospekte drucken zu können. Außerdem werden Freunde der Vollbild-Kantenglättung hier enttäuscht sein, denn kein einziger Modus wurde im Treiber angeboten und ist vermutlich auch nicht in der Hardware vorgesehen.
Beispielhaft haben wir einmal die Northbridge im MSI-Board freigelegt, die den Grafikkern beherbergt. Der Chip, der die Grafikeinheit quasi nebenbei beherbergt, mißt per Lineal etwa 12 x 9 mm (108 mm²) und läßt sich, wie die Referenzboards von Intel zeigen, unter Zuhilfenahme der Abluft aus dem Prozessorkühler, auch in der größeren Ausbaustufe i945G semi-passiv kühlen.
Die Herausforderer
ATi Radeon X300 SE 128 MB und 256 MB mit HyperMemory
Angekündigt vor beinahe einem Jahr und danach wieder in der Versenkung verschwunden, gibt es mittlerweile einige HyperMemory-Produkte in den Regalen der Händler zu erstehen. Außer einem teilweise arg knapp anmutenden Speicher gibt es keine offensichtlichen Unterschiede zu den normalen Radeon X300 SE-Karten. So sind auch die HyperMemory-Modelle mit zwei vier-plus-einkanaligen Vertexshadern (Vector4- und Skalar im Parallelbetrieb, aber keine Vector5-Operationen) und einem Pixelprozessor mit vier Renderingpipelines, 3:1-Splitmöglichkeit (Vector4 oder Vector3- plus Skalaroperation), separater Textur-ALU, sowie vier ROPs, die jeweils ein Farb- und Z-Sample oder im MSAA-Modus zwei Z-Samples zugleich berechnen können, ausgerüstet. Der Kern taktet, soweit bekannt, stets mit 325 MHz, eine passive Kühlung ist eher die Regel als die Ausnahme. Das Speicherinterface arbeitet im DDR-Verfahren und kann 64 Bit zeitgleich übertragen. Damit wird bei 200 MHz eine Speicherbandbreite von 3,2 GByte/s erreicht, die 300-MHz-Modelle schaffen hier nach Adam Riese mit 4,8 GByte/s also rund 50 Prozent mehr.
Was genau nun die HyperMemory-Modelle außer dem Weniger an lokalem Speicher und der Fähigkeit, den System- als Videospeicher zu nutzen, auszeichnet, ob und welche Veränderungen an den nach wie vor mit 24 Bit pro Kanal arbeitenden Recheneinheiten nötig waren, dazu schweigt sich ATi leider aus. Gefertigt werden die GPUs in einem 0,11µ-Prozess bei der taiwanischen Chipschmiede TSMC. Die Transistorzahl soll bei runden 75 Millionen liegen und die Fähigkeiten des 8,5 x 9,5 mm (~80 mm²) großen Chips unterscheiden sich ansonsten nicht von denen der Radeon 9550/9600. Das bedeutet, vollständige Erfüllung der Voraussetzungen für Shader-Modell 2.0, bis zu 6-Sample-Sparsed-Grid Multi-Sampling Anti-Aliasing mit Gamma-Anpassung an einen Gammawert von 2,2, 16:1 anisotrope, winkelabhängige Texturfilterung, kein vollständig implementiertes HyperZ (die dritte und größte Stufe des HierarchicalZ-Buffers fehlt) und die Fähigkeit, Einsparungen an der Texturfilterung auf Sample-Basis vorzunehmen. Die Pixelshader sollen per DXVA (DirectX Video Acceleration) die CPU bei der Wiedergabe unter anderem von hoch aufgelöstem WMV9-Videomaterial unterstützen.
Es existieren Modelle mit 32 MByte lokalem RAM, die bis zu 128 MB aus dem Hauptspeicher nutzen können (HyperMemory 128MB) und Karten mit den vollen 128 MByte normaler X300 SE-Karten, die sich bis zu 256 MB Hauptspeicher genehmigen können. Die Karten werden aktuell zu Preisen um die 50 Euro verkauft.
Diese Karte erreicht uns direkt von ATi und bot eine HyperMemory-Unterstützung von 128 MByte und damit 32 MByte lokalen Framebuffer in µ-BGA Bauform und 2,86ns Zugriffszeit. Die GPU taktete mit 338 MHz, der Speichertaktgeber schwang 311 Millionen mal pro Sekunde, war mit 64 Bit Breite angebunden und es wurden auf- und absteigende Signalflanken genutzt (DDR-Verfahren). Diese Taktfrequenzen waren jedoch wohl etwas zu optimistisch gewählt, denn bereits im ersten versuchsweisen Durchlauf durch den 3DMark03 gab es reproduzierbare Abstürze im zweiten Gametest. Weil wir zum Recherchezeitpunkt auch kein entsprechend getaktetes Modell bei den Boardpartnern von ATi finden konnten, setzten wir die Taktraten manuell auf die Werte eines erhältlichen Asus-Modells mit 325/292 MHz. Die Signalqualität war nach Inaugenscheinnahme an unserem Testmonitor, einem Eizo T965, auch jenseits von 1280x1024 Bildpunkten im 2D-Modus gut, sofern entsprechend hochwertige BNC-Verkabelung verwendet wurde. Ein TV-Out wird geboten, Besitzer digitaler Flachbildschirme mit DVI-Eingang (oder entsprechend ausgerüsteter CRT-Monitore) werden von diesem Modell allerdings suboptimal bedient, denn ein DVI-Anschluss fehlt.
Das oben beschrieben Modell haben wir zu Ansichtszwecken nach Ende der Tests ebenfalls seines Kühlkörpers beraubt und zum Vorschein kam die ansprechend klein geratene RV370-GPU in gewohnt makellos-glatter Optik.
Von connect3D erreichte uns dieses Modell der Radeon X300 SE HyperMemory, die mit 128 MByte lokalem TSOP-II-Speicher (Zugriffszeit: 3,3ns) ausgestattet war und über Taktraten von 325/300 MHz verfügte. Dies allerdings erst, nachdem es sich herrausstellte, dass eine 32-MByte-Karte gegen ein 64-MByte-Modell in einigen Situationen überfordert war und wir hier kein verzerrendes Abbild der Kräfteverhältnisse abliefern wollten.
Komplett ausgestattet mit DSub-Anschluss, TV- und DVI-Out sowie einem angemessen großflächigen, passiven Kühlkörper wurde diese Karte überdies von uns mißbraucht, um die mehrheitlich erhältlichen Hypermemory-Modelle mit nur 200 MHz Speichertakt zu simulieren.
nVidias GeForce 6200 supporting 256 MB mit TurboCache
Im Gegensatz zu ATi behauptet Nvidia, die Rendereinheiten des der GeForce 6200 zu Grunde liegenden NV44-Chips seien zusätzlich und über den Level einer reinen Softwarelösung hinaus, um einen so genannten „Turbo Cache Manager“ und die Fähigkeit, direkt in den Hautspeicher zu rendern, erweitert worden. Ob das der Wahrheit entspricht, können wir nicht überprüfen, wohl aber, ob es sich zum Vorteil des Kunden auswirkt.
Ansonsten ist der Chip zumeist passiv gekühlt erhältlich und mit drei Vertexprozessoren und einem Pixelprozessor, bestehend aus vier Renderingpipelines mit 4:1- und 2:2-Split (eine Vector4-, eine Vector3- plus Skalar-, oder zwei Vector2-Operationen parallel), zwei ALUs und einer Textur-ALU, an die erste ALU gekoppelt, die allesamt mit 32 Bit Präzision pro Kanal rechnen können und die Voraussetzungen für eine Klassifizierung „Shader Model 3“ erfüllen, ausgestattet. Er verfügt über ein Speicherinterface, das nach dem DDR-Prinzip arbeitet und 64 Bit breit ist. Ferner sind zwei ROPs verbaut, die zeitgleich ein Farb- und ein Z-Sample berechnen können. Es fehlen aber augenscheinlich die Fähigkeiten der mächtigeren Vertreter der Geforce6/7-Familie, pro Durchgang zwei Z-Samples zu berechnen (Teil des als „Ultra-Shadow II“ beworbenen Paketes, die im Umlauf befindlichen Präsentationen suggerieren ein Vorhandensein dieses Features, erwähnen zumindestens jedoch nicht dessen Fehlen), Floating-Point-Texturfilterung mit 16 Bit Genauigkeit pro RGBA-Kanal (gesamt 64 Bit) in den TMUs und FP16-Alpha-Blending in den ROPs durchzuführen (GF6200 Modelle explizit als Ausnahmen erwähnt), sowie sämtliche Kompressionsfunktionen für Z-, MSAA- und Framebuffer (Teil des als „IntelliSample“ beworbenen Paketes, GF6200-Modell explizit als Ausnahmen erwähnt).
Fähig ist die Geforce 6200 TC dagegen zu Einsparungen in den verwendeten Samples bei iso- und anisotroper Texturfilterung. Diese kann bis zu 16:1 anisotrop durchgeführt werden. Es stehen 2x und 4x Rotated Grid-Multisampling Anti-Aliasing und ein als „Quincunx“ bezeichneter Blurmodus zur Verfügung. Auf die von den restlichen Geforce6- und -FX-Karten bekannten Mischungen aus Multi- und Supersampling-FSAA muss hier offiziell verzichtet werden. Inoffiziell sind sie über externe Programme (wie nHancer, Riva- oder a-Tuner) weiterhin verfügbar. Ein bereits in der Geforce 6800 angekündigter, dort jedoch nur teilweise funktionsfähiger, dedizierter Videoprozessor soll die CPU bei der Dekodierung einer Vielzahl, insbesondere hoch aufgelöster Videoformate unterstützen.
Es existieren Modelle mit 16, 32 und 64 MByte lokalem Framebuffer, die irreführender Weise jeweils die vierfache Menge an Speicher in der Namensbezeichnung tragen. Wir testen das Top-Modell, repräsentiert durch ein Serienexemplar von Leadtek, welches aktuell für etwa 54 Euro den Besitzer wechselt.
Die Geforce 6200 Turbocache, die über 64 MByte lokalen, mit 275 MHz und damit entsprechend der verbauten 3,6ns-Speichermodule getakteten TSOP-II-Speicher verfügt, kommt mit einer GPU-Frequenz daher, die stattliche 350 MHz beträgt. Der Chip selbst wird von TSMC in einem 0,11µ-Prozess gezüchtet und misst 10 x 10,5 mm (105 mm²). Wie die ATi-Modelle und natürlich die integrierten Grafikeinheiten präsentiert sich der Nvidia-Vertreter, vertreten durch eine Serienkarte von Leadtek, passiv und damit geräuschlos gekühlt. In diesem Punkt gibt es in unserem hiermit abgeschlossenen Testfeld also einen Gleichstand zu vermelden. Der Vorteil für die integrierte Grafik, ein ergonomischeres, weil geräuschloses Arbeitsumfeld zu produzieren, fällt hier also weg.
Auch ansonsten gibt es an der Ausstattung nichts zu bemängeln, bis auf den fehlenden Video-Eingang – den allerdings keine Lösung unseres Tesfeldes bietet – sind alle üblichen und notwendigen Anschlüsse, wie DSub-, DVI- und TV-Ausgang vorhanden. Die Signalqualität erschien minimal schlechter, als die des ATi-Referenzmodells, aber wiederum leicht besser, als die der connect3D-Karte. Dazu sei gesagt, dass keiner der Probanden ein Problem mit der 1280er Auflösung hatte; erst in 1600x1200 Bildpunkten trennte sich die Spreu vom Weizen.
Testsystem
Zum Test kommt ein aktuelles Testsystem auf Pentium 4-Basis mit HT-Support zum Einsatz. Wir haben uns mit Absicht nicht für die höchsten verfügbaren Ausbaustufen des Pentium 4 entschieden, sondern die Leistung im eher gemäßigten und in Komplettsystemen häufig anzutreffenden Bereich gehalten.
Hier ein kleiner Überblick über das System:
- CPU:
- Pentium 4 540 (3,2 GHz Prescott-Kern, 1 MByte Level2-Cache, 200MHz FSB QDR)
- Motherboard:
- MSI i915G Neo2 Platinum (MS-7028) mit i915G-Chipsatz (int. Grafik: Intel GMA900)
- Intel D945GTP mit i945G-Chipsatz (int. Grafik: Intel GMA950)
- Arbeitsspeicher:
- 2*512MB Samsung PC4200 DDR2-533 mit 4.0-4-4-10 Timings
- Grafikkarten:
- ATi Radeon X300 SE 128 MB HyperMemory 32 MB DDR-RAM (BGA), 338 MHz GPU / 311 MHz VRAM*
- Connect3D Radeon X300 SE 256 MB HyperMemory 128 MB DDR-RAM (TSOP), 325 MHz GPU / 300 MHz VRAM
- Emulierte Radeon X300 SE 256 MB HyperMemory 128 MB DDR-RAM (TSOP), 325 MHz GPU / 200 MHz VRAM**
- GeForce 6200 TurboCache 64 MB DDR-RAM (BGA), 350 MHz GPU / 275 MHz VRAM
- GMA900, kein eigenes VRAM, bis zu 128 MB des Hauptspeichers, 333 MHz GPU-Takt
- GMA950, kein eigenes VRAM, bis zu 128 MB des Hauptspeichers, ~400 MHz GPU-Takt***
Alle Grafikkarten waren per PCI Express-Verbindung mit 16 Lanes an Northbridge, Hauptspeicher und CPU gekoppelt. - Peripherie
- 160 GB Hitachi-SATA-Festplatte mit 7200 rpm, 8 MB Cache)
- Pioneer DVD A03S
- Onboard-Audio (MSI: Soundmax; Intel: Realtek ALC880)
- Onboard GBit-LAN (MSI: Broadcom/ Intel: Intel)
- Software
- WindowsXP Professional SP2
- Managed DirectX 9.0c
- .NET-Framework 1.1
- Treiber
- ATi: Catalyst 5.6 mit CCC
- nVidia: ForceWare 71.89
- Intel: Treiber v. 6.14.10.4299
* Die Karte lief mit den ausgelieferten Taktraten nicht stabil, schon der erste Durchlauf durch den 3DMark03 brach reproduzierbar ab. Wir takteten dieses Modell auf die im Handel erhältliche Frequenz von 325/292 MHz herunter, womit sie stabil zu betreiben war.
** Zum Recherchezeitpunkt gab das Internet keinerlei Hinweise auf HyperMemory-Karten, die mit den angegebenen Taktraten dieser Karte ausgeliefert würden. Erst nach einer Anfrage an ATi wurden wir auf eine zwischenzeitlich aktualisierte Version der Connect3D-Website verwiesen, die die Karte mit den gelisteten Taktraten aufwies. Laut ATi habe man an die Boardpartner deutlich kommuniziert, dass HyperMemory-Karten mit 128 MByte über eine Speichertaktrate von 300 MHz verfügen sollen. Im Handel scheinen sich jedoch auch noch Versionen mit nur 200 MHz zu befinden, so daß wir diese Version hier in der Emulation mittesteten, indem die Connect3D-Karte schlicht heruntergetaktet wurde.
*** Die uns zur Verfügung stehenden Tools konnten die Taktraten der GMA950 nicht zweifelsfrei auslesen. Die Taktrate sollte jedoch eigentlich 400 MHz betragen haben.
Testbedingungen
Um insbesondere die integrierten Lösungen nicht gleich zu überfordern, haben wir in den Gametests zwei Testläufe gemacht. Einen mit zumeist reduzierter Detailstufe und einen mit höheren Details. Letzterer war jedoch den externen Lösungen vorbehalten, da teilweise Effekte genutzt wurden, die die GMA-Lösungen von Intel nicht darstellen konnten. Ziel dabei war es, Spielbarkeit und Performance in der niedrigsten getesteten Auflösung weitgehend zu erhalten. Details hierzu sind bei den jeweiligen Benchmarks vermerkt.
Zudem wurde auf die gewohnten FSAA- und AF-Benchmark aus dem Grunde verzichtet, weil neben der integrierten Grafik auch die Turbo-Cache und HyperMemory-Lösungen in zu vielen Fällen kaum ausreichende Frameraten zu liefern im Stande wären. Und mit Vergleichen von einstelligen Fps dürfte niemandem gedient sein. Stattdessen haben wir exemplarisch ein Spiel mit ausreichend hohen Fps und ein paar synthetische Benchmarks herausgegriffen und hier das volle AA- und AF-Programm durchexerziert.
Im Gegensatz zu High-End Karten darf angenommen werden (wir tun es jedenfalls), dass Käufer im Preissegment zwischen 40 und 70 Euro eher bereit sind, ein paar Einsparungen an der Filterqualität in Kauf zu nehmen, wenn dadurch das eine oder andere Spiel zusätzlich mit spielbaren Frameraten gesegnet wird (sonst würden sie vermutlich auch mehr Geld für die Grafik zu investieren bereit sein). So ließen wir in diesem Falle, ausser in einigen Qualitätstests, die Treibereinstellungen auf „default“ (Werkseinstellung) und somit die aktivierten Optimierungen. Shaderreplacements, Bugfixes und Cheats unangetastet. Dies soll jedoch keinesfalls bedeuten, daß wir das, was aktuell im High-End Bereich in dieser Sache geschieht, für gut oder auch nur hinnehmbar befinden!
Unsere Screenshots zeigen eine Auswahl der verwendeten Grafikeinstellungen uns sollten nicht allein als der Weisheit letzter Schluss in dieser Hinsicht angesehen werden.
Synthetische Benchmarks
3DMark
Alt aber gut, könnte man fast meinen, wenn man den rührseligen 3DMark 2001SE ansieht. Mit optionaler Nutzung von Vertexshadern der Version 1.1 in den HQ-Tests und der Animation der Blätter über komplexe Vertexshader im „Nature“-Test. Natürlich war der 3DMark 2001SE beliebtes Ziel von Optimierungen der Grafikkartenhersteller, jedoch sollten die übelsten dieser Sorte mittlerweile entfernt worden sein, so dass hier ein guter, kurzer Überblick von heutzutage schon gering zu nennenden Anforderungen entsteht. Interessant, da vermeintlich aktuell, sind die Overbright-Überblendungen im Nature-Test – solcherlei Tricks werden heutzutage gern als „HDR“-Effekte vermarktet und akzeptiert. Echtes „HDR“ verlangt jedoch zumindest nach Floating-Point Genauigkeit mit mindestens 16, eher 32 Bit pro Kanal und ist ergo im 3DMark 2001SE genausowenig zu finden, wie in vielen Spielen, die dies anpreisen. Auch eine Definition, die Präzision sei größer als die üblichen 8 Bit pro Komponente von „HDR“ lehnen wir ab.
3DMark 2001SE v3.30
Angaben in Punkten
|
In allen drei Auflösungen zeigt sich ein ähnliches Bild: Das Triumvirat aus zwei Radeons und einer GeForce dominiert das Testfeld. Die X300 SE mit dem langsam taktenden 128-MByte-Speicher hinkt hinterher und muss sich schlußendlich sogar der GMA950-Grafik von Intel geschlagen geben, obschon diese nicht einmal über Vertexshader in Hardware verfügt. Das ist auch der Grund, warum beide Intel-Lösungen kaum mit steigender Auflösung an Leistung verlieren. Hier limitiert schlicht das Vertexprocessing und das ist nicht von der gewählten Auflösung abhängig.
Zum Zeitpunkt seines Erscheinens aus den unterschiedlichsten Gründen scharf kritisiert, aber auch als Meilenstein in Sachen Grafik und DirectX-9-Nutzung gepriesen, wirkt der 3DMark03 heute, nachdem sich alle Wogen geglättet und die meisten Fakten herauskristallisiert haben, schon eher als interessantes Studienobjekt. Nicht nur deshalb, sondern auch der Komplettierung unserer 3DMark-Sammlung haben wir ihn zwischen seinem Urahnen und dem wesentlich moderneren 3DMark05 mit ins Programm genommen.
Stencil-Schatten, Pixelshader-Nutzung in drei der vier Game-Tests und sogar vereinzelte 2.0-Shader mit Floating-Point Genauigkeit im „Mother Nature“-Test sowie große Mengen an Textur- und Vertexdaten und ein teilweise enormer Polygondurchsatz von über einer dreiviertel Million Dreiecken pro Frame bilden die Anforderungseckdaten dieser Inkarnation der 3DMark-Reihe.
3DMark03 v.330
Angaben in Punkten
|
Einen Sieg auf ganzer Linie fährt die GeForce hier ein – geschuldet vermutlich einer sorgfältigen Abstimmung der Treiber auf diesen Benchmark. Die Abstände zur Konkurrenz aus dreimal Radeon (Ausnahme hier wieder: 1280x1024 kann die GMA950 gegen die mit 325/200 MHz antretende X300 SE gewinnen) sind allerdings alles anders als groß und sollten angesichts der Tatsache, daß es sich hier um einen synthetischen Benchmark handelt, für die Entscheidungsfindung kaum von Bedeutung sein.
Zu den Features der neu entwickelten Engine, auf der 3DMark05 basiert, gehört unter anderem auch die Unterstützung des Shader-Model 2.X und 3.0 aktueller ATi- und nVidia-Karten. Lief 3DMark03 auch noch auf älteren Grafikkarten, ist für die Nutzung des neuesten Teils eine Grafikkarte mit DirectX-9.0-Fähigkeiten essentiell. Der 3DMark05 nutzt eine 2048 x 2048 Bildpunkte große Textur, in die die im Schatten liegenden Pixel gerendert werden, zur Schattenerzeugung. Diese wird unabhängig von der eingestellten Framebuffer-Auflösung erzeugt. Diese ShadowMap wird an ihren Kanten gefiltert – sofern die Hardware dazu vorhanden ist, in Hardware, ansonsten durch eine Approximation durch den Pixelshader. Aktuell ist diese Technik namens „PCF“ (Percentage Closer Filtering) in den GeForce-Karten von nVidia zu finden. Hier wird ein bilinear gefiltertes Sample aus der Shadow- oder Depth-Stencil-Map verwendet, ansonsten vier Point-Samples (ohne Filterung). Zudem gibt es eine weitere Textur für Schatten, die 512x512 Punkte groß und als CubeMap ausgelegt ist. Die größere der Schattentexturen wird in zwei Durchgängen für globale Beleuchtung genutzt, die kleinere CubeMap separat für jedes einzelne Punktlicht. Zusätzlich ist auch die Anzahl der Vertices in den drei Gametests so hoch wie nie zuvor. Teilweise werden über eine Million Dreiecke pro Bild berechnet. So reagiert der neueste Sproß aus Futuremarks Hallen weniger stark auf Änderungen der Auflösung, als seine Vorgänger. Diese Unmengen von Daten sorgen auch für einen selten gesehenen Hunger nach Videospeicher. 128 MByte sollten auf der Karte am besten schon vorhanden sein, damit nicht allzuviel ausgelagert werden muss – ein pikantes Problem speziell in unserem Testfeld!
3DMark05 v1.1
Angaben in Punkten
|
Dem großen Platzbedarf im Video-RAM geschuldet ist die Umsortierung des Klassements im 3DMark05. Die Radeon X300 SE mit nur 32 MByte lokalem VRAM muss sich deutlich geschlagen geben. Die interessante Frage, ob eine GeForce mit 128 MByte hier gegen die mit mehr und schneller taktendem VRAM ausgestatteten Radeons abschneiden würde, ist leider rein akademisch, da eine solche Karte als TurboCache-Variante nicht existiert. So bleibt zu konstatieren, daß die Geforce sich in einem Sandwich aus 128-MByte-Radeons mit dem zweiten Platz begnügen muss. Weiter hinten im Feld gibt es nur den mittlerweile fast obligatorischen Sieg der GMA950 gegen eine Radeon in der höchsten Auflösung zu vermelden.
Füllraten
Shaderfüllrate
Das nützliche kleine Programm „Fillrate Tester“ von Marko Dolenc dient dazu, die Füllraten einer Grafikkarte zu messen. Im Gegensatz zu den bzw. im 3DMark integrierten Füllraten-Tests, die im Fall von Single-Texturing vornehmlich die Bandbreite messen, kann dieses Programm recht differenzierten Aufschluss über verschiedene Arten von Füllrate geben, unter anderem auch die Pixelshader-Füllraten, welche wir hier betrachten wollen. Getestet wurde in 1600x1200 in 32Bit mit 24Bit Z- und 8Bit Stencilbuffer und 60 Hz Refreshrate jeweils ohne jedes FSAA, mit 2-Sample AA und 4-Sample-AA.
Leider verweigerten sich beide GMA-Beschleuniger von Intel diesem Benchmark.
Bereits im ersten Abschnitt, den einfacheren Shadern der Version 1.1 bis 1.4, sowie den grundlegenden 2.0-Shadern, die bereits Fließpunktgenauigkeit erfordern, wird einiges deutlich. Die Turbo-Cache-Karte von nVidia bricht mit aktivem FSAA sehr stark ein, was den Schluß nahelegt, dass man hier nicht nur an den Kompressionsfeatures gespart hat, die MSAA unter anderem so interessant machen, sondern eventuell auch an der Fähigkeit der ROPs (Raster Operators), mehr als ein AA-Sample zugleich zu bearbeiten. Die Radeon-Karten zeigen einen erwartungsgemäß geringen Einbruch bei 2x FSAA und, in Abhängigkeit zur verfügbaren Bandbreite, einen etwas stärkeren, sobald 4-Sample AA aktiv ist. Hier ist also alles im grünen Bereich bei „den Roten“, während „die Grünen“ eher im roten Bereich versacken.
Hier sehen wir ein ähnliches Bild – dramatische Einbrüche in der theoretischen Leistung nur bei der ROP-kastrierten GeForce 6200 TurboCache. Und noch etwas zeigen uns die Tests mit den etwas komplexeren Shadern. Denn nur im Per-Pixel-Lighting Test, wo jedes Pixel individuell berechnet werden muss, kann die GeForce-Karten noch im theoretischen Bereich von ihrer Fähigkeit profitieren, mit halbierter Präzision zu rechnen. Gründe dafür haben wir bereits vor über einem Jahr in unserem Duell der Generationen [1] erläutert. Der Absturz mit aktivem FSAA ist in diesem Teiltest nicht mehr so drastisch, weil die Berechnungen ausreichend komplex geworden sind. So benötigen die Pixel hier mehr als neun Takte im Schnitt bis zur Vollendung, so dass die ROPs nicht mehr das begrenzende Element darstellen.
Texturfüllrate
Dieser Benchmark wurde von PowerVR entwickelt und diente dazu, die Vorzüge des Kyro 2 zu verdeutlichen, da im VillageMark der Overdraw mit einem Faktor von bis zu 10 besonders groß ist. Viele, besonders ältere Grafikkarten, berechnen hier auch die Oberflächen, die durch andere verdeckt sind und daher eigentlich nur verschwendete Bandbreite und Füllrate bedeuten, so dass dieser grafisch eigentlich nicht sehr aufwendige Benchmark doch öfter als man zunächst denkt zu einem Stolperstein wird. Deswegen ist es von größter Bedeutung in diesem Benchmark, eine gut funktionierende Technik zum Entfernen verdeckter Oberflächen (HSR = Hidden Surface Removal) zu besitzen. Getestet wurde mit folgender Kommandozeile: [InstallDir]\D3DVillagemark.exe -benchmark=1 -width=xxxx -height=xxxx -bpp=32"
Mit sämtlichen aktiven Optimierungen kann sich die GeForce 6200 TC von den Radeons deutlich distanzieren. Hier zeigt sich eine weitere Sparmaßnahme. Dieses Mal jedoch wurde auf Seiten ATis gespart und zwar am im Villagemark besonders wichtigen HSR. So bieten die Radeon 9600-Karten, von denen auch die X300 SE in ihrer Hypermemory-Variante ein Derivat ist, seit jeher nur eine abgespeckte Form des effizienten HyperZ-Paketes, welches hier um den hierarchischen Z-Buffer beschnitten wurde. Das kostete im Schnitt alter Messungen (Anhand einer Radeon 9500 Pro, bei der dieses Feature vorhanden, aber über die Registry deaktivierbar ist) rund 10 Prozent Leistung.
Erstaunlich mutet die Leistung der GMA900/950-Architektur, besonders in höheren Auflösungen an. Dies könnte dem kachelbasierten Rendering-Prozess, auf den sich die „Extreme Graphics“ stützt, geschuldet sein, der in hohen Auflösungen den Nachteil eines fehlenden, eigenen Speichers beinahe ausgleichen kann.
Im Modus mit höherer Qualität, in diesem Benchmark durch Abschalten der Treiberseitig erreichbaren Filteroptimierungen verwirklicht, zeigt sich, dass die Verhältnisse in etwa gewahrt bleiben, allerdings auf deutlich niedrigerem Niveau. Die eigentlich aggressiveren Optimierungen seitens nVidia nutzen der GeForce 6200 TC nicht so stark wie ihren großen Geschwistern, da ihr niedriger ROP-Durchsatz hier der maximalen Entfaltung der Pixelprozessorleistung einen Riegel vorschiebt. Allein die Einsparungen durch die geringeren Bandbreitenanforderungen wirken sich in diesem Falle noch positiv aus, so dass sie hier nicht stärker an Leistung verliert, als es ihre großen Geschwister täten.
Der Templemark ist ursprünglich ein Demonstrationsprogramm von PowerVR gewesen. Da er jedoch noch ein paar halbwegs aktueller Features, wie Hardware-TnL, Bump Mapping und bis zu sechs Texturlagen in einem Durchgang unterstützt, eignet er sich auch gut als unabhängiger Benchmark, der garantiert nicht auf nVidia- oder ATi-Chips optimiert ist. Getestet wurde mit folgender Kommandozeile: [InstallDir]\templedemov1-0-6.exe -benchmark"
Mangels der Option, verschiedene Auflösungen einzusetzen, haben wir hier einen ersten Feldversuch mit Anti-Aliasing und anistroper Filterung durchgeführt, weshalb die GMA-Lösungen von Intel nur in der Grundeinstellung mitgetestet wurden, da sie keine Unterstützung für FSAA bieten.
Wie erwartet kann die GeForce in diesem Szenario ob ihrer kaum vorhandenen, FSAA-beschleunigenden Transistoren nur knapp mit der deutlich langsamer taktenden Radeon X300 SE HM mit nur 200 MHz Speichertakt mithalten. Die beiden flotteren Radeons distanzieren sie zum Teil deutlich.
Und zum Abschluss geht es wieder einmal an MDolencs „Fillrate Tester“. Die Settings sind dieselben, wie schon bei der Shaderfüllrate, also 1600x1200 in 32 Bit mit 60 Hz Bildrefresh.
In den etwas unübersichtlichen Graphen wird zweierlei deutlich: Einerseits kann die GeForce wieder einmal erst mit den Radeons mithalten, wenn ihre ROPs als limitierender Faktor ausgeschaltet sind, sprich, wenn es entweder viel zu rechnen, oder wie in diesem Falle, viele Texturschichten zu bewältigen gibt. Auch FSAA scheint dann kein größeres Hindernis in diesem synthetischen Test zu sein. Zweitens scheint es bei den verwendeten Treibern noch ein Problem oder eine Ungereimtheit mit der Bufferzuweisung bei den Radeons zu geben. Nach keinem erkennbaren Muster, jedoch immer reproduzierbar, sind teilweise 4xAA-Werte höher als die entsprechenden 2-Sample-AA Füllraten. Eventuell lagert der Treiber hier unnötigerweise einen/den AA-Buffer via PCI-Express in den Hauptspeicher aus, so dass hier unnötig hohe Leistungseinbußen auftreten. Dem sollte allerdings keine übermäßig große Bedeutung beigemessen werden, da es sich hier um einen rein synthetischen Test handelt. Vollständig erklären können wir dieses Verhalten jedoch nicht.
Z-/Stencilfüllrate
Der Fablemark wurde, wie auch der vorhergehende Templemark, von PowerVR entwickelt und dient mit einem sehr hohen Anteil an transparentem Overdraw der Zurschaustellung der Stärken des Kyro-Chips, was den Stencil-Buffer angeht. Hier kann der Kyro alle für eine seiner Kacheln anfallenden Arbeiten direkt auf der GPU erledigen, so dass etliche, bandbreitenintensive und zeitraubende Speicherzugriffe wegfallen.
Natürlich wird auch auf allen anderen Karten die Stencil-Performance stark gefordert, so dass dieser Test ein Indiz für Spiele sein kann, die vor dem eigentlichen Rendering einen Z-/Stencil-only Pass einlegen, um vorab jeglichen Overdraw zu vermeiden, wie es beispielsweise eine Option in Tomb Raider: Angel of Darkness oder Pflichtprogramm für id-Softwares „Doom 3“ ist Getestet wurde mit folgender Kommandozeile: [InstallDir]\D3DFablemark.exe -benchmark=1 -width=xxxx -height=xxxx -bpp=32"
Noch erstaunlicher als die beobachtete Leistung im VillageMark zeigen sich beide GMA-Lösungen von Intel, die das Feld deutlich beherrschen. Hier kann das Zone-Based-Rendering vermutlich einmal zeigen, was in ihm steckt und ähnlich den Kyro-Chips viele Speicherzugriffe einsparen. Nach den GMAs folgen die Radeons mit hohem Speichertakt. Von 1024x768 auf 1280x1024 zeigt sich zum ersten Mal die Krux des nur 32 MB großen Framebuffers eines der Radeon-Modelle. Hier bricht die Leistung verständlicherweise deutlich ein, sobald der lokale Framebufferspeicher nicht mehr ausreicht, sämtliche Bildinformationen aufzunehmen. Sie fällt somit noch hinter die GeForce und ihr Schwestermodell mit 33 Prozent geringerem Speichertakt auf den letzten Platz zurück. Der GeForce merkt man in diesem Benchmark nichts von ihren beworbenen „Ultra-Shadow“ Qualitäten an. Nur zwei ROPs, keinerlei Z-Compression und niedrige, durch das 64 Bit schmale Speicherinterface bedingte, Bandbreite sind keine Garanten für eine gute Z-/Stencil-Leistung – hier deutet sich unsere Theorie an, dass der Chip nicht über die Fähigkeit verfügt, zwei Z-Samples pro Takt durch jede seiner beiden ROPs zu schleusen.
Ein letztes Mal bemühen wir an dieser Stelle noch Herrn Dolenc, für dessen Geduld wir uns recht herzlich bedanken möchten.
Wie dieser Graph zeigt, scheint es mit den ROPs der GeForce noch schlimmer bestellt zu sein, als angenommen. Auch einige Quermessungen mit auf 300 MHz übertaktetem Speicher zeigten uns erschreckendes. So sind diese 300 MHz Speichertakt offenbar gut für runde 530 Millionen „Zixel“ pro Sekunde. Hätte nun die GeForce 6200 TurboCache, wie angenommen, die Fähigkeit der GeForces geerbt, pro Takt doppelt soviele Z-/Stencil-Operationen zu bewältigen, wie sie Farbwerte schreiben kann, müsste diese Zixelfüllrate bei niedrigerem Chiptakt die Pixelfüllrate übersteigen. In drei Stufen haben wir den Chiptakt auf 300, 200 und schließlich 100 MHz abgesenkt. Heraus kam in keinem der Fälle eine höhere Z- als Pixelfüllrate. So kann hier, da weder verfügbare Bandbreite, noch fehlende Z-Kompression als mögliche Verursacher in Frage kommen, davon ausgegangen werden, dass es sich entweder um einen kapitalen Bock von Treiberbug handelt, oder die Geforce 6200 nicht über die sog. „Double-Z“-ROPs verfügt, sondern nur über zwei einfache ROPs ohne Kompressionsfunktionen und ohne die Möglichkeit zwei AA-Samples pro Takt zu bearbeiten.
Dies dürfte für eventuelle Qualitätseinstellungen ausserhalb der Texturfilterung die nahezu vollständige Unbrauchbarkeit der 6200 TurboCache in modernen, anspruchsvollen Spielen nach sich ziehen.
Anti-Aliasing und anisotrope Texturfilterung
Synthetisch
Die schon besprochenen Demonstrationsprogramme VillageMark und FableMark von PowerVR/Imagination Technologies sollen uns die synthetische Betrachtung der FSAA- und AF-Leistung der Low-Cost-Karten ermöglichen. Beide isolieren recht gut ihr Hauptaufgabengebiet und sind durch die Grafikausgabe in Szenenform bereits einen Schritt weniger abstrakt zu nennen, als die Füllratentests zuvor.
Beide Lösungen von Intel sind nicht in der Lage, FSAA zu aktivieren und bleiben daher diesem Test fern. In den beiden niedrigen Auflösungen ist noch alles, wie es nach der Füllratenmessung zu erwarten war, doch bereits in der 1024er-Auflösung geht der mit nur 32 MByte bestückten Radeon die Puste aus. Hier kann auch die Auslagerung in den Hauptspeicher per PCI Express augenscheinlich nicht mehr helfen, da zu oft auf die verschiedenen Buffer und Texturen zugegriffen wird und sich so die sich addierenden Latenzen als Todesstoß für die Leistung agieren. Ansonsten fahren die Radeons einen ungefährdeten Doppelsieg ein.
Auch mit 4-Sample-AA ändert sich nicht viel an obigem Bild, außer, dass die Geforce noch weiter zurückliegt (was zu erwarten war) und dass die 32-MByte-Radeon bereits in der 800er-Auflösung einbricht (was ebenfalls keine Überraschung darstellt).
Im Villagemark mit 2xFSAA zeigt sich die Geforce wiederum von keiner guten Seite – den letzten Platz gibt sie ab 1280x1024 nur unwillig an die Radeon mit 325/292 MHz ab und hat ansonsten bereits stärkstens mit der um 75 MHz beim Speicher niedriger taktenden Radeon X300 SE HM zu kämpfen.
Auch mit der Abschaltung der Treiberoptimierungen ändert sich das Bild kaum. Zu stark haben die kleinen Karten bereits mit 2xFSAA zu kämpfen, als daß die Texturfilter noch eine entscheidende Rolle spielen könnten.
2:1 anisotrope Texturfilterung erscheint auf den ersten Blick hingegen als die Domäne der Geforce. Deutlich verweist sie hier ihre Konkurrenz auf die hinteren Plätze.
Sobald jedoch die Treiberoptimierungen deaktiviert sind, zeigt sich, daß ein großer Prozentsatz dieses Vorsprungs allein den aggressiveren Einsparungen nVidias am Texturfilter geschuldet sind. Zwar kann die GeForce 6200 TC auch im HQ-Modus den Radeons die Schlußlichter zeigen, allerdings fällt der Vorsprung nur sehr knapp aus.
Max Payne II
Weiter geht unsere, für dieses Preis- und Leistungssegment etwas verkürzte, Betrachtung der FSAA- und AF-Leistung. Hier mit dem immer wieder spielbaren „Max Payne 2: The Fall of Max Payne“. Dieses bietet bei besserer Optik sogar noch flüssigere Frameraten als sein eigener Vorgänger und sorgt so für die Möglichkeit, auch bei unseren heutigen Probanden FSAA und AF nicht anhand akademischer Unterschiede im einstelligen FPS-Bereich beurteilen zu können. Genauere Beschreibungen des durchgeführten Benchmarks gibt es unter dem Hauptabschnitt bezüglich Max Payne 2.
Die reale Anwendung straft die Theorie Lügen. Erstaunlich gut kommt die in den synthetischen Tests abgeschlagen zurückliegende Geforce 6200 hier mit den Anforderungen des Anti-Aliasing zurecht und kann durchgehend den zweiten Platz hinter der X300 mit 325/300 MHz und 128 MByte lokalem Framebuffer halten. Ganz im Gegensatz dazu die Leistung der 32-MByte-Radeon. In 640 noch vermutlich von einem Treiberproblem (das anormale Ergebnis war jederzeit reproduzierbar) gebremst, macht sich ab der zweitniedrigstem Auflösung der Speichermangel bereits bemerkbar. Selbst die mit 200 MHz über deutlich langsamer taktenden Speicher verfügende Schwester kann ihr knapp davoneilen.
Schaltet man noch 2:1 AF hinzu, wird das oben gewonnene Bild noch deutlicher. Die Abstände weiten sich ein wenig – nach oben, wie nach unten. Anisotrope Texturfilterung kostet nicht nur Füllrate, sondern auch Bandbreite, die in Kombination mit FSAA und den hieran notorisch knappen Einsteigerkarten natürlich doppelt schmerzlich zu Buche schlägt.
4-Sample-AA läßt die Geforce erwartungsgemäß auf den vorletzten Platz zurückfallen, unterboten nur noch von dem mit 32 MByte eindeutig zu knapp ausgestatteten Radeon X300-Modell.
Mit Einstellungen, die bereits der Oberklasse würdig wären, führt, wie auch sonst, kein Weg an einer mit sowohl viel, als auch hoch taktendem Speicher ausgestatteten Radeon vorbei. Der Sieg auf ganzer Linie darf allerdings nicht darüber hinwegtäuschen, daß auch sie spielbare FPS höchstens bis zur 1024er-Auflösung liefern kann (den anderen Karten gelingt dies sämtlich nur bis 800x600) und Max Payne 2 ein recht anspruchsloser Vertreter seiner Gattung ist. Durch die aggressiveren Einsparungen am Texturfilter kann die GeForce hier zwar ein wenig dichter aufschließen, als im reinen 4xAA-Modus, kommt aber trotzdem nicht an die langsamere 128-MByte-Radeon heran.
Spiele
Alice
Ein eher selten genutzter Test im Benchmarkparcours ist eigentlich ein alter Hut. American McGee's Alice, wie das Spiel mit vollem Namen heißt, basiert sowohl auf der Quake3-Engine als auch auf einer leicht psychedelischen Version von Alice im Wunderland. Sowohl Polygonzahl als auch Texturdetails wurden gegenüber der Quake3-Urversion erheblich gesteigert, so dass die graphischen Ansprüche für Alice schon ein ganzes Stückchen über dem Original liegen. Getestet wurde das in einem Außenlevel ablaufende und damit aufgrund der Q3-Engine für besondere Schwierigkeiten sorgende Curiosity-Timedemo mit den maximalen Details, die im Spiel vorgesehen sind. Zusätzlich wurde noch per Konsole der trilineare Filter, für den es im Spiel selber keinen Schalter gibt, mit dem Befehl r_texturemode GL_LINEAR_MIPMAP_LINEAR und einem folgenden vid_restart aktiviert.
Durch den Einsatz von zusätzlichen Detail-Texturen im Nahbereich ergibt sich eine optisch gelungene und aufgrund des eher ungewöhnlichen Settings ungewöhnliche Spieleerfahrung in diesem Third-Person Action-Adventure.
Im ersten echten Game-Test auch gleich die erste Überraschung. Nicht nur liegen die Karten von Nvidia und die schnelleren ATis nahezu gleichauf, obwohl OpenGL eigentlich eher als Nvidia-Domäne gilt. Ab 1024, also der Auflösung, ab der es eigentlich interessant wird, gesellt sich mit der GMA950 die schnellere von Intels integrierten Lösungen zum Spitzenfeld und erdreistet sich gar, in 1280 die Führung zu übernehmen. Nun ist zwar die Quake3-Engine seit jeher ein beliebtes Opfer für die Optimierungen der OpenGL-ICD, aber ein Indiz für einen nicht komplett unbrauchbaren OpenGL-Teil des Treibers liefern die GMA-Lösungen bereits ab.
Im High-Quality-Modus, der in diesem Falle lediglich aus der Abschaltung von AI bzw. dem Aktivieren des „Hohe Qualität“-Modus im Nvidia-Treiber besteht, zeigt sich, daß in dieser Situation die Sparfilter bei ATi effektiver gearbeitet haben. Die Radeons fallen geringfügig hinter das Niveau der Geforce zurück. Der Grund für den geringen Profit, den die 6200 TC aus den Filteroptimierungen schlägt, kann an den nur zwei vorhandenen ROPs liegen. Diese erlauben, wie bereits angesprochen, nur das Schreiben von zwei Pixeln pro Takt in den Framebuffer. Da die GPU aber über einen kompletten Pixelprozessor mit vier Renderingpipelines und jeweils einer TMU verfügt, kann sie entweder zwei bilineare oder eine trilineare Texturschicht pro Takt auf zwei Pixel applizieren. So gewinnt sie nur wenig durch die Einsparung von trilinearen Samples durch die Filterreduzierung.
Das Fehlen der Screenshots bitten wir zu entschuldigen, aber die Daten waren auf einem USB-Stick doch nicht so sicher aufbewahrt, wie wir glaubten...
Delta Force Black Hawk Down
Ein bewährter Test, der aber aus der Not geboren wurde, bildet Delta Force: Black Hawk Down. Eigentlich wollten wir den Nachfolger „Joint Operations“ ins Programm nehmen, wurden aber durch die Verweigerung der beiden Intel-Lösungen sogleich wieder entmutigt und haben uns daher noch einmal für DF:BHD entschieden. Als Nachfolger so berühmt-berüchtigter Titel wie Comanche und Delta Force baut Delta Force: Black Hawk Down auf einer moderneren Engine auf, als die Voxelspace-Vorgänger und nutzt, wie Comanche 4, welches hierdurch abgelöst wird, Pixelshader nach DirectX 8. Die weitläufigen Terrains, die die Engine darstellen kann, fordern nicht nur die CPU, sondern dank teils recht detailierter Texturen, umfangreicher Rauch- und Partikeleffekte und schönen Spezialeffekten auch die Grafikkarte. Gespielt wird in der Egoshooter Perspektive.
Zur Leistungsermittlung haben wir mittels FRAPS [2] die immer gleich ablaufende Introsequenz der ersten Mission „Marka Breakdown“ vermessen, die unweigerlich mit dem Tode der Spielerfigur an immer derselben Stelle endet. Die Details im Spiel stellten wir auf „Normal“.
Mit normalen Detaileinstellungen können sich die beiden Radeons mit ihrem schnellen Speicher sowohl von ihrer langsamer taktenden Schwester absetzen, als auch die Geforce 6200 TC klar distanzieren. Die Veränderung der Auflösung hat keinen Effekt auf diese Rangfolge. Den GMA900 und -950 fehlt hier eine dedizierte Vertexeinheit schmerzlich. So muss die CPU diese zusätzliche Arbeit übernehmen und Werte knapp unter 40 Fps respektive knapp über 30 Fps sind die Folge. Einstellungen der Auflösung von 1280x1024 akzeptierten die GMAs zwar klaglos, folgten aber nicht der Anweisung, in 1280 zu rendern, daher die Null-FPS-Wertung.
Für den höherwertigen Modus bewegten wir die Regler im Spiel eine Stufe nach oben, so daß sie nunmehr auf „high“ standen – Ausnahme war die Texturqualität, die wir auf das Maximum einstellten. Zusätzlich wurde noch 4:1 AF per Treiber erzwungen.
Auch das mehr an Bildqualität ändert nichts an der prinzipiellen Überlegenheit der Radeons in diesem Spiel. Die 32-MB-X300 genehmigt sich in 1024 zwar eine recht unerklärliche Auszeit, bleibt aber nichts desto trotz auf dem Niveau der Geforce. Diese vermag einzig die mit nur 200 MHz schnellem Speicher ausgestattete Radeon in Schach zu halten.



Neben der Unmöglichkeit, die 1280er-Auflösung zu nutzen, zeigen die GMA-Lösungen auch keine Pixelshader-Effekte, wie beispielsweise den Glanz auf dem Maschinengewehr in unserem Screenshotvergleich an. Umso schwächer muten die gezeigten Leistungen in Sachen FPS an.
Splinter Cell Chaos Theory
Eines besondere Grausamkeit für Einsteigerkarten und Low-Cost-Lösungen stellt das sogar auf aktuellen Mid-Range-Karten mitunter recht zäh laufende „Splinter Cell: Chaos Theory“ dar. Es verwendet eine stark aufgebohrte Unreal-Engine, die laut Entwickler als eine Art Versuchsträger für das nächste Konsolenspiel fungiert und dementsprechend bereits ab Werk über einen vollständig integrierten Shader-Modell-3.0-Pfad verfügt. Karten, die diesen nicht unterstützen, müssen mit den Pfad vorlieb nehmen, in dem auch die XBox-Version des Spieles läuft. Da in besagter Konsole ein Geforce3-Derivat werkelt, kommen die benutzten Shader notwendigerweise nicht über das 1.1-Niveau hinaus. Der Test wurde mit Shader-Modell 3, sofern verfügbar, und ansonsten dem obligatorischen 1.1-Pfad durchgeführt. Den nach Abschluss der Tests erschienenen Patch v1.04, der einen von ATi nachgelieferten Shaderpfad für 2.B-Pixelshader enthält, konnten wir nicht verwenden. Er wäre aufgrund der Beschränkung vieler Shader auf 2.B anstelle von 2.0 auf den X300-Karten allerdings vermutlich sowieso nicht gelaufen, ist er doch für X8x0- und X700-Karten gehobener Leistungsfähigkeit gedacht.
Die beiden Intel-Grafikeinheiten legten in diesem Test eine klassische Verweigerung hin, das Spiel wollte nicht einmal starten. Schade – mit einer vernünftigen Software-Emulation der Vertexshader und TnL-Einheit wäre hier eventuell zumindest ein Versuch möglich gewesen, das Spiel zu geniessen. Die Integration des SM3-Pfades bringt der Geforce 6200 TC hier herzlich wenig. Wie hier nicht mitveröffentlichte Messungen zeigen, gewinnt die Karte dadurch zwar im Bereich von einem bis zwei Fps an Leistung gegenüber dem 1.1-Pfad, allerdings reicht dies nicht aus, um die mit schnell taktendem Speicher ausgestatteten Radeons gefährden zu können. Einzig das 200-MHz-Modell kann geschlagen werden.
Spielbarkeit des Titels mit über 30 Fps ist allen drei Karten allerdings nur in der 640er-Auflösung gegeben. Die langsamste Radeon verfehlt diese Marke haarscharf.
Anstelle eines hier ziemlich sinnlos anmutenden High-Quality-Modus sollen hier die minimal und maximal erreichten Frameraten gezeigt werden. Mit Minima unterhalb der 25-Fps-Marke selbst in 640x480 ist Splinter Cell: Chaos Theory sicherlich eines der Spiele, die nach etwas mehr als nur einer Einsteigerkarte verlangen und ein Grund, vielleicht doch 80 bis 100 Euro anstatt nur 50 Euro für eine Grafikkarte auszugeben.


Der Unterschied zwischen Shader-Modell 1.1 und 3.0 äußert sich in der von uns für den Screenshot-Vergleich ausgewählten Szene nicht nur in leicht veränderter Lichtdarstellung (nicht das Schwanken der Lampe, sondern die Glühbirne!), sondern auch in leichtem Color-Banding im 1.1-Pfad (unabhängig von der verwendeten Grafikkarte), welches in Bewegung etwas störend wirken kann. Das Fehlen von GMA9xx-Screenshots dürfte selbsterklärend sein.
Doom 3
Doom3, der Meilenstein – Doom3, die Legende. Zumindest hätte es das sein sollen und nichts anderes war nach der endlos erscheinenden Wartezeit von der Spielergemeinde erhofft worden. Das Spiel entpuppte sich aber schnell als sowohl recht eintönig, als auch übermäßig hardwarehungrig. Dem Geschmack der Massen entsprechende Spiele wie Far Cry oder Half-Life 2 galten vielerorts als graphisch opulenter. Hinzu kamen die Querelen um die Optimierungen, die Nvidia mindestens seit dem Release des Spieles in ihren Treibern hatte. ATi zog kurze Zeit später nach. Der unter dem Pseudonym „Humus“ bekannte Schwede Emil Persson, inzwischen für ATi arbeitend, entdeckte (angeblich in seiner Freizeit), was die Nvidia-Karten in Doom3 so schnell werden ließ. Der zunächst als externe Hot-Fix erhältliche Beschleuniger wurde kurze Zeit später in ATis OpenGL-ICD integriert und das vermeintliche Gleichgewicht war wieder hergestellt, auch wenn ein kleiner Vorsprung für Nvidia blieb.
Fernab von alledem ist die Doom3-Engine eine interessante Konstruktion – komplette dynamische Beleuchtung, Stencil-Schatten allerorten und Bump- sowie Specular-Mapping sollten fehlende geometrische Details und hoch aufgelöste, normale Texturen ersetzen. Zum Test kam Doom3 in einer Konfiguration zum Einsatz, in der es auch auf den GMA-Lösungen von Intel noch lief – euphemistisch ausgedrückt. Low-Details, alle Effekte inklusive der Schatten abgeschaltet. Kein sonderlicher optischer Genuss mehr.
Wie aus dem Graphen zu ersehen ist, haben all diese Bemühungen nur wenig Früchte getragen. Spielbar ist Doom3 auf Intels GMA900 und GMA950 noch immer nicht – ein klassischer K.o. nach dem guten Start mit der Quake3-Engine in „Alice“. Entweder haben hier die Optimierungen von ATi und Nvidia extreme Früchte getragen, oder die ARB_fragment_program-Extension ist bislang eher als rudimentärer Ansatz in Intels OpenGL-ICD vorhanden – Alice macht davon jedenfalls keinen Gebrauch.
Bei den separaten Grafikkarten führt die Geforce 6200 knapp das Feld an. Die Radeons mit ihren unterschiedlichen Speicherausbaustufen zeigen deutlich, dass sich Doom3 in der niedrigsten Detailstufe sogar mit einer 32-MB-Karte zu begnügen in der Lage ist. Viel und schneller Speicher ist nichtsdestotrotz natürlich gern gesehen.
Für die höhere Detailstufe aktivierten wir alle Effekte, wie Specular- und Bump-Mapping, und stellten den in-Game-Detailregler auf „Medium“. Schatten blieben mit Rücksicht auf die schmalen Speicherinterfaces und somit geringen Bandbreiten allerdings deaktiviert.
Sobald wie bei unserem qualitativ gesteigerten Benchmark, Specular-, Bump- und Normal-Maps, selbst in komprimierter Form, zum Einsatz kommen, zeigt sich, wo der Doom3-Bartl den Fps-Most holt. Nur die schnellste und mit dem meisten Speicher ausgestattete der drei Radeons kann noch halbwegs mit der Geforce Schritt halten. Hierbei sollte man allerdings bedenken, dass seit Erscheinen Doom3 der Werbeträger für Nvidia-Karten gewesen ist und die Treiber für Doom3 sicherlich optimal eingestellt werden, noch bevor 2D-Funktionen integriert sind.



Deutlicher als in Doom3 zeigte sich nirgends die Überlegenheit der Zusatzgrafikkarten. Selbst auf den Thumbnails unserer Screenshots sieht man schon einen ausgeprägten Unterschied – und das bei gleichzeitig noch spielbaren FPS. Einen Patzer leistete sich die Geforce-Karte mit den genutzten Treiber allerdings bei der Darstellung des Aussenareals im ersten Level. Vor lauter schwarzen Clipping-Fehlern war kaum noch etwas von der Umgebung zu erkennen. Sobald man eine der beiden Luftschleusen betrat, verschwand das Phänomen genauso plötzlich, wie es aufgetreten war.
Riddick
Das dritte Spiel in unserem Parcours, welches auf OpenGL aufbaut, ist „Riddick: Escape from Butcher Bay“. Angelehnt an den von Vin Diesel verkörperten Anti-Helden Riddick aus „Pitch Black“ und „Chronicles of Riddick“, spielt dieses, auf der Starbreeze-Engine aufbauende Spiel in einem Hochsicherheitsgefängnis, aus dem es für Riddick mit brutaler Gewalt und einem kleinen bißchen Grips zu entkommen gilt. Extrem aufdringliches Specular-Mapping, kombiniert mit Stencil-Schatten à la Doom3 sowie teilweise hoch auflösenden Texturen und einigen nett anzuschauenden Lichteffekten fordern dank Einsatz der 2.0-Shader-äquivalenten OpenGL-Extensionen aktuelle Grafikkarten. Der Standardtest lief bei uns allerdings ohne Schatten und mit einem um eine Stufe unter dem Maximalwert eingestellten Texturqualitätsregler im Spiel. Als Basis wählten wir die 2.0-Shader-Entsprechung.
Überraschung – kaum heisst die Engine nicht „Doom3“ mit Zunamen, erreichen die GMA-Lösungen von Intel wieder konkurrenzfähige Werte, wenn auch auf sehr niedrigem Allgemeinniveau. Halbwegs spielbar wäre Riddick auf der Geforce und auf den beiden Radeons mit schneller taktendem Speicher nur in 640x480, und das, obwohl wir bereits auf einige Details verzichtet haben.
Für den HQ-Modus holten wir uns die Schatten und die beste Texturqualität an Bord.
Mit maximaler Texturqualität sieht es abermals düster aus. Noch düsterer als es bei Riddick bereits das Spielsetting vorgibt, geht doch in dieser Einstellung sämtliche Spielbarkeit flöten. Auch das Zurückschalten auf eine niedrigere Auflösung hilft in diesem Falle kaum noch etwas. Nur ganz knapp knacken die schnellsten Karten in 640 die 30-Fps-Marke. Die hier gezeigten 800x600 Bildpunkte lassen nicht einmal mehr 25 Fps zu. Das ist zu wenig für einen Ego-Shooter, hier müssen schwerere und vor allem teurere Geschütze ran.



Der Screenshot-Vergleich entlarvt die Leistung der GMA-Lösungen als teilweises Blendwerk. Zum Erreichen der GeForce- oder Radeon-Qualität fehlt doch einiges an Effekten, wie Bump-Mapping oder der Glow-Effekt. Oder die Einstellung für 2.0-Shader (im Menü, OpenGL kennt solche Shader natürlich unter anderer Bezeichnung) wurde komplett ignoriert. Alle Screenshots wurden mit höchster Detailstufe erstellt, auch wenn die GMA9xx offenbar Texturdetails vermissen läßt.
Far Cry
Far Cry bietet, entwickelt in deutschen Landen, momentan einen der höchsten optischen Genüsse in der Shooterlandschaft und lässt sich diese Pracht auch mit teils großem Hardware-Hunger bezahlen. Das Spiel lief mit Patch v1.3, welcher bereits Unterstützung für 3.0-, sowie 2.X-Shader bietet, die Einstellungen wurden im Spielmenü gewählt, die Settings sahen dabei wie folgt aus:
Systemleistung: Niedrig
Texturqualität: Hoch
Texturfilter: Trilinear
Anisotropie: 1
Partikel, SFX, Umgebung, Schatten: Niedrig
Licht, Wasser: Sehr Hoch
Unsere Demo mit über 4500 Bildern ist im Level „Forschung“ erstellt und umfasst sowohl Außenbereiche, die mit Pixelshader-1.1-verziertem Wasser und, durch üppige Vegegation und hohe Sichtweite, hohen Polygonzahlen glänzen, als auch Innenbereiche des Levels, die teilweise bis zu acht Lichtquellen und viele Floating-Point-Shader-Effekte bieten. Auf den Einsatz der Taschenlampe zu Steigerung der Grafikkartenlast haben wir diesmal bewußt verzichtet. Das für die Radeons per Treiber angebotene „Geometry Instancing“ war aktiviert.
Es ließe sich trefflich spekulieren, was wäre, wenn die X300 ebenfalls einen der beiden schnelleren Renderpfade als den Standard-2.0-Pfad nutzen könnte. Leider sind dazu erst Karten ab der X700 prinzipiell in der Lage und so müssen sich die Radeons mit den mittleren Plätzen zwischen der deutlich führenden Geforce, die den SM3-Pfad nutzen und so mehrere Rendering-Passes für die Lichtberechnung zu einem einzigen Durchgang kollabieren kann, und den abgeschlagenen GMA900 und -950 zufrieden geben. Diese kranken hauptsächlich an ihrer nicht vorhandenen Geometrie-Einheit, wie aus der Konstanz über die Auflösungen hinweg geschlossen werden kann. Ob die Pixeleinheit mit geeigneter Unterstützung durch einen Vertexprozessor spielbare Frameraten erreichen würde, kann nur vermutet werden, die Chancen dafür stünden angesichts der relativen Auflösungsunabhängigkeit der FPS-Raten aber wohl recht gut.
2:1 AF über die in-Game Einstellung, sowie „sehr hohe“ Textur-, Umgebungs- und Systemleistungseinstellung bilden in diesem Fal unseren HQ-Modus.
In der höheren Detailstufe vergrößert sich der Abstand zwischen Radeon und Geforce prozentual nochmals. Die Geforce kann auch in 1024 noch knapp spielbare Frameraten von jenseits der 35 Fps erzielen, den Radeon gelingt das nur in 800x600.



Deutlich realistischere Wasserdarstellung, wesentlich dichtere, glaubwürdigere Vegetation sowie erhöhte Geometriedetails lassen sich unter Zuhilfenahme einer separaten Grafikkarte im Vergleich zur integrierten Grafik auf Basis der i9xx-Chipsätze aus einem ansonsten identischen System herausquetschen. Die Geforce- und Radeon-Shots zeigen den HQ-Modus, während die GMA auf den normalen Standardeinstellungen kontrolliert wurde.
Half-Life 2
Half-Life 2 – ein Spiel, welches nach endlosen Verspätungen, Verschiebungen, Code-Diebstählen, Technologie-Partnerschaften, Bundle-Aktionen und STEAM-Querelen (uns) auch spielerisch und graphisch nur auf den ersten, flüchtigen Blick überzeugen konnte, aber nichts desto trotz durch die Lizenzierung der Source-Engine und auch schiere Verkaufszahlen (nach einem dreiviertel Jahr findet es sich immer noch in den Verkaufscharts auf ansehnlichen Positionen!) enorme Bedeutung für oder gegen eine Kaufentscheidung haben kann.
Unsere Timedemo spielt im „Canals_09“-Level und stellt die Verfolgung Gordon Freemans auf einem propellergetrieben Gleitboot durch einen Kampfhubschrauber dar (bzw. vice versa, da der Protagonist auf dem Gleitboot einen Kanal entlangfahren muss und der Helikopter vor ihm Wasserbomben abwirft). So kann die Demo sowohl durch weitläufige Landschafts-, shaderintensive Wasser- und GPU-belastende Explosions- und Partikeleffekte glänzen.
Getestet wurde mit folgenden in-Game Einstellungen. Texturen und Shadereffekte setzten wir auf „hoch“, Schatten und Geometriedetails standen mit Rücksicht auf die integrierten Lösungen auf niedriger Stufe. Dem Wasser gönnten wir einstweilen nur „simple reflections“. Jede Karte musste (eigentlich) mittels „mat_dxlevel 90“ DirectX-9-Shader darstellen.
In Half-Life 2, bekannter Leib- und Magenspeise aller Radeons, muss sich die Geforce geschlagen geben. Spielbarkeit ist jedoch auch mit ihr zumindest noch in 800x600 Bildpunkten gewährleistet. Zu mehr reicht es auch nur bei der schnellsten Radeon in 1024 – etwas Leidensfähigkeit auf Seiten des Spielers vorausgesetzt. Die GMA-Lösungen von Intel verharren weitgehend auflösungsunabhängig auf einem konstant niedrigen Niveau. Wie schon mehrfach angesprochen, ein Indiz für eine Limitierung durch den fehlenden Vertexshader. Eine Anmerkung zur 32-MByte-Radeon muss noch gemacht werden: Die Werte im Graphen für die beiden höheren Auflösungen sind Mittelwerte aus vier Durchläufen, während derer starke Schwankungen der FPS auftraten. Insbesondere die 1024er-Auflösung war hiervon betroffen, die Meßwerte schwankten zwischen ~33 FPS im ersten Durchlauf und ~22 FPS in den Folgedurchläufen.
HQ bedeutete dieses Mal, daß wir die in-Game Optionen sämtlich auf „high“ einstellen und die Wasserreflektionen auf „Reflect World“.
Diese Einstellungen schienen die Karten nicht über Gebühr zu belasten, denn die FPS blieben auf beinahe demselben, hohen Niveau, welches sie auch mit den niedrigeren Qualitätseinstellungen erreicht hatten. Auch das 32-MByte-Phänomen blieb das selbe.



Die Intel-Lösungen weigerten sich hartnäckig, zum Beispiel die Shader für die oberen Teile der Absperrungen darszustellen. Ebenso blieben Texturen für die Häuserfassaden oder das Wasser unter den Möglichkeiten, die die Hardware eigentlich bieten sollte. Den übrigen Bildvergleich gewinnt eindeutig die ATi-Phalanx, da die Texturen zum Teil deutlich schärfer und detailreicher dargestellt werden, als bei den default-Einstellungen der Geforce.
Max Payne II
Max Payne2: The Fall of Max Payne bietet, wie schon der Vorgänger, das sogenannte Bullet-Time Feature, vielen sicherlich von den Extrem-Zeitlupen aus dem Film „Matrix“ bekannt, welches weiter verbessert wurde. Neben photorealistischen Texturen und sehr detailiert gestalteten Umgebungen gibt es Radiosity Lighting, Gesichtsanimation und Lippensynchronisation und eine voll integrierte „Havoc“-Physik-Engine, die außer der Grafikkarte auch den Rest des Systems nicht vollkommen nutzlos herumidlen lassen.
Gemessen wurde Part II, Mission I „Return to Monas Funhouse“, welches eine schöne Intro-Sequenz mit einer Bullet-Time Szene kombiniert, an deren Ende Max Payne sich aufrappelt und wir den FRAPS-Durchlauf beenden. In-Game Settings waren auf maximale Einstellungen, Texturfilter auf trilinear gesetzt.
Die GeForce liefert sich mit der schnellsten Radeon (300 MHz Speichertakt, 128 MByte) ein Kopf-an-Kopf-Rennen, welches sie knapp verliert. Die beiden anderen Radeons zeigen, dass auch hier 32 MByte zu wenig sind und die sparsam bestückte Karte unnötig ausbremsen. Max Payne 2 kann auch mit dem beiden Intel-Lösungen problemlos in hoher Detailstufe gespielt werden, sofern man sich auf 1024x768 Bildpunkte beschränkt. Darüber wird die Luft in unserer Sequenz für die GMA900 langsam aber sicher zu dünn und auch die Grafikeinheit des GMA950 zeigt Schwäche.
Eine separate HQ-Betrachtung ersparen wir uns angesichts der bereits durchgeführten Betrachtung unter Hinzunahme von Kantenglättung und anisotropem Texturfilter.



Relevante Unterschiede sind in Sachen Bildqualität wie schon bei Half-Life 2 in Sachen Texturdetails zu sehen. Die Geforce spart in dieser Hinsicht doch deutlich gegenüber Intel und ATi – eventuell, um ihrem kleinen Texturcache eine bessere Trefferrate zu verpassen und so die Speicherbandbreite zu schonen.
Die Siedler V
Der fünfte Teil von BlueBytes „Die Siedler“, versehen mit dem Untertitel „Das Erbe der König“ und mittlerweile mit einem Add-on gesegnet, verkaufte sich wohl nicht zuletzt dank für ein Strategie- und Wuselspiel opulenter Optik recht gut. Die Engine baut auf eine angeschrägte Vogelperspektive und zeigt detailierte Texturen, die aber auf Grund hochfrequenten Inhalts auch bei abgeschalteten Optimierungen der Texturfilter eine gewisse Flimmerneigung besitzen. Zur Wasserdarstellung nutzen die Programmierer bereits Pixelshader und die Schatten werden über Shadow-Mapping erzeugt. Für unseren Benchmark bedienten wir uns der Intro-Sequenz des Tutorials, die anfangs einen untypischen Flug aus flacher Perspektive entlang eines Flüßchens auf eine Siedlung hin zeigt und dort in die spietypische Beinahe-Vogelperspektive wechselt. Sobald die automatisch ablaufende Kamerafahrt beendet war, drehten wir die Perspektive manuell je einmal nach links und rechts und ließen sie automatisch in die zentrierte Position zurückkehren. Danach beendeten wir unsere FRAPS-Messung.
Im Standard-Durchlauf verzichteten wir auf „Okklusion“, Schatten und Eisreflektionen (letztere kamen in unserer Sequenz sowieso nicht vor) und begnügten uns mit mittleren Landschaftsdetails. Die restlichen Optionen in dem auf Version 1.3 gepatchten Spiel stellten wir auf maximale Bildqualität ein.
Verhältnismäßig gut schnitten hier die GMA-Lösungen von Intel ab, die konstante Bildwiederholraten in den niedrigen Zwanzigern zu produzieren im Stande waren. Dabei konnte die GMA950 sich leicht von ihrer Vorgängerin absetzen. Deutlich flüssiger spielte sich das Geschehen auf den restlichen Karten ab; zumindest, solange man sich mit der 1024er-Auflösung beschied. In 1280x1024 waren nur noch die beiden Radeons mit schnellem Speicher vor den GMA-Lösungen. 800x600 Bildpunkte bot das Spiel leider nicht an, auch wenn es vielleicht der ein oder anderen Karte zu Gute gekommen wäre.
Für erhöhte Bildqualität entschieden wir uns, die Treibersettings auf High Quality zu schalten, beziehungsweise die Zwangsoptimierung Catalyst A.I. zu deaktivieren. Zusätzlich gewährten wir „niedrigen“ Schatten und „Okklusion“ Einzug in das Spiel und setzten die Landschaftsdetails auf hoch.
Auch mit diesen Einstellungen konnten die Radeons, die mit 300 bzw. 292 MHz schnellem Speicher ausgestattet waren, die GeForce knapp schlagen, die ihrerseits die Radeon mit 200 MHz Speichertakt auf Distanz hielt.




Neben der deutlichen Qualitätssteigerung der höheren Settings (in den Radeon- und GeForce-Shots ggü. der GMA) zeigt sich, dass hier die 32 MByte der Radeon wohl nicht ganz gereicht haben. Sowohl Gebäudetexturen fehlen teilweise als auch Charaktertexturen zur Gänze. Zudem scheint die Entfernungsnebel-Funktion ignoriert worden zu sein.Der fünfte Teil von BlueBytes „Die Siedler“, versehen mit dem Untertitel „Das Erbe der König“ und mittlerweile mit einem Add-on gesegnet, verkaufte sich wohl nicht zuletzt dank für ein Strategie- und Wuselspiel opulenter Optik recht gut. Die Engine baut auf eine angeschrägte Vogelperspektive und zeigt detailierte Texturen, die aber auf Grund hochfrequenten Inhalts auch bei abgeschalteten Optimierungen der Texturfilter eine gewisse Flimmerneigung besitzen. Zur Wasserdarstellung nutzen die Programmierer bereits Pixelshader und die Schatten werden über Shadow-Mapping erzeugt. Für unseren Benchmark bedienten wir uns der Intro-Sequenz des Tutorials, die anfangs einen untypischen Flug aus flacher Perspektive entlang eines Flüßchens auf eine Siedlung hin zeigt und dort in die spietypische Beinahe-Vogelperspektive wechselt. Sobald die automatisch ablaufende Kamerafahrt beendet war, drehten wir die Perspektive manuell je einmal nach links und rechts und ließen sie automatisch in die zentrierte Position zurückkehren. Danach beendeten wir unsere FRAPS-Messung.
Im Standard-Durchlauf verzichteten wir auf „Okklusion“, Schatten und Eisreflektionen (letztere kamen in unserer Sequenz sowieso nicht vor) und begnügten uns mit mittleren Landschaftsdetails. Die restlichen Optionen stellten wir auf maximale Bildqualität ein.
Verhältnismäßig gut schnitten hier die GMA-Lösungen von Intel ab, die konstante Bildwiederholraten in den niedrigen Zwanzigern zu produzieren im Stande waren. Dabei konnte die GMA950 sich leicht von ihrer Vorgängerin absetzen. Deutlich flüssiger spielte sich das Geschehen auf den




SpellForce
Wie der Shooter Far Cry ein deutsches Gewächs, präsentiert sich Spellforce in der Version 1.52a als hardwaremordender Genre-Mix aus Echtzeitstrategie und Rollenspiel, in welchen der Avatar, die Spielfigur des Spielers, sich mit fortschreitender Story auch weiterentwickelt und in seinen Kampf- und Magieeigenschaften verbessern kann.
Die Auswahl zwischen Draufsicht und Third-Person Perspektive auf die mit der mit der k.r.a.s.s.-Engine dargestellte Spielwelt, sowie die vielen, gut animierten Einheiten und die detailreiche und mit hübschen, stimmungsvollen Texturen verzierte Landschaft fordert sowohl die Grafikkarten als auch die CPU. Ein ausreichend ausgebauter Hauptspeicher tut ein Übriges.
Zur Ermittlung der durchschnittlichen Frameraten haben wir uns der Intro-Sequenz, die sowohl Ausblicke in die weitläufige Landschaft als auch Nahansichten von Charakteren und einige Spezialeffekte bietet, nach übersprungenem Tutorial bedient. Alle in-Game Optionen standen dabei auf höchster Stufe. Ausnahmen bildeten „mittlere“ Texturqualität und „normale“ Schatten und dekorative Objekte. Die Texturfilterung war auf trilinear eingestellt.
Während die GMA-Lösungen selbst mit reduzierten Details an der 25-FPS-Marke scheitern, zeigt auch die Radeon mit dem langsamsten Speicher hier nur in 800x600 Bildpunkten gut spielbare FPS. Den Sieg teilen sich in dieser Auflösung die GeForce 6200 TC, die ab 1024x768 auf etwa 10 Prozent Vorsprung davonzieht, und die Radeons mit schnellem Speicher.
Die HQ-Settings bestanden in diesem Falle aus der Einstellung „sehr hoch“ in Sachen Texturqualität und „hoch“ bei den dekorativen Objekten.
Das führt dazu, dass nur noch die GeForce 6200 TC oberhalb der 30-FPS-Grenze bleibt und das auch nur mit 800x600 Pixeln. Die Radeons bleiben sämtlich knapp unterhalb von 30 FPS und keine der Karten vermag in 1024x768 noch großen Spielspaß zu erzeugen – zu niedrig sind die FPS.



Bis auf die, durch die unterschiedlichen Detailgrade verursachten Unterschiede leistet sich hier keiner der Kandidaten ein echte Blöße. Die Farben wirken allerdings auf der Radeon in der Entfernung etwas kräftiger als auf der GeForce. Dies kann aber auch an einer etwas anderen Verrechnung des Entfernungsnebels liegen. Seltsam wirkt allerdings der Baumes links im Vordergrund. Hier sind einige Teile der Blatt-Texturen auf der GeForce deutlich verwaschener, als auf der Radeon – wir führen dies auf die unterschiedliche LOD-Bestimmung zurück, die, gerade ohne anisotropen Filter, zu diesem Effekt führen kann.
Tomb Raider
Als einer der ersten Titel mit voller DirectX9 Unterstützung sorgte „Tomb Raider: Angel of Darkness“ für Furore. Zwar eher, was die erschreckend niedrigen Bildwiederholraten der GeForceFX-Karten im Vergleich zur ATi-Konkurrenz anging, als durch überragendes Gameplay oder erdrückende Verkaufszahlen, aber immerhin, das Spiel blieb in aller Munde.
Pikanterweise war dieses Produktl auch auf der offiziellen Liste [3] des „The Way It's Meant To Be Played“-Programms zu finden und das, obwohl es mehr schlecht als recht lief. Kurzerhand wurde im aktuellen Patch [4] der Version v52 die Unterstützung für die Benchmarkfunktion wieder entfernt. Auch gibt es den Patch v49, der diese Funktion unterstützt, und den wir verwendeten, nicht mehr auf der offiziellen Eidos-Seite zum Herunterladen.
Zur Ermittlung der durchschnittlichen Frameraten haben wir uns des besagten Patches v49, des TRAOD SCU (Tomb Raider: Angel of Darkness Startup Configuration Utility) und eines selbsterstellten Durchlaufes durch große Teile des Prag3a-Levels bedient. Der Standard-Durchlauf umfasste das Fixed-Function-Profil, welches ohne Echtzeit-Reflektionen und MRT-Effekte auskommen musste. Lediglich Cube-Mapping wollten wir sehen. Entsprechend flott durchliefen die Probanden den Parcours.
Auch wenn hier Intels Lösungen wie der klare Sieger aussehen, so zeigt ein Blick auf die Vergleichsscreenshots, warum sie hier so extrem in Front liegen. Nicht nur, dass offenbar Lichtquellen ignoriert wurden, auch das nicht abgebildete Cube-Map-Wasser ließ jeden verschönernden Effekt vermissen. Ein Pyrrhus-Sieg in reinster Form also. Im restlichen Testfeld läßt die offenbar mit einer sehr schnellen Fixed-Funktion-Emulation gesegnete GeForce die Radeons knapp aber komplett hinter sich.
Für unseren HQ-Durchlauf wurde das Standard-Profil für PS2.0-fähige Karten ausgewählt, VSync, wie auch in allen anderen Benchmarks, deaktiviert, Fogging eingeschaltet und alle Texturen auf trilineare Filterung eingestellt. Ansonsten wurden alle Effekte, wie Full-Screen Tiefenunschärfe, Glow und Hitzeflimmern aktiviert - die spanische Inquisition für Grafikkarten also.
Den HQ-Vergleich entscheiden die Radeons für sich. Zwar liegt, den reinen FPS nach, die GeForce leicht in Front, aber ein ganz offenbar fehlerhaft berechneter Tiefenunschärfe-Effekt sorgt dafür, dass man auf der Geforce ausser Blur kaum noch etwas vom Bild erkennt.



Hier die oben geschilderten Effekte noch einmal zur Ansicht. Geforce- und Radeon-Screenshot wurden in hoher Qualität erstellte, der der GMA-Einheit im Standard-Modus.
UT2004
Der ebenso fordernde wie typische UT2004-Benchmark auf der Map „Primeval“ wurde von den Kollegen des 3DCenter erstellt und ist in unserem Parcours mittlerweile ein alter Bekannte. In der 2004er-Inkarnation setzt Unreal Tournament bereits auf einige wenige Pixelshader zur schnelleren Landschaftsdarstellung, stellt aber ansonsten Multi-Texturing-Anforderungen, wie kaum ein anderes Spiel. Die Treiber zumindest von Ati und Nvidia sind daher auf dieses viel gespielte Spiel seit langem optimal eingestellt und verwenden auf Seiten Nvidias ein spezielles, nicht deaktivierbare Profil, um hohe FPS-Raten zu gewährleisten. Diese Optimierungen machen es Newcomern wie es Intel in diesem Bereich ist, natürlich doppelt schwer, hier mitzuhalten. Da UT aber generell ein eher CPU-limitiertes Spiel ist, haben wir uns für die „Primeval-Demo“ entschieden und keinen der üblichen FlyBy-Benchmarks verwendet. Der Standard-Durchlauf umfasste normale Texture-, Character-, World- und Physics-Details, sowie ebenfalls normale Einstellungen für die dynamische Berechnung des Mesh-LOD und die Verweildauer der so genannten Decal-Texturen. Schatten blieben vorerst deaktiviert.
Nicht dramatisch, aber ein kleines bißchen kann sich die Geforce von den Radeons absetzen, besonders mit steigender Auflösung. Hierbei scheint es letzteren egal, ob sie über 32 oder 128 MByte verfügen. Hauptsache, der Framebuffer ist schnell angebunden. Die Intel-Lösungen kommen über 25 FPS nicht hinaus und können so nur die 200-Speicher-MHz-Radeon in 1280x1024 abfangen, allerdings in wenig erbaulichen FPS-Regionen.
High-Quality bestand für UT2004 in vollen Schatten, höchsten Textur- und Character-Details sowie hohen sonstigen Einstellungen.
Auch wenn sie in 800x600 noch knapp zurückliegt, so sich die GeForce auch in diesen Einstellungen behaupten und die Radeon samt und sonders auf die Plätze verweisen. Die Spielbarkeit leidet allerdings mit steigender Auflösung doch deutlich und in diesen Settings sollte man sich am ehesten auf die 800x600-Werte konzentrieren, da hier noch spielbare Bildwiederholraten geliefert werden – von beiden schnellen Radeons und der GeForce.



Die Screenshots enthüllen nichts neues, ausser den bekannten Unterschieden im Alpha-Blending, zu sehen an der Lichtquelle, zwischen Nvidia auf der einen und Ati bzw. Intel auf der anderen Seite. Der Shot der Intel-Grafik wurde im normalen Detailmodus erstellt, die der beiden anderen in High-Quality.
Vampire Bloodlines
Unser zweiter Proband, der auf Valves Source-Engine aufbaut, ist Vampire: Bloodlines. Nach dem White-Wolf Regelwerk und Universum spielt man hier wahlweise in Ego- oder Third-Person-Perspektive die entscheidende Rolle in einer Verschwörung der geheimen Vampirgesellschaft in Los Angeles. Da das Spiel nicht über Steam vertrieben wird, befindet sich die Source-Engine trotz Patch des Spiels auf Version 1.02 noch in einer sehr frühen Fassung. Das Spiel nutzt zwar die Möglichkeiten, DirectX-9-Shader mit Floating-Point-Genauigkeit zur Darstellung beispielsweise der Charakter- und insbesondere der lippensynchronen Gesichtsanimation, sowie von Bump-Mapping auf einigen Oberflächen im Spiel, fordert aber aufgrund detailierter Spielwelt und einer Menge herumlaufender Charaktere eher die CPU als die Grafikkarte. Zusätzlich sollte für einen einigermaßen flüssigen Spielgenuß ein Gigabyte RAM im System stecken. Wir haben aufgrund der CPU-Limitierung hier die spärlichen in-Game Optionen zur Grafikdarstellung allesamt auf das verfügbare Maximum gesetzt. Als Benchmark diente die automatisch ablaufende Vorgeschichte, in der der Held des Spiels (in unserem Falle immer ein männlicher Malkavianer) von einem Vampir gebissen und in einem Opernsaal von den versammelten Anführern der Vampirclans und dem „Prinzen“ über sein Schicksal entschieden wird. Die FRAPS-Messung beendeten wird mit dem Ende der Opernsaal-Szene.
Eine weitere Totalverweigerung von oder der Intel-Chipsätze. Das Spiel bricht noch vor dem Menü mit einer Fehlermeldung ab. Ob dies schludriger Programmierung des Spiels oder eher der Treiber von Intel geschuldet ist, läßt sich schwerlich klären. Eine vollständige CPU-Emulation der nicht vorhandenen Vertexeinheit über einen, zumindest an DirectX gemeldeten Vertexshader könnte jedenfalls nicht unbedingt schaden. Half-Life 2 konnte schließlich auch gestartet werden.
Die Geforce muss sich lediglich der schnellsten Radeon geschlagen geben. Einen großen Unterschied in Sachen Spielbarkeit machen aber weder dieser, noch der Abstand, den die 6200 TC zwischen sich und die langsameren Radeons legen kann, aus. Für ein Rollenspiel-/Adventure mit eher wenig hektischem Shooter-Anteil reichen die 25 bis 30 fps jedenfalls aus.
Aufgrund der ausgeprägten CPU-Limitierung versuchten wir im High-Quality-Modus ausnahmsweise einmal mit per Treiber aktiviertem 4-Sample-FSAA und 16:1 anisotroper Texturfilterung bei ansonsten, bis auf vertikale Synchronisation, werkseitig belassenen Treibereinstellungen.
Diese Einstellungen erwiesen sich lediglich für die mit 300 MHz taktendem, 128-MByte-Speicher ausgestattete Radeon als nicht lethal. Alle anderen Karten können höchstens noch bei 800x600 Bildpunkten noch Spielbarkeit gewährleisten.


Vom reinen Screenshot her könnte der Vergleich hier unentschieden ausgehen, wenn da nicht das Live-Erlebnis wäre. Auf dem stillen Bild ist lediglich die Stoßstange des Taxis auf den ATi-Karten besser dargestellt, aber in Bewegung stellt sich ein deutlicher Flimmereffekt auf der Geforce ein. Speziell auf den Detail-Texturen im Bereich der weissen Fahrbahnmarkierungen stellt das einen nicht zu unterschätzenden Störfaktor dar.
Leistungsaufnahme und Temperatur
In Anlehnung an unseren älteren Stromverbrauch-Artikel [5] wollen wir die Leistungsaufnahme auch weiterhin als Bestandteil unserer Tests pflegen. Im Gegensatz zu älteren Artikeln hat sich das Testsystem allerdings wieder einmal geändert, so dass die aktuellen Werte nur untereinander vergleichbar sind.
Kurz zur Methodik: Mit einem ELV EM600-Energiemonitor haben wir vor dem Netzteil die gesamte Leistungsaufnahme des Testrechners gemessen. Die angegebenen Werte sind also nur in Relation zu sehen und stellen keinesfalls die Leistungsaufnahme der Grafikkarte alleine dar.
Wie sie sehen, sehen sie nichts. Zumindest nichts nennenswertes zeigt sich bei der Analyse unserer Werte. Erwartungsgemäß liegen die in die Northbridge integrierten Lösungen knapp vor den externen Chips. Im 3D-Betrieb lassen sich so knappe 10 Watt sparen. Die beiden Karten mit 32 respektive 64 MB Grafikspeicher erreichen eine geringfügig geringere Leistungsaufnahme, als die 128-MB-Boards von ATi und bleiben dabei Kopf an Kopf. Die Leistungsaufnahme sollte bei diesen geringen Unterschieden keine kaufentscheidende Rolle spielen – höchstwahrscheinlich sind die Unterschiede zwischen den Board verschiedener Hersteller ähnlich groß, wie die zwischen unterschiedlichen Chips und Speicherausbaustufen. Wer absoluten Wert auch auf das letzte gesparte Watt legt, wird sich sowieso mit der integrierten Lösung zufriedengeben.




Von Links nach rechts haben wir mittels direkter Kühlkörpermessung an den passiven Kühlblechen der Probanden die Temperatur festgehalten, die sich nach einer Stunde Dauerlauf des „Mother Nature“-Tests im 3DMark03 einstellte. Um den Hauptteil der Rechenlast auch auf die Grafikkarte zu legen und somit auch eine möglichst hohe Temperatur erzielen zu können, reduzierten wir die Auflösung auf 800x600 Bildpunkte und reduzierten die Texturfilterung auf bilinear. Gleichzeitig wollten wir möglichst alle Teile des Chips fordern und aktivierten noch 2-Sample-FSAA, so dass auch die ROPs unter Volllast liefen.
Spitzenreiter in Sachen Temperaturentwicklung ist Intels eigenes Board mit i945G und großem Passivkühler. Dieser erreichte, auch dank des Luftstromes des CPU-Kühlers nur 59° C. Den zweiten Platz teilen sich mit 66° C die integrierte Grafik in MSIs Mainboard mit relativ kleinen Kühlrippen und die mit einem großügig dimensionierten Passivkühler ausgestattete Radeon-Karte von Connect 3D. Platz Nummer drei geht an die GeForce 6200, die mit ihrem großen, aber recht einfachen Kühlkörper runde 73° C erreichte. Den Spitzenplatz im negative Sinne erhielt die von Ati gelieferte Radeon X300, die kochend-heiße 103° C erreichte – trotz allem aber keine Bildfehler im Test produzierte.
Fazit
Bevor wir nach langem Test, langem Text und langer Verzögerung zum Fazit kommen, wollen wir noch ein paar Worte zur Videobeschleunigung verlieren. Der Windows Media Player 10 ist nach einem Update nun endlich in der Lage, via DirectX Video Acceleration beschleunigtes WMV9-HD-Material mit Hilfe der Grafikkarte wiederzugeben. Sowohl ATi als auch nVidia bewerben seit langem die fortschrittlichen Video-Features in ihren GPUs.
Eigentlich wollten wir mittels des WMV9-Clips „Step into Liquid“ die CPU-Entlastung messen, die eine separate GPU gegenüber den rund 50 Prozent auf einem 3,2-GHz-Pentium-4 erreicht. Dies gelang jedoch nur zum Teil. Trotz minutiös befolgter, ausführlichen Beschreibungen und mehrfacher Neuinstallation des Betriebssystems wollte die Beschleunigung des Windows-Media-Videos auf sämtlichen ATi-Chips nicht gelingen, ohne dass der Ton asynchron lief. Auch eine zur Kontrolle überprüfte X700 zeigte zwar eine Entlastung der CPU, aber nur auf Kosten der Bild-Ton-Synchronisation. Da dieses Phänomen allerdings nicht bei jedem Rechner aufzutreten, unser Testsystem andererseits aber auch kein Einzelfall zu sein scheint, verzichten wir hier auf die Dokumentation mit Hilfe eines Diagrammes, sondern belassen es bei dieser Schilderung.
Das schlußendliche Fazit kann nur eines sein: Natürlich bewirken Lowest-Cost-GPUs gegenüber einer integrierten Grafik vom Schlage einer GMA900 oder GMA950 in fast allen Fällen eine deutliche Steigerung der Performance, erlauben höhere Bildqualität oder die Nutzung einer höheren Auflösung. Wer jedoch rund 50 Euro (rund das Doppelte in der guten alten DM oder ein neues Vollpreis-Spiel!) in eine Komponente investiert, mit dem einzigen Zweck, Spieletauglichkeit herzustellen, wird nur zufrieden sein, wenn er sich entweder mit niedrigen Auflösungen, reduzierten Detailstufen oder im Extremfalle mit einer eingeschränkten Spieleauswahl zufriedengibt. Dies kann in vielen Fällen aber auch eine integrierte Grafik leisten – insbesondere dann, wenn sie vielleicht nicht mit den Problemen gebeutelt ist, wie sie die Intel-Lösungen durch den Test hinweg zeigten, sondern beispielsweise von ATi oder nVidia stammt, die beide ebenfalls in den Chipsatz verankerte Lösungen anbieten.
So lange die absoluten Einstiegslösungen ebenfalls nur solche Kompromisse zu liefern im Stande sind, sollte man sich genau überlegen, ob man nicht vielleicht doch rund 100 Euro ausgeben kann und will und dafür dann eine Grafikkarte beispielsweise auf Basis von ATis X700 Pro oder nVidias Geforce 6600 bekommt, die einen nochmals deutlich größeren Leistungsschub ermöglicht und eben auch aktuelle Spiele problemlos darstellen kann, ohne auf all zu viel so genanntes Eye-Candy verzichten zu müssen. Unter diesem Aspekt sind wir gespannt auf die Leistung, wie sie ATis Radeon-Xpress200-Chipsatz oder nVidias kürzlich vorgestellter nForce-Chipsatz mit integrierter Geforce 6100/6150 zu liefern im Stande sein wird.












