Einleitung
Der Grafikkartenmarkt kocht. Kaum ein Monat vergeht, ohne dass die Konkurrenten ATi und nVidia nicht eine neue Grafikkarte ins Rennen werfen, die ausgiebig getestet werden möchte. Und rechnet man aufgrund bekannter Termine dann doch einmal mit einer kleinen Auszeit, schreckt einen nicht selten ein Anruf mit der frohen Kunde, man habe sich kurzfristig zu einem früheren Termin um entschieden, aus dem Sessel.
An und für sich kein unlösbares Problem. Zumindest nicht für den Launch-Artikel, denn der hat höchste Priorität. Allerdings gibt es da auch noch wahrhaft epische Artikel wie diesen hier, die zwischen dem ganzen Hin und Her der beiden Kontrahenten den Alltag eines Grafikkarten-Redakteurs ausfüllen und am Ende leider deutlich länger zur Fertigstellung brauchen, als es ursprünglich geplant war.
Die Idee, die zu unserem heutigen Artikel geführt hat, ist eigentlich recht schnell umrissen: Den unzähligen Leserwünschen, aktuelle Grafikkarten nicht immer nur auf einem High-End-System zu testen, wollten wir mit einem umfangreichen, plattformübergreifenden Mammut-Bericht nachkommen. Vier aktuelle High-End- und Mid-Rang-Karten sollten auf älteren und quasi allen derzeit erhältlichen CPUs zeigen, wo sich ihre Anschaffung lohnt und wo nicht.
Wir wollen nicht nachzählen, wieviele Benchmarkdurchläufe es letzten Endes waren, bis alle Werte für drei Grafikkarten in zwölf Anwendungen bei verschiedenen Auflösungen und Qualitätseinstellungen auf unzähligen CPUs im Kasten waren. Wir könnten es auch gar nicht. Doch neben dem alltäglichen Ankündigungswahnsinn der Grafikkartenindustrie war es auch der Umfang dieses CPU-GPU-Skalierungsberichtes, der dafür gesorgt hat, das der Artikel erst heute online geht.
Und das bedeutet leider, dass die schnellsten Karten im Test nicht mehr die aktuellsten sind. Andernfalls dürfte genau die Hardware, die im Artikel zum Einsatz kommt, verständlicherweise noch immer ihren Dienst in den Rechnern dieser Republik verrichten, so dass unser Test-Setup zwar nicht mehr up-to-date, aber immer noch repräsentativ ist. Die Erkenntnisse des Artikels, Aussagen über das Zusammenspiel der Grafikkarte mit Prozessoren der unterschiedlichsten Generationen und Leistungsstufen, sind es ebenfalls.
Ring frei für einen Artikel, den es so auf ComputerBase noch nicht gegeben hat: GPU-Skalierung - Wieviel CPU tut gut?
Die CPUs vorgestellt
Als Unterbau in Sachen Prozessoren haben wir uns für die zum Beginn des Tests aktuellsten Generationen bei AMD und dessen Konkurrenten Intel entschieden: Athlon XP und Athlon 64 auf Seiten von AMD und Pentium 4, Pentium D sowie Pentium M von Intel müssen zeigen, was sie drauf haben und welche Leistung sie welcher Grafikkarte entlocken können.
Auf den „Billigprozessor“ Celeron von Intel haben wir bewusst verzichtet, da er größtenteils eine unterirdische Leistung in aktuellen 3D-Applikationen zeigt. Der AMD Sempron wird zum Benchmarkmarathon ebenfalls nicht antreten, da er dem Athlon XP bzw. dem Athlon 64 sehr ähnelt und den Zeitaufwand des Artikels relativ unnütz endgültig ins Unendliche befördert hätte.
Aufgrund des Zeitrahmens dieses Artikels konnten die Anfang 2006 vorgestellten Prozessoren Pentium D 900-Serie, Pentium XE 9x5, Core Duo sowie die Mitte Mai angetretenen Athlon 64 (X2) im neuen Sockel AM2 nicht berücksichtigt werden. Ihre Fehlen wird jedoch kein Einfluss auf das Ergebnis dieses Artikels haben.
Nun aber genug der Worte und schauen wir uns die oben genannten Prozessortypen einmal genauer an. In den Tabellen haben wir nur die Prozessoren (Prozessorserien) bedacht, die auch im Test Verwendung fanden. In den Texten versuchen wir, die Geschichte jeder einzelnen Prozessorgeneration genauer zu umreißen.
AMD Athlon XP
| Merkmale | Palomino-Kern | Thoroughbred-Kern | Barton-Kern | Thorton-Kern |
|---|---|---|---|---|
| Logo | ![]() |
![]() |
![]() |
![]() |
| Kern | Palomino | Thoroughbred | Barton | Barton L2-Cache halbiert |
| Frontside-Bus | 266 MHz DDR | 266 MHz DDR 333 MHz DDR |
333 MHz DDR 400 MHz DDR |
266 MHz DDR |
| Fertigung | 0,18 µm | 0,13 µm | 0,13 µm | 0,13 µm |
| Sockel | Sockel A (462) | Sockel A (462) | Sockel A (462) | Sockel A (462) |
| Taktrate oder Modellnummer |
266 MHz DDR 1500+ (1333 MHz) 1600+ (1400 MHz) 1700+ (1467 MHz) 1800+ (1533 MHz) 1900+ (1600 MHz) 2000+ (1667 MHz) 2100+ (1733 MHz) |
266 MHz DDR 1700+ (1467 MHz) 1800+ (1533 MHz) 1900+ (1600 MHz) 2000+ (1667 MHz) 2100+ (1733 MHz) 2200+ (1800 MHz) 2400+ (2000 MHz) 2600+ (2133 MHz) 333 MHz DDR 2600+ (2083 MHz) 2700+ (2167 MHz) 2800+ (2250 MHz) |
333 MHz DDR 2500+ (1833 MHz) 2600+ (1917 MHz) 2800+ (2083 MHz) 3000+ (2167 MHz) 400 MHz DDR 3000+ (2100 MHz) 3200+ (2200 MHz) |
266 MHz DDR 2000+ (1667 MHz) 2200+ (1800 MHz) 2400+ (2000 MHz) |
| Transistoren | 37,5 Mio. | 37,2 Mio. | 54,3 Mio. | 54,3 Mio. |
| DIE-Size | 129,3 mm² | 80 mm² (Tho A) 84 mm² (Tho B) |
101 mm² | 101 mm² |
| L1-Cache | 64 kB | 64 kB | 64 kB | 64 kB |
| L2-Cache | 256 KB | 256 kB | 512kB | 256 KB |
| VCore (Je nach Modell) |
1,75 V | 1,5 V 1,6 V 1,65 V |
1,65 V | 1,6 V |
| Befehlssätze | MMX 3DNow! 3DNow!+ SSE |
MMX 3DNow! 3DNow!+ SSE |
MMX 3DNow! 3DNow!+ SSE |
MMX 3DNow! 3DNow!+ SSE |
| Temperatur Diode | Ja | Ja | Ja | Ja |
| Energiesparfunktion | - | - | - | - |
| NX-Bit (Win XP SP2) | - | - | - | - |
| AMD64/EM64T | - | - | - | - |
| Multiprozessor-fähig | - | - | - | - |
| Dual-Core/HTT | -/- | -/- | -/- | -/- |
| Dual-Channel-fähig | Ja | Ja | Ja | Ja |
| TDP (Herstellerangabe) |
60 W bis 72 W | 49,4 W bis 68,3 W | 68,3 W bis 74,3 W | 60,3 W bis 68,3 W |
| CPU-Architektur | 15-stufige (FPU) 10-stufige (ALU) Pipeline |
15-stufige (FPU) 10-stufige (ALU) Pipeline |
15-stufige (FPU) 10-stufige (ALU) Pipeline |
15-stufige (FPU) 10-stufige (ALU) Pipeline |
In der Ära des AMD Athlon XP gab es insgesamt drei verschiedene CPU-Kerne – der vierte in der Liste ist entgegen der Namensänderung keine Neuentwicklung, sondern ein Barton-Kern mit einem halbierten Level-2-Cache. Begonnen hat alles mit dem Palomino-Core, welcher damals gegen Intels höher getaktete Pentium-4-Prozessoren antreten musste. Der Athlon XP hatte jedoch ein Problem: Seine Geschwindigkeit war es nicht, denn dort war er selbst dem Topmodell Intels überlegen. Allerdings hatte er einen deutlich niedrigeren Takt. Und da man Prozessoren in der freien Marktwirtschaft größtenteils über den Takt verkauft, ließ sich AMD einen kleinen, jedoch verwirrenden Trick einfallen – das Modelrating.
So hatte beispielsweise der Athlon XP 1800+ nicht – wie man annehmen könnte – 1800 MHz, sondern nur 1533 MHz. Das Modelrating sollte laut AMD angeben, welchen Takt ein fiktiver Athlon Thunderbird (der Vorgänger des Athlon XP) besitzen müsste, um die Geschwindigkeit des Palomino zu erreichen.
Kommen wir nun wieder zum „Erstlingswerk“, eben diesem Palomino. Der Kern verfügt über einen Frontside-Bus von 266 MHz und ist nach dem DDR-Prinzip an die Northbridge angebunden, sprich er kann pro Takt zwei Signale weiterleiten. Der L1-Cache weist eine Größe von 64 KiloByte auf, während der L2-Cache 256 KB groß ist. Das Modelrating beginnt beim Palomino mit der Kennung 1500+ und endet bei 2100+, was einem Takt von 1333 MHz bis 1733 MHz entspricht. Die Pipeline-Struktur des Athlon XP-Prozessors ist im Vergleich zu den neueren CPUs sehr kurz gehalten, weswegen die Pro-MHz-Leistung dieses Prozessors sehr gut ist, er jedoch auf einen hohen Takt verzichten muss – dies ist wohl auch der Hauptgrund seiner damaligen Überlegenheit über den Pentium 4 gewesen.
Der Nachfolger Thoroughbred weist nur geringe Änderungen auf. Das Hauptmerkmal ist der kleinere Fertigungsprozess, da die CPU nicht mehr in 180-nm-Technologie, sondern in 130-nm-Technik produziert wird. Aus diesem Grund lassen sich entsprechende Prozessoren auch höher Takten, was den Thoroughbred auf bis zu 2250 MHz beschleunigt hat. Das Rating geht von 1700+ bis 2800+ oder auch von 1467 MHz bis 2250 MHz. Ein weiterer Grund für die Taktsteigerung ist eine niedrigere Spannung gegenüber dem Palomino, welche ebenfalls bedingt durch die Fertigungsänderung ist. Ebenfalls neu ist ein leicht erhöhter Frontside-Bus von 333 MHz. Allerdings hält sich die somit gewonnene Performanceverbesserung in Grenzen – trotz eines höheren Speichertaktes, der auf damals modernen Mainboards ermöglicht wurde.
Der Barton-Kern besitzt als größter Unterschied einen doppelt so großen L2-Cache, der nun 512 KB misst. Weiterhin wurde erneut der Frontside-Bus auf nun 400 MHz erhöht. Das Rating geht bei diesem Prozessor-Kern von 2500+ (1833 MHz) auf bis zu 3200+ (2200 MHz) hinauf, der gleichzeitig auch der schnellste Athlon XP darstellt, der jemals käuflich zu erwerben war.
Über den Thorton-Core gibt es nicht viel zu sagen, höchstens, dass er die „Müllhalde“ der Prozessoren mit einem Barton-Kern darstellte. Funktioniert auf einer Barton-CPU nur die Hälfte des Level-2-Cache, wird sie in Thorton umgelabelt und schon kann man den Kern trotz des Defektes weiterhin verkaufen. Performancemäßig ist der Thorton-Kern also identisch mit einem Thoroughbred, solange dieser mit demselben Takt und demselben FSB arbeiten.
AMD Athlon 64
| Merkmale | Athlon 64 (FX) | Athlon 64 | Athlon 64 | Athlon 64 (FX) | Sempron |
|---|---|---|---|---|---|
| Logo | ![]() |
![]() |
![]() |
![]() |
![]() |
| Kern | Clawhammer (C0- und CG-Revision) |
Newcastle (CG-Revision) |
Winchester (D0-Revision) |
Venice (E3) San Diego (E4)* |
Paris (CG) Oakville (D0)* Palermo (E3)** |
| Frontside-Bus | entfällt | entfällt | entfällt | entfällt | entfällt |
| Fertigung | 0,13 µm (SOI) | 0,13 µm (SOI) | 0,09 µm (SOI) | 0,09 µm (SOI) | 0,13/0,09** µm (SOI) |
| Sockel | Sockel 754/939 | Sockel 754/939 | Sockel 939 | Sockel 939 | Sockel 754/939 |
| Taktrate oder Modellnummer |
Athlon 64 (S754) 3200+ (2000 MHz) 3400+ (2200 MHz) 3700+ (2400 MHz) Athlon 64 (S939) 4000+ (2400 MHz) Athlon 64 FX (S939) FX-51 (2200 MHz) FX-53 (2400 MHz) FX-55 (2600 MHz) |
Athlon 64 (S754) 2800+ (1800 MHz) 3000+ (2000 MHz) 3200+ (2200 MHz) 3400+ (2400 MHz) Athlon 64 (S939) 3000+ (1800 MHz) 3200+ (2000 MHz) 3500+ (2200 MHz) 3800+ (2400 MHz) |
Athlon 64 (S939) 3000+ (1800 MHz) 3200+ (2000 MHz) 3500+ (2200 MHz) |
Athlon 64 (S939) 3000+ (1800 MHz) 3200+ (2000 MHz) 3500+ (2200 MHz) 3800+ (2400 MHz) 3700+ (2200 MHz)* 4000+ (2400 MHz)* Athlon 64 FX (S939) FX-55 (2600 MHz)* FX-57 (2800 MHz)* |
Sempron (S754) 3100+ (1800 MHz) 2600+ (1600 MHz)* 2800+ (1600 MHz)* 3000+ (1800 MHz)* 3100+ (1800 MHz)* 3300+ (2000 MHz)* 2500+ (1400 MHz)** 2600+ (1600 MHz)** 2800+ (1600 MHz)** 3000+ (1800 MHz)** 3100+ (1800 MHz)** 3300+ (2000 MHz)** |
| Transistoren | 106 Mio. | 68,5 Mio. | 68,5 Mio. | 68,5 Mio. 114 Mio.* |
68,5 Mio. 68,5? Mio.* 68,5? Mio.** |
| DIE-Size | 193 mm² | 144 mm² | 84 mm² | 83,5 mm² 115 mm²* |
144 mm² 84 mm²* 83,5 mm²** |
| L1-Cache | 128 kB | 128 kB | 128 kB | 128 kB | 128 kB |
| L2-Cache | 1024 KB | 512 kB | 512kB | 512 KB 1024 KB* |
256 KB 128/256 KB* 128/256 KB** |
| VCore (Je nach Modell) |
1,5 V | 1,5 V | 1,4 V | 1,35 V 1,4 V* |
1,4 V |
| Befehlssätze | MMX 3DNow! 3DNow!+ SSE SSE2 AMD64 |
MMX 3DNow! 3DNow!+ SSE SSE2 AMD64 |
MMX 3DNow! 3DNow!+ SSE SSE2 AMD64 |
MMX 3DNow! 3DNow!+ SSE SSE2 SSE3 AMD64 |
MMX 3DNow! 3DNow!+ SSE SSE2 SSE3** |
| Temperatur Diode | Ja | Ja | Ja | Ja | Ja |
| Energiesparfunktion | Ja | Ja | Ja | Ja | Ja |
| NX-Bit (Win XP SP2) | Ja | Ja | Ja | Ja | Ja |
| AMD64/EM64T | Ja | Ja | Ja | Ja | - |
| Multiprozessor-fähig | - | - | - | - | Nein |
| Dual-Core/HTT | -/- | -/- | -/- | -/- | -/- |
| Dual-Channel-fähig | Ja (S939) - (S754) |
Ja (S939) - (S754) |
Ja | Ja | Ja (S939) - (S754) |
| TDP (Herstellerangabe) |
89 W | 89 W | 67 W | 67 W ab 3800+ 85,3 W 85,3 W* |
62 W |
| CPU-Architektur | 17-stufige (FPU) 12-stufige (ALU) Pipeline |
17-stufige (FPU) 12-stufige (ALU) Pipeline |
17-stufige (FPU) 12-stufige (ALU) Pipeline |
17-stufige (FPU) 12-stufige (ALU) Pipeline |
17-stufige (FPU) 12-stufige (ALU) Pipeline |
Der Nachfolger des Athlon XP von AMD, der Athlon 64, brachte viele grundlegende Neuerungen mit sich und er weiß, zumindest in Spielen, wie man den Pentium 4 hinter sich lässt. Als größte Neuerung lässt sich zweifellos der in die CPU integrierten Speichercontroller nennen, welcher bei allen anderen Prozessor in der Northbridge sitzt. Somit kann der Speicher direkt mit dem Prozessor kommunizieren und erhält deswegen einen deutlichen Geschwindigkeitsschub. Die Namensgebung des Prozessors ist ebenfalls schnell gefunden – die „64“ weißt auf eine 64-Bit-CPU hin, die eben nicht mehr nur 16- und 32-Bit-Instruktionen, sondern auch 64 bittige Anweisungen bearbeiten kann. Darüber hinaus gibt es nicht mehr nur den einfachen Prozessor, sondern auch noch eine höher getaktete Serie, welche jedoch beinahe unbezahlbar ist. Athlon 64 FX nennt sich diese bei AMD und der eigentliche Kern ist identisch zum normalen Athlon 64, nur dass er etwas höher getaktet ist und nach oben hin einen freien Multiplikator besitzt, womit sich AMDs Flaggschiff hervorragend zum Übertakten eignet.
Der Clawhammer-Kern wurde im Ursprungsprozessor eingesetzt und verfügt über einen 128 KB großen L1-Cache, während der L2-Cache 1024 KB umfasst. Die CPU, die auf zwei verschiedenen Sockeln – Sockel 754 und später der Sockel 939 – eingesetzt wurde, wird im 130-nm-Prozess produziert und verfügt neben der 64-Bit-Fähigkeit auch einen Stromsparmechanismus, der sich „Cool´n´Quiet“ nennt. Er taktet den Prozessor, solange er im Leerlauf arbeitet, auf 800 MHz (C0-Revision) beziehungsweise 1000 MHz (CG-Revision) herunter und senkt gleichzeitig die Spannung. Somit lässt sich die Verlustleistung der CPU enorm verringern und gleichzeitig auch der Stromverbrauch und die Temperatur des Athlon 64 mindern. Im Gegensatz zum Vorgänger Athlon XP sind die verbauten Pipelines zwar etwas länger geworden, im Gegensatz zur Konkurrenz jedoch weiterhin sehr kurz, wodurch unter anderem die hervorragende Pro-MHz-Leistung erklärt wird. Der Clawhammer-Kern taktet beim Athlon 64 von 2000 MHz (3200+) bis 4000+ (2400 MHz); zudem wird er bei den Topprozessoren Athlon 64 FX mit 2200 MHz (FX-51) bis 2600 MHz (FX-55) eingesetzt.
Der Newcastle-Kern besitzt nur eine geringe Veränderung gegen über dem Vorgänger Clawhammer, womit sich jedoch deutlich Transistoren sparen lassen. Der L2-Cache halbiert sich auf 512 KB, wobei als Ausgleich der Takt bei gleichem Rating um 200 MHz erhöht wird. Die Newcastle-Version geht im Modelrating von 2800+ bis 3800+, was 1800 MHz bis 2400 MHz entspricht.
Der Winchester wird von AMD in einem kleineren Fertigungsprozess produziert (0,09 µm anstatt 0,13 µm), weswegen die CPU deutlich kälter bleibt, weniger Strom benötigt und höher getaktet werden kann. Ansonsten gibt es keine Änderungen gegenüber dem Newcastle-Core. Der Winchester taktet von 1800 MHz (3000+) bis 2200 MHz (3500+) und löst die entsprechenden Newcastle-Prozessoren mit dem gleichen Rating ab.
Der Venice-Core ist größtenteils identisch zum Winchester-Kern, allerdings soll es interne Verbesserungen am Speichercontroller gegeben haben, wodurch sich die Performance entsprechender CPUs minimal verbessert haben soll. Das Rating dieser CPUs ist sehr weitläufig und beginnt bei 3000+ und endet bei 3800+. Dies entspricht einem Takt von 1800 MHz bis 2400 MHz. Der San-Diego-Core entgegen besitzt wieder einen 1024 KB großen L2-Cache und soll den Clawhammer-Core ablösen, da dieser noch in 130 nm produziert wird und somit für AMD deutlich unrentabler ist. Entsprechende Kerne werden im Athlon 64 3700+ (2200 MHz) und 4000+ (2400 MHz) sowie den Spitzenmodellen FX-55 (2600 MHz) und FX-57 (2800 MHz) eingesetzt.
Als kostengünstige „Sparversion“ des Athlon 64 entpuppte sich der Sempron und das auch nicht umsonst, immerhin basiert er auf derselben Architektur. Es gibt drei verschiedene Kerne, die sich hauptsächlich in verschiedenen L2-Cachegrößen unterschieden. Ansonsten ist diese CPU identisch zum Athlon 64, auch wenn man auf den Namensgeber des größeren Bruders, also die Fähigkeit 64-Bit-Befehle abzuarbeiten, verzichten muss. Das Rating reicht von 2600+ (1600 MHz) bis 3300+ (2000 MHz), ist jedoch nicht vergleichbar mit dem des Athlon 64.
Am 23. Mai 2006 hat AMD dem Athlon 64 einen neuen Sockel zur Seite gestellt. Mit dem Sockel AM2 hielten neue Prozessorkerne Einzug, das Prozessor-Stepping wurde auf F2 angehoben und neue Features wie DDR2-Support oder eine Virtualisierungstechnologie wurden implementiert. Trotz dieser Neuerungen unterscheiden sich die neuen Athlon 64 im Sockel AM2 in ihrer Performance kaum vom Sockel 939. Alle Details zu den neuen Athlon 64 sind daher in einem gesonderten Testbericht zu [1] finden.
AMD Athlon 64 X2
| Merkmale | Athlon 64 X2 | Athlon 64 X2 Athlon 64 FX |
|---|---|---|
| Logo | ![]() |
![]() |
| Kern | Manchester | Toledo |
| Frontside-Bus | entfällt | entfällt |
| Fertigung | 0,09 µm (SOI) | 0,09 µm (SOI) |
| Sockel | Sockel 939 | Sockel 939 |
| Taktrate oder Modellnummer pro Core |
Athlon 64 X2 3800+ (2000 MHz) 4200+ (2200 MHz) 4600+ (2400 MHz) |
Athlon 64 X2 4400+ (2200 MHz) 4800+ (2400 MHz) Athlon 64 FX FX60 (2600 MHz) |
| Transistoren | 154 Mio. | 233 Mio. |
| DIE-Size | 147 mm² | 199 mm² |
| L1-Cache | 2x 128 kB | 2x 128 kB |
| L2-Cache | 2x 512 KB | 2x 1024 kB |
| VCore (Je nach Modell) |
1,35-1,4 V | 1,35-1,4 V |
| Befehlssätze | MMX 3DNow! 3DNow!+ SSE SSE2 SSE3 AMD64 |
MMX 3DNow! 3DNow!+ SSE SSE2 SSE3 AMD64 |
| Temperatur Diode | Ja | Ja |
| Energiesparfunktion | Ja | Ja |
| NX-Bit (Win XP SP2) | Ja | Ja |
| AMD64/EM64T | Ja | Ja |
| Multiprozessor-fähig | - | - |
| Dual-Core/HTT | Ja/- | Ja/- |
| Dual-Channel-fähig | Ja | Ja |
| TDP (Herstellerangabe) |
110 W | 110 W |
| CPU-Architektur | 17-stufige (FPU) 12-stufige (ALU) Pipeline |
17-stufige (FPU) 12-stufige (ALU) Pipeline |
Der Athlon 64 X2 ist die erste von AMD hergestellte Dual-Core-CPU für den Desktop, die nicht mehr nur mit einem, sondern gleich mit zwei physischen Rechenkerne ausgeliefert wird. Somit ist es theoretisch, wohlbemerkt nur bei angepasster und stark optimierter Software, möglich, dass sich die Geschwindigkeit verdoppelt. Ohne eine solche Anpassung gibt es jedoch keinen Unterschied zu einem normalen Athlon 64 mit nur einem Kern, solange die restlichen technischen Daten identisch sind.
Derzeit hat AMD für den Sockel 939 zwei Dual-Core-Kerne im Angebot, die sich erneut in ihrer L2-Cache-Größe unterscheiden: Während der Toledo mit einem Megabyte L2-Cache auftrumpfen kann, muss sich der Manchester mit 512 KB zufrieden geben. Aufgrund der doppelt vorhandenen Recheneinheit erhöht sich logischerweise auch die Transistoren und müsste somit ebenfalls die Temperatur und der Stromverbrauch steigen. Hier scheint AMD jedoch eine technische Meisterleistung vollbracht zu haben, da dies in beiden Fällen nicht der Fall ist. Der Stromverbrauch steigt nur gering an, ebenso verhält es sich mit der Temperatur.
Der Manchester und der Toledo takten beide gleich, jedoch gibt es bei identischem Takt 200 Rating-Punkte beim Toledo mehr, da dieser eben auf den größeren Cache zurückgreifen kann. Insgesamt reicht das Rating beim Athlon 64 X2 von 4200+ bis 4800+ (2200 MHz bis 2400 MHz), es fällt also deutlich höher als bei den Single-Core-Varianten aus. Trotz der deutlich komplexeren Fertigung taktet der Athlon 64 X2 beinahe gleich hoch wie der „normalen“ Athlon 64. Der Anfang 2006 vorgestellte Athlon 64 FX-60 mit 2,6 GHz [2] liegt im Takt mit dem FX-55 auf einem Level.
Mit der Einführung des Sockel AM2 (Kerne Brisbane und Windsor) und der Vorstellung des Athlon 64 FX-62 wurde der Takt des Athlon 64 FX-57 erreicht. Die Dual-Core-Prozessoren liegen somit im Takt mit den schnellsten Single-Core-Modellen gleich auf.
Intel Pentium 4
| Merkmale | Northwood-Kern | Prescott-Kern | Prescott 2M-Kern | Extreme Edition |
|---|---|---|---|---|
| Logo | ![]() |
![]() |
![]() |
![]() |
| Kern | Northwood | Prescott | Prescott 2M | Gallatin Prescott 2M* |
| Frontside-Bus | 400/533/800 MHz QDR | 533/800 MHz QDR | 800 MHz QDR | 800/1066 MHz QDR 1066 MHz QDR* |
| Fertigung | 0,13 µm | 0,09 µm | 0,09 µm | 0,13/0,09* µm |
| Sockel | Sockel 478 | Sockel 478/LGA 775 | LGA 775 | Sockel 478/LGA 775 LGA 775* |
| Taktrate oder Modellnummer |
400 MHz QDR 1600 bis 2600 MHz in 100-MHz-Schritten 533 MHz QDR 2266 MHz 2400 MHz 2533 MHz 2667 MHz 2800 MHz 3066 MHz* 800 MHz QDR 2400 MHz* 2600 MHz* 2800 MHz* 3000 MHz* 3200 MHz* 3400 MHz* |
533 MHz (S478) 2400 MHz 2800 MHz 533 MHz (LGA775) 505,505 (2666 MHz) 515 (2800 MHz) 800 MHz (S478) 2800 MHz 3000 MHz 3200 MHz 3400 MHz 800 MHz (LGA775) 52x,520J (2,8 GHz) 53x,530J (3,0 GHz) 54x,3.2F, 540J (3,2 GHz) 55x,3.4F, 550J (3,4 GHz) 56x,3.6F, 560J (3,6 GHz) 57x,3.8F, 570J (3,8 GHz) |
800 MHz QDR 620 (2800 MHz) 630 (3000 MHz) 640 (3200 MHz) 650 (3400 MHz) 660 (3600 MHz) 670 (3800 MHz) |
800 MHz QDR 3200 MHz 3400 MHz 1066 MHz QDR 3466 MHz 1066 MHz QDR* 3733 MHz* |
| Transistoren | 55 Mio. | 125 Mio. | 169 Mio. | 169 Mio. |
| DIE-Size | 131 mm² | 112 mm² | 135 mm² | 237 mm² 135 mm²* |
| L1-Cache | 8 KB | 16 KB | 16 KB | 8 KB 16 KB* |
| L2-Cache | 512 KB | 1024 kB | 2048 KB | 512 KB und 2048 KB L3-Cache 2048 KB* |
| VCore (Je nach Modell) |
1,5 V | 1,4 V |
1,4 V | 1,5 bis 1,6 V 1,4 V* |
| Befehlssätze | MMX SSE SSE2 |
MMX SSE SSE2 SSE3 EM64T* *nur bei F- oder xx1 |
MMX SSE SSE2 SSE3 EM64T |
MMX SSE SSE2 SSE3* EM64T* |
| Temperatur Diode | Ja | Ja | Ja | Ja |
| Energiesparfunktion | - | - | Ja | - |
| NX-Bit (Win XP SP2) | - | Ja (nur F- und J-Modellen) | Ja | -/Ja* |
| AMD64/EM64T | - | Ja (nur bei F oder xx1) | Ja | -/Ja* |
| Multiprozessor-fähig | - | - | - | - |
| Dual-Core/HTT | -/Ja* | -/Ja | -/Ja | -/Ja |
| Dual-Channel-fähig | ja | ja | ja | ja |
| TDP (Herstellerangabe) |
46,8 W bis 89 W | 85 W bis 115 W | 85 W bis 115 W | 92 bis 110W 115 W* |
| CPU-Architektur | 20-stufige Pipeline |
31-stufige Pipeline |
31-stufige Pipeline |
20/31*-stufige Pipeline |
Der Intel-Pentium-4-Prozessor kämpfte bei seiner Einführung (Willamette-Kern) nicht nur gegen den Athlon XP, sondern auch mit einer recht geringen Geschwindigkeit, die er unter anderem einer etwas verlängerten Pipeline und einem, für seine Verhältnisse, recht kleinen L2-Cache sowie einer Schwäche der FPU-Einheiten (Floating Point Unit) „verdankte“. Erst bei Einführung des Northwood-Modells verbesserte sich die Leistung, die erstmals gleich oder gar über dem Athlon XP lag, welcher später zusätzlich mit Fertigungsschwierigkeiten zu kämpfen hatte.
Der Northwood-Kern wird in der 130-nm-Technik gefertigt und trägt ungefähr 55 Millionen Transistoren in sich. Die Sockel-478-CPU besitzt je nach Modell einen Frontside-Bus von 400 MHz, 533 MHz oder 800 MHz. Der L1-Cache ist Intel-typisch mit 8 KB recht klein gehalten, während der L2-Cache auf satte 512 KB zurückgreifen kann – dies ist heutzutage zwar in Anbetracht eines 2 Megabyte großen Caches keine Besonderheit mehr, war jedoch damals doppelt so groß wie der des schnellsten Athlon XP. Als Besonderheit konnte man darüber hinaus überrascht feststellen, dass der Intel-Pentium-4-Prozessor – im Gegensatz zur Konkurrenz von AMD – nicht sonderlich warm lief und immer mit einfachen Mitteln gekühlt werden konnte.
Als Neuerung wurde im Pentium 4 von Intel der SSE2-Befehlssatz integriert, welcher heutzutage in Spielen und anderen Applikationen meistens verwendet wird und deutliche Geschwindigkeitsschübe mit sich bringt. Das letzte Modell der Serie mit einem FSB von 533 MHz, welches mit 3066 MHz getaktet ist, brachte bei Erscheinung eine Besonderheit mit sich. Erstmals wurde bei dieser CPU die sogenannte Hyper Threading Technologie, kurz HTT, aktiviert, welche dem Betriebssystem eine zweite CPU vorgaukelt und den Pentium 4 durch eine bessere Verteilung der Threads optimal ausgelasten sollte. Während Hyper Threading früher eine Besonderheit darstellte, ist es bei fast jeder aktuellen P4-CPU aktiviert – die Technik schlummerte Gerüchten Zufolge zwar von Anfang an in jedem Pentium 4, allerdings war sie in den ersten Modellen nicht aktiviert.
Der Pentium 4 ist auf hohe Taktraten, dafür aber eine recht schlechte Pro-MHz-Leistung ausgelegt; so auch der Northwood-Kern. Er erreicht je nach Frontside-Bus eine Taktrate von 1600 MHz bis 3400 MHz und ist so von den heute schnellsten P4-CPUs nicht weit entfernt.
Inzwischen war der Athlon 64 auf den Markt gekommen und bedrängte den Northwood-Kern in Applikationen und vor allem in Spielen. Die Hoffnung der Intel-Gemeinde stellte der Prescott-Kern dar, welcher jedoch mehr Nachteile als Vorteile mit sich brachte. So wurde die Pipeline extrem verlängert, um das Hertz noch schneller schlagen zu lassen. Zudem wurde auf die vorerst extrem schwer zu handhabende 90-nm-Fertigung umgestiegen.
Ebenfalls neu war die Unterstützung des SSE3-Befehlssatz und die Einführung des Sockel 775 (LGA 775), der erstmals die Pins trug. Die Prozessoren besaßen nun – ähnlich wie bei AMD – ebenfalls ein Rating, welches sich jedoch an keinem Konkurrenzprodukt orientierte und nur eine dreistellige Nummer darstellte. Pentium-4-Prozessoren mit dem Prescott-Kern takteten von 2400 MHz bis 3800 MHz.
Da all' dies den P4 jedoch nicht allzusehr beschleunigte und ihn in Spielen immer noch alt gegen den Athlon 64 aussehen ließ, wurde der Prescott-2M-Kern eingeführt. Er besaß als einzigen Unterschied zum Vorgänger einen 2 MB großen L2-Cache und unterstützte von Haus aus, ohne auf verwirrende Modellendungen achten zu müssen, das NX-Bit und EM64T. Zudem besaß der Prescott 2M erstmals eine Energiesparfunktion, die auch bitter nötig wurde, da der Stromverbrauch und auch die Temperatur entsprechender CPUs extrem hoch war. Entsprechende CPUs besaßen einen FSB von 800 MHz QDR und takteten von 2800 MHz bis ebenfalls 3800 MHz.
Als direkter Konkurrent zum Topprozessor Athlon 64 FX von AMD stampfte Intel die „Extreme-Edition“ aus dem Boden. Diese war auf den ersten Blick identisch zum normalen Pentium 4, besaß jedoch einige Besonderheiten. So setzten die ersten Modelle auf den Gallatin-Kern, der eigentlich in Xeon-Server-CPUs eingesetzt wird, und somit besitzt die Extreme-Edition zusätzlich einen 2 MB großen L3-Cache. Entsprechende Prozessoren takteten mit 3200 MHz bis 3460 MHz. Die neueste Extreme-Edition setzt dagegen auf den normalen Prescott-2M-Kern und verliert somit den L3-Cache. Als Ausgleich taktet die CPU mit 3733 MHz.
Anfang 2006 hat Intel darüber hinaus die Strukturen des Prescott2M-Kerns von 90 nm auf 65 nm verkleinert. Der neue Kern hört auf den Codenamen Cedar Mill und kann weiterhin mit 2 MB L2-Cache aufwarten. Der Stromverbrauch konnte mit diesen Prozessoren herabgesenkt werden. Sie tragen die Modellnummer 6x1 und basieren weiterhin auf Weiterentwicklungen der Pentium-4-Architektur (Netburst).
Intel Pentium D und M
| Merkmale | Pentium D | Pentium EE 840 | Pentium M | Pentium M |
|---|---|---|---|---|
| Logo | ![]() |
![]() |
![]() |
![]() |
| Kern | Smithfield | Smithfield | Banias | Dothan |
| Frontside-Bus | 800 MHz QDR | 800 MHz QDR | 400 MHz QDR | 400 MHz QDR 533 MHz QDR |
| Fertigung | 0,09 µm | 0,09 µm | 0,13 µm | 0,09 µm |
| Sockel | LGA 775 | LGA 775 | Sockel 479 | Sockel 479 |
| Taktrate oder Modellnummer |
800 MHz QDR 820 (2800 MHz) 830 (3000 MHz) 840 (3200 MHz) |
800 MHz DDR 840 (3200 MHz) |
400 MHz QDR 1300 MHz 1400 MHz 1500 MHz 1600 MHz 1700 MHz zusätzliche Low- Voltage-Versionen |
400 MHz QDR 715 (1500 MHz) 725 (1600 MHz) 735 (1700 MHz) 745 (1800 MHz) 755 (2000 MHz) 765 (2100 MHz) 533 MHz QDR 730 (1600 MHz) 740 (1733 MHz) 750 (1866 MHz) 760 (2000 MHz) 770 (2133 MHz) 780 (2266) zusätzliche Low- Voltage-Versionen |
| Transistoren | 230 Mio. | 230 Mio. | 77Mio. | 140 Mio. |
| DIE-Size | 213 mm² | 213 mm² | 82,8 mm² | 83,6 mm² |
| L1-Cache | 32 KB (2x16) | 32 KB (2x16) | 64 KB | 64 KB |
| L2-Cache | 2048 KB (2x1024) | 2048 KB (2x1024) | 1024 KB | 2048 KB |
| VCore (Je nach Modell) |
1,2 bis 1,4 V | 1,4 V | 1,48 V | 1,34 V |
| Befehlssätze | MMX SSE SSE2 SSE3 EM64T |
MMX SSE SSE2 SSE3 EM64T |
MMX SSE SSE2 |
MMX SSE SSE2 |
| Temperatur Diode | Ja | Ja | Ja | Ja |
| Energiesparfunktion | Ja | Ja | Ja | Ja |
| NX-Bit (Win XP SP2) | Ja | Ja | - | Ab C0-Stepping |
| AMD64/EM64T | Ja | Ja | - | - |
| Multiprozessor-fähig | Nein | Nein | Nein | Nein |
| Dual-Core/HTT | Ja/- | Ja/Ja | - | - |
| Dual-Channel-fähig | ja | ja | ja | ja |
| TDP (Herstellerangabe) |
130 W | 130 W | 21 W | 21 bis 27 W |
| CPU-Architektur | 31-stufige Pipeline |
31-stufige Pipeline |
unbekannt | unbekannt |
Der Pentium D auf Basis des Smithfield-Cores stellt die Basis des ersten Dual-Core-Prozessors von Intel dar. Dabei handelt es sich, grob gesagt, bei einem Pentium D um einen Prescott-Kern, der einfach zweifach vorhanden ist und nicht direkt miteinander kommunizieren kann. Als einzign Unterschied kann man festhalten, dass Intel dem Pentium D die Hyper-Threading-Unterstützung genommen hat. Den Smithfield kann man als Intels Notlösung auf den Athlon 64 X2 ansehen, da man anscheinend nicht so schnell mit einem Dual-Core-Prozessor des Konkurrenten gerechnet hatte. Dementsprechend besitzt der Pentium D einen FSB von 800 MHz QDR und 1024 KB L2-Cache pro Kern. Die Transistoren steigen mit 230 Millionen drastisch gegenüber dem Prescott an, ebenso der Stromverbrauch unter Last. Den Pentium D gibt es mit einem Takt ab 2800 MHz bis hinauf zu 3200 MHz.
Ebenfalls auf zwei Kerne kann der Pentium EE 840 zurückgreifen, der – wie der Name bereits suggeriert – die neue Extreme Edition darstellt. Der einzige Unterschied zum kleineren Bruder ist das Vorhandensein von HTT – man hat also vier logische Prozessoren zur Verfügung. Der Pentium EE 840 wird mit 3200 MHz ausgeliefert. Genauere Details über den Smithfield-Kern kann man in unserem ausführlichen Test zur Dual-Core-CPU von Intel [3] nachlesen. Der Nachfolger vom Smithfield-Kern hört auf die Bezeichnung Presler und wurde Anfang 2006 vorgestellt. Er basiert auf zwei in 65 nm gefertigten Cedar-Mill-Kernen und ist mit dem neuesten C1-Stepping auch im Stromverbrauch konkurrenzfähig [4] geworden.
Darüber hinaus im Test vertreten ist der Pentium M. Eigentlich ist der Pentium M ein Mobile-Prozessor, sprich er wird vorrangig in Notebooks verbaut. Da die Unzufriedenheit mit dem Pentium 4 mit der Zeit immer größer wurde, und der Pentium M dessen Schwierigkeiten (Temperatur, Verlustleistung, Geschwindigkeit) aufgrund einer Architektur, die stark dem alten Pentium 3 ähnelt, nicht aufwies, stellen immer mehr Hersteller entsprechende Sockel-479-Mainboards her [5], die die Notebook-CPU aufnehmen können.
Der Pentium M passt auf den Sockel 479 und ist somit inkompatibel zum Pentium 4. Es gab lange Zeit nur zwei verschiedene Kerne – den Banias und den neueren Dothan. Während der Banias ausschließlich in der 130-nm-Technik produziert wird und einen FSB von 400 MHz QDR besitzt, hat der Dothan mit 90 nm kleinere Abstände zwischen den Transistoren und bietet neben einem Frontside-Bus von 400 MHz auch eine etwas schnellere 533-MHz-Variante an. Beide Kerne bieten einen 64 KB großen L1-Cache. Der Banias verfügt über einen 1024 KB großen L2-Cache, der Dorthan darf auf 2048 KB zurückgreifen.
Kommen wir nun zu einigen Geheimnissen, die den Erfolg des Pentium M erklären: Der Mobile-Prozessor besitzt im Gegensatz zum Intel Pentium 4 eine deutlich kürzere Pipeline, die gerade einmal halb so lang wie die der Desktop-Variante ist. Somit kann man entsprechende CPUs zwar nicht allzuhoch takten, jedoch ist die Pro-MHz-Leistung sehr gut, weswegen sich der Pentium M auch mit niedrigeren Taktraten selbst vor einem Athlon 64 nicht zu scheuen muss. Ein weiterer Grund ist die sehr niedrige Leistungsaufnahme, die noch nicht einmal unter Last die 30-Watt-Grenze überschreitet. Ebenfalls positiv beeinflusst wird die Leistungsaufnahme von eine intelligenten Stromsparfunktion, die die CPU, solange keine Last anliegt, auf 600 MHz heruntertaktet und – ähnlich wie bei AMDs Cool'n'Quiet – die Spannung stark senkt.
Allerdings besitzt der Pentium M nicht nur Vorteile gegenüber seinen Desktop-Brüdern, da er auf einige Features nicht zurückgreifen kann. So besitzt der stromsparende Pentium beispielsweise keine Hyper Threading Technology, Dual-Core und auch 64-Bit-Support bleibt ihm fremd. Auf das NX-Bit zum Verhindern von Buffer-Overflow müssen entsprechende Besitzer seit dem Dothan-Kern mit C0-Stepping (gilt für alle FSB533-Modelle und ausgesuchte FSB400-Varianten) nicht mehr verzichten. Der Banias-Kern taktet von 1300 MHz bis 1700 MHz, während der Dothan mit 1500 MHz bis 2266 MHz deutlich höher taktet.
Anfang 2006 stellte Intel mit dem Yonah-Kern den Nachfolger des Pentium M vor. Dieser sollte nicht länger den Namen Pentium tragen und wird als Core Duo und Solo [6] vermarktet. Beim Core Duo handelt es sich um einen Dual-Core-Notebook-Prozessor, der mit einem insgesamt 2 MB großen Shared-L2-Cache aufwarten kann. Dieser kann von beiden Prozessorkernen gemeinsam genutzt werden (Smart Cache). Leider bietet der Core Duo/Solo noch kein Support für EM64T. Diese Unterstützung wird erst der Core 2 Duo bieten [7], der im Juli für Desktop und einen Monat später für Notebooks vorgestellt werden soll.
Verwendete Grafikkarten
Kommen wir nun zu den Grafikkarten, bei denen wir uns für vier verschiedene Modelle entschieden haben, damit sowohl die AGP- und die PCIe-Plattformen entsprechend gleich abgedeckt sind. Auf Seiten nVidias treten für beide Interface-Standards eine GeForce 6800 Ultra und eine GeForce 6600 GT an. Bei ATi sind dagegen mit einer Radeon X800 XT-PE für AGP und einer Radeon X850 XT für PCIe nur zwei ehemalige High-End-Modelle im Testfeld.
| GeForce 6600 GT |
GeForce 6800 Ultra |
Radeon X800 XT-PE |
Radeon X850 XT |
|
|---|---|---|---|---|
| Logo | |
|
|
![]() |
| Chip | NV43 | NV40/45 | R420/R423 | R480 |
| Transistoren | ca. 146 Mio. | ca. 222 Mio. | ca. 160 Mio. | ca. 160 Mio. |
| Fertigung | 0,11 µm | 0,13 µm | 0,13 µm low-k | 0,13 µm low-k |
| Chiptakt | 500 MHz | 400 MHz | 520 MHz | 520 MHz |
| Pixel-Pipelines | 8 | 16 | 16 | 16 |
| ROPs | 4 | 16 | 16 | 16 |
| Pixelfüllrate | 2000 MPix/s | 6400 MPix/s | 8320 MPix/s | 8320 MPix/s |
| TMUs je Pixel-Pipeline | 1 | 1 | 1 | 1 |
| Texelfüllrate | 4000 MTex/s | 6400 MTex/s | 8320 MTex/s | 8320 MTex/s |
| Vertex-Pipelines | 3 | 6 | 6 | 6 |
| Dreiecksdurchsatz | 375 MV/s | 600 MV/s | 780 MV/s | 780 MV/s |
| Pixelshader | PS 3.0 | PS 3.0 | PS 2.b | PS 2.b |
| Vertexshader | VS 3.0 | VS 3.0 | VS 2.0 | VS 2.0 |
| Speichermenge | 128 GDDR3 | 256 GDDR3 | 256 GDDR3 | 256 GDDR3 |
| Speichertakt | PCIe: 500 MHz AGP: 450 MHz* |
550 MHz | 560 MHz | 540 MHz |
| Speicherinterface | 128 Bit | 256 Bit | 256 Bit | 256 Bit |
| Speicherbandbreite | 16000 MB/s 14400 MB/s* |
35200 MB/s | 35840 MB/s | 34560 MB/s |
| Präzision pro Kanal | 32Bit (FP32) | 32Bit (FP32) | 24Bit (FP24) | 24Bit (FP24) |
| Interface | PCIe/AGP | PCIe/AGP | PCIe/AGP | PCIe/AGP |
| SLI-Unterstützung | Ja (PCIe) | Ja (PCIe) | Ja (PCIe) | ja (PCIe) |
Testsystem
- Prozessor
- Motherboard
- MSI K7N2 Delta 2 Platinum Edition (Sockel A, nVidia nForce 2 Ultra 400)
- Asus K8N-E Deluxe (Sockel 754, nVidia nForce 3 250 GB)
- Abit AV8 (Sockel 939, Via K8T800 Pro)
- Arbeitsspeicher
- 2x512 MB Kingston HyperX PC3200 CL2-2-2-6-1T [13]
- Grafikkarten
- Inno3D GeForce 6600 GT [14]
- MSI GeForce 6600 GT [13]
- Inno3D GeForce 6800 Ultra [15]
- GigaByte Radeon X800 XT-PE
- Peripherie
- AOpen AAP1648 DVD-Laufwerk
- Hitachi Deskstar 7k250 250 GB SATA HDD (8 MB Cache)
- Seagate 7200.7 120 GB E-IDE HDD (8 MB Cache)
- Samsung SpinPoint P120 200 GB SATA II HDD (8 MB Cache)
- Treiber
- nVidia ForceWare 71.89 [16]
- ATi Catalyst 5.5
- Via Hyperion 455vp1
- nVidia nForce 5.10
- Software
- Microsoft Windows XP Professional SP2
- Microsoft DirectX 9.0c
Benchmarks
Folgende Benchmarks kamen während unseres Tests zum Einsatz:
- Synthetische Benchmarks:
- 3DMark 01 SE Version 330
- 3DMark 05 Version 1.1.0
- Aquamark 3
- Spielebenchmarks:
- Unreal Tournament 2004
- Halo
- Far Cry Version 1.3
- Painkiller Version 1.61
- Splinter Cell: Chaos Theory
- Half-Life 2
- Doom 3
- The Chronicles of Riddick
- Return to Castle Wolfenstein: Enemy Territory
Alle Benchmarks werden mit maximalen Details ausgeführt. Als Einstellungen haben wir uns dabei für 1024x768 ohne Anti-Aliasing und den anisotropen Filter entschieden, um die GPU weitesgehend zu entlasten, was für diesen Artikel entscheidend ist. Darüber hinaus verwenden wir die Auflösung 1280x1024 mit 2xAA und 8xAF, da dies eine gesunde Mischung aus Bildqualität sowie Performance darstellt und somit bei vielen Benutzern einen hohen Anklang findet.
Synthetische Benchmarks
3DMark2001 SE
- Obwohl der 3DMark01 SE bereits seit vier Jahren seinen Dienst verrichtet und technisch nicht mehr auf dem aktuellen Stand ist, wird er immer noch mit großer Beliebtheit von der Community verwendet. Aus diesem Grund und auch, da sich der Benchmark aus dem Hause Madonion, mittlerweile bekannt unter dem Namen Futuremark, immer noch gut dazu eignet die Gesamtperformance eines Systems zu messen, werden wir die zu testenden Treiber unter dem Programm auf Herz und Nieren überprüfen. Darüber hinaus reagiert der 3DMark01 SE sehr empfindlich auf Änderungen am System oder auch am Grafikkartentreiber, weswegen er gerade prädestiniert für diese Aufgabe ist. Technisch gesehen ist, wie bereits erwähnt, der Benchmark nicht mehr auf der Höhe der Zeit, weshalb er eine deutliche CPU-Limitierung aufweist. Der 3DMark01 SE setzt größtenteils auf DirectX 7-Effekte, benutzt die Vertexshader entsprechender Grafikkarten allerdings, um die CPU im Bereich der Schatten und Charakteranimation zu entlasten. Zaghafte Versuche die Pixelshader-Einheiten der Version 1.1 zu benutzen zeigen sich zudem in der letzten der vier Testszenen. Nicht vergessen darf man allerdings, dass der synthetische Benchmark kein Ergebnis eines realen Spiels darstellt, auch wenn er die in Max Payne verwendeten MaxFX-Engine benutzt.
- Download: 3DMark2001 SE [17]
3DMark05
- Der 3DMark05 ist das neueste Produkt aus dem Hause Futuremark und liegt technisch auf sehr hohem Niveau. So kommen große Texturen mit der Auflösung 2048x2048, gemischt mit der Benutzung des Shader-Model 3.0, 2.x oder 2.0, zum Einsatz. Das letztes Jahr erschienene Programm setzt auf komplexe Lichteffekte, dynamische Schatten, aufwendige Bump Mapping-Effekte und benötigt vor allem eine hohe Geometrieleistung. Im Ergebnis spiegelt sich allerdings nur die Geschwindigkeit der Grafikkarte wieder, da diese selbst bei aktueller Hardware immer den Flaschenhals darstellt. Der wohl größte Nachteil beim 3DMark05 sind die weitläufigen Treiberoptimierungen aller aktuellen Grafikkartenhersteller. Diese gehen soweit, dass sich die Endergebnisse je nach Treiber im zweistelligen Prozentbereich verändern, somit können qualitätsmindernde Optimierungen nicht ausgeschlossen werden. Zudem basiert der synthetische Benchmark auf keinerlei Spieleengine, weshalb er keine reale Situation darstellt. Weitere Details zu diesem Programm gibt es in einem unserer ausführlichen Artikel [18].
- Download: 3DMark05 [19]
AquaMark 3
- Kommen wir nun zu dem letzten synthetischen Benchmark in unserem Testparcours. Das von Massive Development entwickelte Programm nutzt eine erweiterte Version der Grafikengine aus dem U-Boot-Spiel AquaNox 2 - Revelation. Die Engine hört auf den Namen Krass und unterstützt mittlerweile auch Pixelshader 2.0-Effekte. Darüberhinaus kommen noch Pixelshader der älteren Version 1.1 sowie 1.4, weiterhin auch die Vertexshader 1.1, zum Einsatz. Angereichert mit einigen schönen Effekten, wie zum Beispiel einem verbesserten Partikelsystem, soll dies laut den Entwicklern der erste DirectX 9-fähige Reality-Benchmark der Welt sein.
- Download: AquaMark3.com [20]
Spielebenchmarks
Unreal Tournament 2004
- Unreal Tournament 2004 ist der ein Jahr später erschienene Nachfolger des Ego-Shooters UT 2003. Technisch basiert er auf der selben Engine, allerdings wurde diese minimal modifiziert. So wird nun ein zarter Gebrauch der Vertexshader gemacht, auch Pixelshader der Version 1.4 kommen zum Einsatz um Berechnungen schneller durchführen zu können. Weiterhin ist eine starke Transform and Lighting-Einheit entscheidend für die Performance, da UT 2004 umfangreichen Gebrauch davon macht. Die von uns verwendete „Primeval-Timedemo“ stammt von den Kollegen des 3DCenter [21] und zeigt eine Szene auf der weitläufigen Map Primeval. Hochauflösende Texturen, hohe Sichtweiten und ein starkes Gegneraufkommen mit schwerem Waffenfeuer und dementsprechend vielen Effekten werden geboten. Die Timedemo ist ebenfalls erst in höheren Qualitätsmodi GPU-fordernd.
Halo
- Das zuerst auf der Spielekonsole Xbox erschienene Spiel Halo besitzt eine Benchmarkfunktion mit integrierter Timedemo. Da Halo dank recht massivem Einsatz des Shader-Model 2.0 technisch anspruchsvoll ist, haben wir es zu der Liste der zu testenden Programme hinzugefügt. Aber das Spiel bietet technisch mehr als nur Shader-Effekte. So hat der Entwickler Gearbox dezente Szenen mit Rauch eingebaut, ebenso viele mit Bump Mapping überzogene Texturen, wodurch es insgesamt anspruchsvoll wird und die Füllrate der Grafikkarte wie zum Frühstück verspeist. Leider funktioniert in Halo aufgrund von Fullscreen-Effekten kein Anti-Aliasing, weshalb wir die Qualitätseinstellungen für das Spiel auf 1280x1024 mit 8xAF heruntergeschraubt haben.
Far Cry
- Far Cry gehört wohl zweifellos zu den technisch am weitesten entwickelten Spielen und sieht dementsprechend auch sehr gut aus. Es gibt fast kein Feature einer Grafikkarte, dass die Programmierer vom deutschen Entwicklerteam Crytek nicht bedacht und implementiert haben. Die Liebe zur Grafik geht sogar soweit, dass Features wie die Unterstützung des Shader-Model 3, High Dynamic Range oder die Texturkompression 3Dc [22] nachträglich per Patch eingebaut werden. Dementsprechend fordert Far Cry das Maximum an Leistung aus jedem PC und eignet sich somit hervorragend als Benchmark.
In unserem Test verwenden wir die Pier-Timedemo, die die Kollegen des Print-Magazins PC Games Hardware [23] aufgenommen haben. Diese Timedemo zeigt einen Ausschnitt des Levels „Pier“ und besteht somit aus weitläufigen Außenarealen mit einer extremen Sichtweite. Es werden aufwendige Wassereffekte dargestellt sowie eine hohe Anzahl von Polygonen, die den Rechner aufs Höchste beanspruchen. Die Texturen sind durchgehend detailliert und sehr aufwendig gestaltet. Bei der getesteten nVidia-Karte kommt das Shader-Model 3 zum Einsatz, während sich die ATi-Karte aus technischen Gründen auf das Shader-Model 2.b beschränken muss. Deswegen gibt Far Cry auch einen kleinen Einblick in die zukünftige Welt der Spiele und ist quasi ein Muss für jeden Grafiktest.
Half-Life 2
- Half-Life 2 ist wohl zweifellos aufgrund seines legendären Vorgängers eines der meist erwarteten Spiele aller Zeiten gewesen. Nun ist es da und begeistert nicht nur in spielerischer Hinsicht, sondern auch durch seine Grafik, die unter anderem durch massiven Shader Model 2.0-Einsatz ermöglicht wird. Für Half-Life 2 haben wir uns eine eigene Timedemo aufgenommen. Sie spielt in der Map „Coast_09“, welches zu den anspruchsvollsten Levels im gesamten Spiel gehört. Es zeigt eine Szene, in der der Held Gordon Freeman in einem kleinen Hovercraft-Boot auf einem Fluss fährt und gleichzeitig herabfallenden Bomben eines Helikopters ausweichen muss, die effektvoll explodieren. Die Timedemo stellt ein regelrechtes „Worst-Case“-Szenario dar; wenn dort alles flüssig läuft, sollte dies auch im restlichen Spiel der Fall sein. Anspruchvoll sind dabei aber nicht alleine die Pixelshader-Effekte. So gibt es massig aufwendige Partikeleffekte, ebenso sehr detaillierte Texturen. Die Umwirbelungen der Luft auf dem Wasser, die durch den Rotor des Helikopters erzeugt werden, stellen höchste Anforderungen an die Grafikkarte und zwingen diese mit Leichtigkeit in die Knie.
Painkiller
- Bei Painkiller benutzen wir die im Spiel integrierte Timedemo „City on Water – C5L1“, welche einen Kamerarundflug durch eine Stadt darstellt. Dabei haben wir das Spiel auf die Version 1.61 aktualisiert, da mit diesem Patch neue Grafikeffekte vom Addon „Painkiller: Battle out of Hell“ in das Hauptprogramm eingeflossen sind. So benutzt die Grafikengine nach dem Update auf nVidia-Grafikkarten das neue Shader-Model 3.0; neue ATi-Hardware muss sich dagegen auf das ältere SM2.0 beschränken. Weiterhin wurde unter anderem ein Bloom-Effekt integriert, welcher einen ähnlichen, wenn auch längst nicht so komplexen und vor allem dynamischen Effekt wie High Dynamic Range-Rendering erzeugt. Darüber hinaus protzt das Spiel mit atemberaubend detaillierten und scharfen Texturen. Für das Auge ist somit allerlei geboten und die eingesetzt Hardware muss Schwerstarbeit verrichten. Insgesamt muss man allerdings sagen, dass die Timedemo deutlich durch den Prozessor limitiert ist und die Unterschiede zwischen den Qualitätsmodi somit geringer ausfallen als erwartet.
Splinter Cell 3
- „Chaos Theory“ ist der Titel des dritten Teils der bekannten Schleichreihe „Splinter Cell“ vom Publisher Ubi Soft und setzt auf ein stark modifiziertes Grundgerüst der zweiten Unreal-Grafikengine auf. Diese wurde für den neuesten Splinter Cell-Spross deutlich umgeändert und unterstützt nun neben dem Shader-Model 3.0 unter anderem auch High Dynamic Range-Effekte. Somit ist Splinter Cell 3 das zweite Spiel neben Far Cry, welches einen deutlich erweiterten Wertebereich der erfassbaren Lichtintensität aufweisen kann. Weiterhin kann das Spiel mit schönen Schatten- sowie Bump Mapping-Effekten auftrumpfen. Die zum Spiel mitgelieferte Timedemo zeigt einen kleinen Ausschnitt aus der ersten Mission, die den Hauptprotagonisten Sam Fischer über einen dunklen Strand bei Regen und durch eine mit schicken Lichteffekten verzierte Höhle führt. Die nVidia-Karte wird dabei auf das SM 3.0 zurückgreifen, während sich die ATi X800 mit dem SM 1.1 begnügen muss, da es keinen Fallback auf das Shader-Model der Version 2.0 gibt. Alle exklusiven SM 3.0-Effekte, wie beispielsweise HDR oder Parallax-Mapping, werden deaktiviert, damit die GeForce-Karte nicht benachteiligt wird.
Doom 3
- Angst? Schock? Dunkelheit? Grafikpracht? All dies gibt es wohl zu Genüge im Gruselshooter Doom 3. John Carmack, einer der Chefentwickler des Spiels und eine legendäre Persönlichkeit wenn es um spektakuläre Grafik-Engines geht, hat bei seinem neuesten Werk die größte Aufmerksamkeit den Stencil-Schatten gewidmet. Dementsprechend dunkel ist das gesamte Spiel, damit die schablonenartigen Schatten gut auf den Spieler wirken. Aber dies waren noch nicht genug Effekte für den Entwickler ID-Software. So macht Doom 3 auch Gebrauch von den Pixelshader-Einheiten der Grafikkarten und setzt ebenfalls massiv auf Bump Mapping sowie Normal Maps. Zwar sind die Texturen verbesserungswürdig, aber trotzdem gehört Doom 3 zu den anspruchsvollsten Titeln des Jahres 2004 und ist somit prädestiniert für unseren Benchmarkparcours. Das Spiel setzt ID-typisch nicht auf DirectX als API, sondern auf OpenGL.
The Chronicles of Riddick
- „The Chronicles of Riddick“ lehnt sich an den Kinofilm „Riddick: Chroniken eines Kriegers“ an und basiert auf der OpenGL-API. Dabei gehört Riddick zu einer der größten Überraschungen des Jahres und bietet dementsprechend auch eine sehr fordernde und vor allem spektakuläre Grafik. Dabei kommen nicht nur die modernen Shadereinheiten aktueller Grafikkarten zum Zuge, auch durch hochauflösende Texturen sowie feinste Bump Mapping-Effekte geraten heutige GPUs ins Schwitzen. Die verwendete Timedemo Mainframe 2 zeigt einen reellen Spielausschnitt aus Riddick, welcher mehrere Schusswechsel, Explosionen sowie Rauch beinhaltet, und zeigt somit eine für das Spiel realistische Performancedarstellung.
RTCW: Enemy Territory
- Return to Castle Wolfenstein: Enemy Territory basiert auf einem modifiziertem Quake 3-Grundgerüst
und sieht dementsprechend etwas angestaubt aus. Es gibt keinerlei aufwendigen Spezialeffekte und somit auch kein Bump Mapping, Shader-Einsatz oder sonstige, hoch entwickelte Grafiktechniken. Allerdings gibt es massiven Einsatz von Rauch in der von uns verwendeten Radar-Timedemo, welche beim 3DCenter [20] zu finden ist. Somit stellt das Spiel dennoch einen recht guten Indikator für die Geschwindigkeit dar. Ein weiterer Grund das Spiel zu benutzen ist, dass es nicht auf DirectX setzt, sondern zu einem der wenigen OpenGL-Spiele gehört.
- Download: RtCW: Enemy Territory [24]
Performancerating
Unser bekanntes Performancerating aus der Fülle an Benchmarks abzuleiten, stellt uns in diesem Artikel vor eine kaum zu bewältigende Aufgabe. Drei Grafikkarten auf Dutzenden Prozessoren in unzähligen Benchmarks – rein theoretisch könnte man die nächsten zwanzig Seiten mit kumulierten Diagrammen füllen. Wir haben uns im Folgenden dazu entschieden, die Leistungen der Grafikkarten bei hoher Qualität über die ganze Spanne der AMD-Prozessoren darzustellen. Der Übersichtlichkeit halber haben wir das Spektrum der CPUs, das vom Athlon XP 1500+ bis zum Athlon 64 FX-57 reicht, in sechs Einzelspektren unterteilt.
XP 1500+ - 2000+ Qualität
Angaben in Prozent
|
XP 2100+ - 2600+ Qualität
Angaben in Prozent
|
XP 2800+ - 3200+ Qualität
Angaben in Prozent
|
A64 2800+ - 3200+ Qualität
Angaben in Prozent
|
A64 3400+ - 3800+ Qualität
Angaben in Prozent
|
A64 4000+ - FX-57 Qualität
Angaben in Prozent
|
Die Ergebnisse entsprechen unsere Erwartungen. Während die GeForce 6600 GT in der niedrigsten Leistungsklasse (XP 1500+ XP 2000+) noch rund 80 % der Leistung der High-End-Grafikkarten derselben Generation, die von den CPUs nicht mit genügend Daten versorgt werden können, erbringt, fällt sie mit steigender Prozessorleistung sukzessive zurück. Je schneller der Prozessor, desto deutlicher können sich Radeon X800/X850 XT-PE und GeForce 6800 Ultra von der Mittelklassekarte absetzen. Auf Pentium-4- oder Pentium-M-Prozessoren ändert sich an diesem Bild verständlicherweise nichts.
Und noch eine Erkenntnis können wir aus den Diagrammen ableiten: Die ATI-Karte skaliert leicht besser mit der steigenden Leistung der Prozessoren, so dass sie ab Athlon 64 2800+ die Führung gegenüber dem nVidia-Modell übernimmt.
Stromverbrauch
Für die Messungen der Stromaufnahme wird ein handelsüblicher Verbrauchs-Monitor, den man sich auch beim örtlichen Stromversorger ausleihen kann, genutzt. Gemessen wird die Gesamt-Stromaufnahme des Testsystems. Wir unterscheiden zwischen Idle- (Leerlauf) und Last-Betrieb. Bei allen Systemen kam mit der GeForce 6800 Ultra dieselbe Grafikkarte zum Einsatz.
Unter Windows
Unter Last
Fazit
Auch wenn es dem Artikel ohne Frage gut getan hätte, schon vor Monaten das Licht der Welt zu erblicken, behält der umfangreiche Test dennoch seine Aussagekraft: Eine schnelle Grafikkarte verlangt nach einer schnellen CPU. Und in Zeiten von SLI und CrossFire hat diese Erkenntnis noch einmal deutlich an Gewichtung gewonnen. Auch wir haben der Entwicklung erst vor wenigen Tagen erneut Tribut gezollt und unser Grafikkartentestsystem [25] mit einem schnellen Athlon 64 FX-60 ausgerüstet.
Wir werden also auch in Zukunft aktuelle Grafikkarten mit den schnellsten am Markt erhältlichen Prozessoren testen, um eine Aussage über die maximale Leistungsfähigkeit der Platine treffen zu können. Mit Blick auf den heutigen Artikel sollte allerdings jeder potentielle Kunde eines solchen High-Tech-Geschosses immer bedenken, dass Leistungen, wie sie auf einem state-of-the-art Testsystem erzielt werden, in den heimischen vier Wänden auf dem betagten Prozessor nicht unbedingt reproduziert werden können. Ja, und dies dürfte teilweise die wichtigste Schlussfolgerung sein, vielerorts wären die gleichen Resultate auch mit einem deutlich preiswerteren Beschleuniger möglich gewesen. Der Preis einer Karte ist nicht vom Rest des Systems abhängig, die Leistung sehrwohl. Und so kann ein topaktuelles Modell, das auf einer extrem schnellen CPU noch ein passables Preis-Leistungs-Verhältnis aufweist, auf einer langsameren Recheneinheit zu einer vergleichsweise schlechten Partie für jeden investierten Euro werden.











