ComputerBase

Test: Intel Pentium 4 2,2 GHz vs AthlonXP 2000+

von Frank Hüber

Vorwort

Es gibt wohl kein Thema, bei dem die Meinungen weiter auseinander gehen und sich die Gemüter mehr erhitzen als bei dem Vergleich zwischen Intel- und AMD-Prozessoren. Oft wird dabei aber allzu gerne von den Fakten und belegbaren Vorzügen des einen Kandidaten schlichtweg keine Kenntnis genommen, sondern die meisten beharren auf einem oft auch emotionalen Standpunkt, den sie mit allen Mitteln vertreten.

Um genau dieses zu ändern und etwas Licht ins Dunkel zu bringen, haben wir uns in diesem Review die Spitzenmodelle von Intel und AMD deshalb etwas genauer angesehen und gegeneinander antreten lassen. Dabei soll es aber nicht nur um die reine Geschwindigkeit der Prozessoren gehen, sondern auch unsere Erfahrungen in Sachen Stabilität und Kompatibilität wollen wir euch nicht vorenthalten. Ein Abwägen der Features zählt ebenso zu den Pflichtpunkten wie die Frage, ob sich AMDs "Performance-Rating", obwohl von AMD ausdrücklich nicht so ausgelegt, auf die Performance des Pentium 4 umlegen lässt.

Da wir uns in diesem Review vornehmlich mit der Geschichte und den Neuerungen des Pentium 4 auseinandersetzen und nicht noch einmal auf den Athlon XP eingehen werden, lege ich allen Lesern dieses Review zuerst unser AMD Prozessor Roundup [1] ans Herz.

Geschichte

Mit der Geschichte der Intel Prozessoren haben wir uns ja bereits im letzten Artikel zu genüge beschäftigt. Jedoch vernachlässigten wir dabei absichtlich den Pentium 4, um seine Geschichte und Neuerungen an genau dieser Stelle unter die Lupe zu nehmen.

Bevor wir aber auf seine Features im Einzelnen eingehen, beschäftigen wir uns zuerst mit der äußerlichen Entwicklung des Prozessors.

Da man beim Pentium III durch weitere Taktsteigerungen nur noch marginale Leistungszuwächse verzeichnen konnte, entwickelte Intel mit dem Pentium 4 einen komplett neuen Prozessor, der kaum noch etwas mit seinen Vorgängern zu tun hat. Er basiert dabei auf einer neuen Architektur, NetBurst genannt. Doch dazu später mehr.

Als der Pentium 4, der übrigens nur noch im FC-PGA Format produziert wird und nicht wie seine Vorgänger auch in einer Slot-Version, auf den Markt kam, stellte er erst einmal neue Ansprüche an Netzteile und Gehäuse. Da er einen sehr großen Kühlkörper benötigt, um die Verlustwärme auch schnell genug von der CPU zu transportieren, kann man ihn nicht mehr nur an dem CPU-Sockel befestigen, sondern zusätzlich noch am Mainboard. Würde man ihn nur am Sockel festklemmen, bestünde wegen des hohen Gewichts immer die Gefahr, dass man den Sockel beim Transportieren des PCs vom Board reißt und somit das Board zerstört. Um diesem Problem aus dem Weg zu gehen, sah Intel bei dem Sockel 423 vier zusätzliche Löcher um den CPU-Sockel vor, über die man den Kühlkörperhalter (Rentention-Modul) genannt, direkt mit dem Gehäuse verschraubt. Diese Verschraubmöglichkeiten boten die meisten Boardträger der Gehäuse aber damals noch nicht, so dass die Board- und Gehäuse-Hersteller gezwungen waren, auf Intels neue ATX 2.03P1-Spezifikation umzusteigen. Sie legt die genaue Position des Prozessors auf dem Board fest und erlaubt so eine einheitliche Bauweise der Gehäuse. Das benötigte Rentention-Modul lieferte Intel damals gleich mit und überließ die wichtige Befestigungsmethode des Kühlers nicht mehr den Kühlkörperherstellern.

Pentium 4 Sockel423-Rentention-Modul
Pentium 4 Sockel423-Rentention-Modul

Doch damit noch nicht genug. Der Pentium 4 stellte auch neue Anforderungen an die zu verwendenden Netzteile, doch darauf gehen wir im weiteren Verlauf des Reviews noch genauer ein, da sie auch beim Sockel 478 noch nicht an Bedeutung verloren haben. Sicherlich erleichterten die neuen Anforderungen an das Gehäuse und Netzteil die Einführung des Pentium 4 nicht gerade, da einige Hersteller doch etwas verzögert auf den neuen Zug aufsprangen und manche anfänglich sogar versuchten um die neuen Spezifikationen herumzukommen. Mittlerweile halten sich aber alle Hersteller an die neuen Vorgaben. Trotzdem sollte man bei dem Kauf eines neuen Gehäuses oder Netzteiles immer noch auf die Bezeichnung "Pentium 4 tauglich" achten. Mit dem i850 setzte Intel zudem voll und ganz auf Rambus-Speicher, der damals durch seinen höheren Preis gegenüber SD- und DDRRAM viele Kunden auch vor einem Kauf des Pentium 4 abschreckte.

Doch einige eben beschriebene Eigenschaften gehören schon wieder der Vergangenheit an. Jedem dürfte bekannt sein, dass Intel beim Pentium 4 bereits einen Sockelwechsel vollzogen hat, vom Sockel423 auf den Sockel478.

So benötigt man nun beim Sockel 478 nicht mehr zwingend ein Pentium 4 taugliches Netzteil. Dies hängt jedoch von dem jeweiligen Mainboard ab und ob der Hersteller an Intels Vorgaben vorbei arbeitet. Intels Spezifikationen geben den 12 Volt Stecker nämlich noch vor. Auch das Rentention-Modul wurde verändert und stellt nun eine Art Umrandung für den Kühlkörper dar, die bereits fest mit dem Mainboard verbunden ist und nicht mehr zusätzlich mit dem Gehäuse verschraubt werden muss.

Zeitgleich mit dem Umstieg auf den Sockel 478 wechselte man vor der Konkurrenz auf die neue 0,13µm Technologie und sichert so einen Betrieb jenseits der 3 GHz-Grenze.

Doch das ist natürlich nicht alles, was den Pentium 4 mit Willamette-Kern und Sockel423 vom neuen Pentium 4 mit Northwood-Kern und Sockel478 unterscheidet. Den Unterschieden dieser beiden Prozessoren und einem Vergleich zum Athlon XP widmen wir uns deshalb im nächsten Abschnitt.

Überblick

Merkmale Pentium 4 (alt) Pentium 4 (neu) Athlon XP
Kern Willamette Northwood Palomino
Fertigung 0,18µm 0,13µm 0,18µm
Sockel 423 478 SockelA
Taktrate 1300-2000MHz 1600-2200MHz 1333-1666 MHz
Transistoren 42 Millionen 55 Millionen 37,5 Millionen
DIE-Size 217 mm2 146 mm2 128 mm2
Front-Side-Bus 100 MHz / 400 MHz QDR 100 MHz / 400 MHz QDR 133 MHz / 266 MHz DDR
L1-Execution-Cache 12.000 µ-Ops (Trace Cache) 12.000 µ-Ops (Trace Cache) 64 KB
L1-Daten-Cache 8 KB 8 KB 64 KB
L1-Takt CPU-Takt CPU-Takt CPU-Takt
L2-Cache 256KB 512 KB 256KB
L2-Bandbreite 256 Bit 256 Bit 64 Bit
L2-Cache-Takt CPU-Takt CPU-Takt CPU-Takt
Hardware Data Prefetching Ja Ja Ja
VCore 1,75 Volt 1,5 Volt 1,75 Volt
Befehlssätze MMX
SSE / SSE2
MMX
SSE / SSE2
MMX / 3DNow!
3DNow!+ / SSE
Temperatur Diode Ja Ja Ja (noch nicht ausgereift)
Multiprozessor-fähig Nein Nein Nein
Speichertypen SDRAM, DDR-SDRAM
RDRAM
SDRAM, DDR-SDRAM
RDRAM
SDRAM, DDR-SDRAM
CPU-Architektur 20-stufige Pipeline 20-stufige Pipeline 15-stufige (FPU)
10-stufige (ALU) Pipeline

Die Tabelle zeigt zwar sehr schon die Unterschiede der einzelnen Prozessoren auf, jedoch gibt sie mitnichten einen Aufschluss darüber, welcher Prozessor denn nun der schnellste ist. Denn auch die besten technischen Daten nützen nur bedingt etwas, wenn nicht auch das Zusammenspiel all dieser Komponenten einwandfrei funktioniert. Hier spielt Intels 20 stufige Pipeline eine enorm wichtige Rolle, doch darauf gehen wir später genauer ein.

Pentium 4
Pentium 4
Pentium 4 Pins
Pentium 4 Pins

Pentium 4 im Vergleich zum Euro
Pentium 4 im Vergleich zum Euro
Vergleich der Unterseiten
Vergleich der Unterseiten

Die Tabelle macht auch die Unterschiede zwischen dem Willamette und Northwood sehr schön deutlich. Im Zuge des geschrumpften Fertigungsprozesses stellte Intel zusätzlich noch die Leiterbahnen von Aluminium auf Kupfer um, da Kupfer der bessere Leiter ist. Außerdem konnte Intel auf der nun kleineren DIE-Fläche 512 KB anstatt wie bisher beim Willamette 256 KB L2-Cache unterbringen. Durch diese 256 KB mehr Cache des Northwood ist auch der Anstieg der Transistoren um 13 Millionen zu erklären, die alle auf den zusätzlichen Cache zurückzuführen sind. Ansonsten hat sich neben einer ebenfalls durch den neuen Fertigungsprozess begründeten niedrigeren Kern-Spannung und somit auch geringeren Abwärme nicht viel geändert.

Zumindest auf dem Papier hat Intels Pentium 4 dem Athlon XP technologisch und technisch einiges voraus. Ob sich dies auch in Leistung umschlägt, beleuchten wir natürlich im weiteren Verlauf des Reviews.

300mm Wafer
300mm Wafer
Wafer 0.18 (PentiumIII)
Wafer 0.18 (PentiumIII)
300mm Wafer
300mm Wafer

Eine weitere nicht direkt auf den Prozessor bezogene Änderung hat Intel ebenfalls im Zuge der Umstellung des Fertigungsprozesses vorgenommen. Intel verwendet nun größere Wafer, d.h. die Wafer-Scheiben sind nun 300 anstatt 200 Millimeter im Durchmesser. Dies hat zum einen den Vorteil, dass fast doppelt so viele CPU-Kerne auf einen Wafer passen und zum anderen wird der Verschnitt, der bei einem runden Wafer logischerweise entsteht, bei einem größeren Wafer prozentual deutlich gesenkt. Da Intel den Fertigungsprozess von 0.18µm auf 0.13µm umgestellt hat, macht sich die Vergrößerung der Wafer gleich doppelt bezahlt. Auf einem alten Wafer fanden noch 144 Willamette-Kerne Platz, auf einem 300 Millimeter großen Wafer dafür schon knapp über 200. Durch den neuen Fertigungsprozess wird diese Zahl noch einmal auf maximal 484 Northwood-Chips erhöht. Die erheblich bessere Ausbeute eines Wafers senkt natürlich auch die Produktionskosten, was sich früher oder später auch in den Preisen niederschlagen sollte. Im Moment produziert Intel noch auf 200 Millimeter großen Wafern, doch der Umstieg ist in vollem Gange.

Größenvergleich
Größenvergleich
Größenvergleich

Legt man einen Northwood neben einen Athlon XP fällt sofort auf, dass der Pentium 4 dank seines Vorsprungs in der Fertigungstechnik um einiges kleiner ist und einen so genannten Heat Spreader besitzt, der den Prozessor-Kern bedeckt. Doch dazu mehr in unserem nächsten Abschnitt, der Technik des Pentium 4.

Technik

NetBurst Architektur

Als erstes wenden wir uns nun dem Oberbegriff für Intels neue Technik des Pentium 4 zu: Der NetBurst Architektur.

NetBurst
NetBurst

Um den Ansprüchen des schnell wachsenden Prozessor-Marktes auch in Sachen Geschwindigkeit gewachsen zu sein, ist es bei Intel üblich alle 3-5 Jahre eine von Grund auf neue Prozessor-Architektur zu entwickeln. Die zuletzt von Intel eingeführte Architektur war die P6 Mikro Architektur, die 1995 mit dem Pentium Pro erstmals zum Einsatz kam. Doch knapp über der 1 GHz Grenze stieß diese Architektur an ihre Grenzen und Intel war gezwungen eine neue zu entwickeln, was man mit der NetBurst Architektur getan hat. Das folgende Blockdiagramm und die DIE-Ansicht geben einen kurzen Überblick über die einzelnen Bausteine der neuen Architektur, auf die wir im Weiteren genauer eingehen werden.

Pentium 4 Design
Pentium 4 Design
Pentium 4 Architektur
Pentium 4 Architektur

Doch zuerst ein kleiner Einblick in die von Intel vorgenommenen Kennungen auf dem Pentium 4. Sie geben Aufschluss über den Prozessortakt, die Cache-Größe, den Front-Side-Bus, die Kern-Spannung und das Produktionsland. Doch alles weitere verdeutlicht die folgende Grafik:

Pentium 4 Prozessor-Kennung
Pentium 4 Prozessor-Kennung

Hyper Pipelined Technology

Die neue Pipeline des Pentium 4 ist sicherlich die grundlegendste und gleichzeitig auch in vielerlei Hinsicht weitreichendste Änderung im Vergleich zu seinen Vorgängern. Die Pipeline ist mit 20 Stufen doppelt so lang wie die des Pentium III. Die verlängerte Pipeline hat den enormen Vorteil, dass sie sehr viele Aufgaben auf einmal erledigen kann und erst durch sie werden die hohen Taktraten des Pentium 4 überhaupt erst möglich. War der Pentium III mit seiner 10 stufigen Pipeline doch schon bei einem Gigahertz in der 0.18µm Technik am Ende, so startete der Pentium 4 erst bei 1.4 GHz, obwohl er damals auch noch in 0.18µm gefertigt wurde.

Doch zunächst sollten wir erst einmal genauer auf die 20 stufige Pipeline eingehen.

Pentium 4 Pipeline
Pentium 4 Pipeline

Da die meisten wahrscheinlich nicht viel mit dem Begriff „Pipeline“ und der Bedeutung anfangen können, sehen wir uns zuerst die Grundlagen einer in Reihe geschalteten und einer gestuften Pipeline an. Wir gehen zur Vereinfachung von fünf einzelnen Schritten aus, die durchgeführt werden müssen, um eine Operation vollständig abzuschließen. Hierbei sind in vereinfachter Form die folgenden fünf Punkte von Bedeutung:

Eine CPU ohne Pipeline arbeitet diese Schritte einzeln nacheinander ab und startet erst wieder von neuem, wenn ein Befehl komplett ausgeführt wurde. Deshalb befinden sich in unserem Beispiel immer vier der fünf Abteilungen im inaktiven Modus und nur ein Bereich arbeitet. Bei einer CPU mit Pipeline wird genau dies verhindert. Hier arbeiten immer alle fünf Abschnitte, so dass eine unnötige Inaktivität einzelner Bereiche ausgeschlossen wird. Sobald die erste Instruktion einen Bereich verlassen hat, wird gleich der nächste geladen. Es befinden sich somit immer fünf Instruktionen gleichzeitig in der Bearbeitung.

Bei einer 20 stufigen Pipeline, wie sie der Pentium 4 besitzt, befinden sich somit 20 Instruktionen gleichzeitig in der Bearbeitung und alle Bereiche sind ständig beschäftigt. Deshalb darf es auch in keinem Bereich zu einer Verzögerung kommen, da sonst alle anderen Bereiche warten müssen und die Arbeit erheblich ausgebremst wird. Doch dazu kommen wir später noch einmal zurück.

Die höheren Taktraten des Pentium 4 sind vor allem dadurch zu erreichen, dass die einzelnen Schritte jedes Befehls in kleinere Teile aufgeteilt wurden, die einzeln schneller bearbeitet werden können als der komplette Befehl.

Dies hat bei einer 20 stufigen Pipeline natürlich auch seine Nachteile. Ein Befehl muss nun mehr Teilbereiche durchlaufen als früher, um schlussendlich bearbeitet worden zu sein, und dadurch erhöht sich die Gesamtzeit in der eine Operation abgeschlossen ist. Genau hierin liegt auch der Grund, warum ein Pentium 4 mit 1 GHz langsamer wäre als ein Pentium III mit 1 GHz bei einer Software, die nicht speziell auf den Pentium 4 ausgelegt ist! Der Pentium III kann die einzelnen Operationen dank seiner nur 10 stufigen Pipeline schneller abarbeiten als der Pentium 4 bei gleicher Taktfrequenz. Dafür kann der Pentium III eben gerade auch wegen seiner nur 10 stufigen Pipeline aber bei weitem nicht die Taktraten eines Pentium 4 erreichen. Damit der Pentium 4 zu seinem Debüt nicht gleich langsamer als sein Pentium III Pendant abschneidet, hat Intel ihn wohl auch zuerst mit 1.6 GHz beginnen lassen.

Dieser Punkt ist für das weitere Verständnis der Ergebnisse enorm wichtig, da er auch erklärt, warum ein Pentium 4 bei gleichem Takt nicht schneller ist als ein Athlon XP, der einen Mix aus 10 und 15 stufiger Pipeline verwendet. Deshalb finden wir es auch immer etwas bedenklich, wenn ein Pentium 4 mit einem Athlon XP gleichen Taktes verglichen wird. Hier sollte man schon vorher wissen, dass in diesem Fall der Athlon XP in den meisten Anwendungen schon alleine wegen seiner Architektur die Nase vorne haben sollte. Doch muss auch jedem klar sein, dass ein Athlon XP mit seiner derzeitigen Architektur nicht die Taktraten eines Pentium 4 erreichen kann.

Intel und AMD gehen hier momentan zwei verschiedene Wege. Intel muss bei seinem Pentium 4 die Taktrate wegen seiner Architektur deutlich höher ansiedeln, um in derselben Zeit gleich viele Operationen abhandeln zu können, wie ein Athlon XP mit einer niedrigeren Taktfrequenz. AMD setzt hier auf mehr Leistung pro Takt und Intel auf mehr Leistung durch mehr Takt.

Advanced Dynamic Execution

Um falsche Vorhersagen bei der Bearbeitung der nächsten Instruktionen möglichst nicht auftreten zu lassen, hat Intel der 20 stufigen Pipeline einige erweiterte Features zur Seite gestellt. All diese Verbesserungen wurden in der "Advanced Dynamic Execution"-Engine zusammengefasst. Sie soll verhindern, dass die Pipeline durch fehlende Instruktionen oder vom Prozessor falsch vorhergesagte Verzweigungen der Programme ins Stocken gerät, was den Pentium 4 enorm ausbremsen würde. Dabei hat Intel im Vergleich zu früher vor allem den Algorithmus der Sprungvorhersage verbessert und den "Branch Target Buffer" vergrößert. In dem "Branch Target Buffer" werden die abgearbeiteten Sprungbefehle gespeichert und können so später erneut vom Prozessor angesteuert werden. Der Buffer wurde beim Pentium 4 auf 4 KB aufgestockt. Der Pentium III besaß zum Vergleich nur 512 Byte "Branch Target Buffer". Aufgrund der längeren Pipeline ist eine Erhöhung des Buffers aber unumgänglich gewesen. Die Vorhersage soll so um ein Drittel gegenüber dem Pentium III verbessert worden sein. Messen lassen sich diese Werte für uns natürlich nicht, so dass wir hier auf die Angaben von Intel angewiesen sind und man sie vielleicht mit etwas Vorsicht genießen sollte. Alles in allem müsste der Pentium 4 insgesamt aber mit einer 95%igen Wahrscheinlichkeit eine richtige Vorhersage treffen.

Trace Cache

Einige von euch werden sich bei unserem Überblick über die Prozessoren sicher schon über die Angaben beim L1-Cache gewundert haben. Nun wollen wir auch hier Licht ins Dunkel bringen.

Der Pentium 4 setzt nicht wie seine Vorgänger und die CPUs der Konkurrenz auf einen geteilten L1-Cache, der sowohl die Daten als auch die Instruktionen speichert, sondern im L1-Cache werden nur noch die Daten gespeichert, aber nicht mehr die Instruktionen. Für die Befehle steht nun ausschließlich der Trace-Cache zur Verfügung.

Um den Trace-Cache zu verstehen, muss man zuerst Kenntnisse über die Arbeitsweise eines Prozessors haben. Bisher war es üblich, dass die Befehle im dafür vorgesehenen Bereich des L1-Caches gespeichert werden. Doch heutige Prozessoren rechnen nicht mehr direkt mit den alten x86-Befehlen, nehmen sie aber trotzdem an, um die Softwarekompatibilität zu gewährleisten. Im weiteren Verlauf müssen diese Befehle erst dekodiert werden, gespeichert bleiben aber nur die x86-Befehle. Und genau hier setzt der Trace-Cache an. Er speichert eben nicht mehr die x86-Befehle, sondern gleich die dekodierten (so genannten) Mikro-Operations (Mikro OPs). Dies hat natürlich dann einen enormen Vorteil, wenn immer wieder dieselben Befehle verwendet werden. Da die dekodierten MikroOps bisher nicht gespeichert wurden, sondern lediglich die x86-Befehle, mussten diese immer wieder in MikroOPs dekodiert werden, sollten sie noch einmal benutzt werden. Der Pentium 4 kann hier direkt auf die schon dekodierten x86-Befehle, also die MikroOPs, zurückgreifen und erspart sich somit den zeitraubenden Weg der erneuten Dekodierung.

Leider gibt Intel die Größe des Trace-Cache nicht mehr in Kbyte an, sondern nur noch in maximal speicherbaren MikroOPs, was eigentlich auch die sinnvollere aber schwerer zu vergleichende Methode ist. Beim Pentium 4 können 12.000 MikroOPs im Trace-Cache gespeichert werden, die vorher dekodiert wurden.

Rapid Execution Engine

Auch bei den ALUs (Arithmetic Logic Units) zur Berechnung einfacher Integer geht Intel einen neuen Weg. Insgesamt besitzt der Pentium drei ALU-Einheiten, jedoch handelt es sich nur bei einer davon um eine herkömmliche. Die zwei anderen arbeiten mit dem doppelten CPU-Takt. Bei einem Pentium 4 mit 2.2 GHz arbeiten demnach zwei der drei ALU-Einheiten mit 4.4 GHz. Dieser doppelte Rechentakt hat natürlich zwei signifikante Verbesserungen: Zum einen wird die Zeit einer Berechnung an sich und zum anderen wird die ALU-Latenz-Zeit deutlich gesenkt. Hierdurch befindet sich die Annahmezeit der neuen Befehle schon bei einem Pentium 4 mit 1,4 GHz unter der 0,4ns Grenze. Ein Pentium III mit 1 GHz braucht hierfür noch 1ns.

Der Pentium 4 sollte sich somit in der Integer-Berechnung deutlich von seinen Konkurrenten absetzen, wenn die auf dem Papier so schön zu lesenden Neuerungen denn auch alle so funktionieren, wie sie es sollten. Eine Auswirkung auf die FPU-Leistung (MMX, SSE) des Pentium 4 haben die zwei mit doppeltem CPU-Takt laufenden ALUs natürlich nicht, womit wir gleich beim nächsten Thema angelangt wären: SSE2.

SSE2

Intel ist nicht den Weg gegangen, seine FPU (Fließkommaeinheit) weiterzuentwickeln, sondern hat seinen bisherigen SSE-Befehlssatz um 144 neue Befehle ergänzt, so dass der Pentium 4 über die 70 alten SSE und die weiteren 144 neuen Befehle verfügt. SSE2 ist dabei komplett abwärtskompatibel zu seinem Vorgänger. Neu ist auch, dass die 144 hinzugekommenen Befehle für 128bit Integer und Fließkommaberechnungen mit doppelter Genauigkeit ausgelegt sind. SSE2 steht übrigens für „Streaming Single Instruction Multiple Date Extension 2“. Das SIMD im Namen steht somit für Befehle, die in der Lage sind, mehrere Daten auf einmal zu bearbeiten. Dass dies besonders bei Spielen und anderen Multimedia-Anwendungen durch richtige Unterstützung einen deutlichen Leistungsgewinn mit sich bringen kann, hat schon Intels SSE-Technologie gezeigt.

Die neue SSE2-Technologie bringt bei alten Anwendungen, die für SSE optimiert sind, natürlich keine Geschwindigkeitsvorteile mit sich.

Da mittlerweile aber sogar AMD überlegt, SSE2 in ihre Prozessoren zu integrieren, kann Intel mit der Weiterentwicklung nicht so ganz falsch gelegen haben und vor allem bei Anwendungen, die speziell für SSE2 optimiert sind, darf ein deutlicher Performancegewinn erwartet werden.

Quadspeed

Der Pentium 4 arbeitet zwar nur mit einem 100 MHz Bus-Takt, jedoch kommt eine völlig neue "Quad Data Rate (QDR)" Technologie zum Einsatz, die es erlaubt, vier Datenpakete während eines einzigen Taktes zu verschicken, sodass die Bandbreite einer Taktrate von 400 MHz entspricht. Diese Technik kann man mit der schon länger bekannten DDR-Technologie vergleichen, die physikalisch auch nur mit 133 MHz arbeitet, aber trotzdem, dank ihrer zwei Datenpakete pro Takt, die Leistung eines 266 MHz schnellen Bus erreicht. Zwar ist beim Athlon der Front-Side-Bus mit 133 MHz physikalisch höher, dank Intels QDR-Technologie erreicht der Pentium 4 aber die deutlich höhere Bandbreite in der Übertragung zum Chipsatz. Sie liegt beim Pentium 4 bei 3,2 GB/sec, beim Athlon beträgt sie nur 2,1 GB/sec. Diese höhere Bandbreite verkürzt natürlich die Zeit, in der der Prozessor auf neue Daten warten muss.

Um diese Bandbreite auch beim Arbeitsspeicher nicht zu verschenken, setzte Intel bei der Einführung des Pentium 4 ausschließlich auf PC800 Rambus, da nur er in der "dual channel" Methode 3,2 GB/sec Datenübertragung erreichen kann.

Mittlerweile gibt es auch Chipsätze für DDR- und SD-RAM, da Rambus besonders bei der Einführung des Pentium 4 noch sehr viel teurer war und viele Kunden beim Aufrüsten abschreckte. Im Moment ist der Preisunterschied zwischen DDR-RAM und Rambus jedoch nicht mehr gegeben.

Heat Spreader

Für viele Benutzer und Bastler sicherlich eine sehr erfreuliche Tatsache, ist der beim Pentium 4 Verwendung findende "Heat Spreader".

Er hat zwei Vorteile: Zum einen schützt er den CPU-Kern vor äußeren Schäden, die etwa beim Aufsetzen des CPU-Kühlers entstehen können, wenn dieser verkantet, zum anderen hat er auch die Aufgabe, die im CPU-Kern entstehende Hitze großflächiger an den Kühler abzugeben und so einen besseren Wärmemaustausch zu gewährleisten.

Pentium 4 mit Heat Spreader
Pentium 4 mit Heat Spreader
Pentium 4
Pentium 4

Dass AMD diesem "Heat Spreader" nicht abgeneigt gegenüber steht, zeigen erste Bilder des "Hammer", der ebenfalls über einen "Heat Spreader" verfügt. Anscheinend hat AMD hier aus der Vergangenheit gelernt, in der doch der ein oder andere Bastler seinen CPU-Kern bei der Montage des Kühlkörpers zerbrach.

Temperatursensor

Ein weiteres für den Benutzer sehr angenehmes Feature sind die Temperatursensoren des Pentium 4. Der Pentium 4 bietet nämlich zwei völlig voneinander unabhängige Temperatursensoren, die zwei verschiedene Schutzmechanismen auslösen können.

Der erste Schutzmechanismus des Pentium 4 ist der so genannte „Thermal Monitor“. Er setzt sich aus einem Temperatursensor direkt im CPU-Kern, einem Signal (PROCHOT#), der angibt, wenn der Prozessor seine maximale Temperatur erreicht hat, und einem Kontrollmechanismus (Thermal Control Circuit TCC) zusammen, der die CPU-Temperatur durch das Regulieren der CPU-Takte beeinflussen kann. Sobald die CPU demnach eine gesetzte Fix-Temperatur erreicht hat, wird das PROCHOT#-Signal aktiviert, das TCC setzt ein und lässt einige Takte bei der CPU aus. Normalerweise wird etwa jeder zweite Takt ausgelassen. Hierbei ist natürlich zu beachten, dass dies einen direkten Einfluss auf die Performance hat. Wird jeder zweite Takt ausgelassen, so verringert sich auch die Leistung. Viel wichtiger dürfte jedoch sein, dass in diesem Zuge auch die CPU-Temperatur erheblich abnimmt und der Prozessor so vor einer Beschädigung geschützt wird. Ist der fixe Temperaturwert wieder unterschritten, setzt das PROCHOT#-Signal aus und der Prozessor arbeitet wieder mit voller Leistung.

Pentium 4 Thermal Monitor
Pentium 4 Thermal Monitor

Der zweite Temperatursensor ist nur für den absoluten Notfall vorgesehen, wenn die Kühlung ausfällt und das Auslassen mehrerer Takte keinen Erfolg bringt. Sobald das Silizium eine Temperatur von etwa 135° C erreicht, reagiert der Pentium 4 mit dem THERMTRIP#-System-Bus-Signal, und schaltet sich selbst komplett aus. Da THERMTRIP# völlig unabhängig vom Prozessor arbeitet, erzeugt es keine Takte. Das Signal bleibt solange aktiv, bis der Prozessor von der Stromquelle genommen und ein kompletter Reset durchgeführt wurde.

Und hier muss man Intel ein großes Lob aussprechen. Die Schutzmechanismen des Pentium 4 funktionieren einwandfrei und der Prozessor läuft selbst passiv gekühlt noch viele Stunden weiter, wenn auch mit verminderter Leistung. Horrorvideos wie sie zum Launch des Athlon XP auftauchten und in denen man eine rauchende CPU sah, weil die Schutzmechanismen nicht griffen, gehören beim Pentium 4 der Vergangenheit an, wenn es nicht zum Ausfall beider Temperatursensoren kommt, was aber wohl unter normalen Umständen nie eintreten sollte.

Leistungsaufnahme

Bevor wir unsere Testkandidaten durch den Benchmark-Parcour jagen, lassen wir sie erstmal im Verbrauch gegeneinander antreten. Dass der neue Northwood hier dank seiner kleineren Fertigungstechnik und geringeren Kern-Spannung einen Vorteil haben sollte, dürfte von vorne herein klar sein.

Prozessor  Kern-Spannung Maximale Kern-Spannung Verbrauch
Athlon XP 2000+ (1.66 GHz) 1.75 Volt 2.1 Volt 63 Watt
Pentium 4 2.0A (Nothwood) 1.5 Volt 1.75 Volt 52 Watt
Pentium 4 2.2 GHz (Northwood) 1.5 Volt 1.75 Volt 55 Watt
Pentium 4 2.0 (Willamette) 1.75 Volt 2.1 Volt 75 Watt

Die Tabelle zeigt eindeutig, dass der Verbrauch des Pentium 4 mit Northwood-Kern deutlich unter dem eines Athlons liegt. Außerdem sieht man auch sehr schön die Einsparungen im Verbrauch durch den Umstieg auf die 0.13µm Fertigungstechnik. Bei gleicher Geschwindigkeit braucht der Pentium 4 mit 2 GHz und Northwood-Kern ganze 23 Watt weniger als sein Vorgänger mit Willamette-Kern und 0.18µm-Technik.

An dieser Stelle wollen wir noch kurz auf die von uns ermittelten Temperaturen der verschiedenen Prozessoren eingehen. Die folgende Tabelle zeigt einmal die Temperaturen während des normalen Windows-Betriebs und zum anderen nach einer Partie Quake 3 Arena:

Prozessor in Windows nach Quake3
Pentium 4 2.2 28°C 34°C
Pentium 4 2.0A 28°C 33°C
Athlon XP 2000+ 50°C  52°C
Athlon XP 1900+ 50°C  51°C
Athlon XP 1800+ 47°C  48°C

Solange die CPU stabil läuft und keine Abstürze durch Überhitzung enstehen, kann es dem Benutzer eigentlich ziemlich gleichgültig sein, ob der Prozessor nun 28°C oder 50°C warm ist. Allerdings wird hier der technologische Fortschritt des Pentium 4 deutlich, der schon in 0,13µm gefertigt wird und deshalb deutlich weniger Abwärme produziert. Bei AMD ist die Umstellung des Fertigungsprozesses derzeit in vollem Gange und man darf schon bald mit ersten in 0,13µm gefertigten Athlon XPs rechnen.

Voraussetzung

Welche Anforderungen der Athlon XP an ein Mainboard stellt, haben wir bereits in unserem großen AMD Prozessorvergleich geklärt. Auch der Athlon XP 2000+ mit einem effektiven Takt von 1,66 GHz ist da nicht anders. Über den Pentium 4 wollen wir dagegen an dieser Stelle ein paar mehr Wörter verlieren. Das wichtigste hierbei ist, dass Intel den neuen Pentium 4 mit Northwood-Kern mit einer langfristigen Planung in den Markt eingeführt hat. Bereits als der Startschuss des ersten Pentium 4 mit 1,4 GHz für den Sockel 423 und dem Willamette-Kern fiel, war für Intel selbst und damit auch für die Mainboard-Hersteller klar, dass dieser Sockel 423 nur ein Zwischenschritt zum aktuellen Sockel 478 ist. Intel ist hierbei äußerst großzügig mit Roadmaps, so dass die Hersteller von Hauptplatinen mindestens ein halbes Jahr vorher wissen, mit welchen Produkten sie innerhalb eines bestimmten Zeitraumes rechnen müssen. Aus eben diesem Grund ist auch quasi jedes Sockel 478 Mainboard für den alten Willamette und den neuen Northwood-Pentium 4 gerüstet, zumindest was die benötigte Spannung von 1,5 Volt angeht. Für die ordnungsgemäße Erkennung fehlt nur noch ein Bios-Update und schon sollte dem Glück nichts mehr im Wege stehen. Begünstigt wird dies durch die Tatsache, dass die Unterschiedene in der Architektur zwischen Willematte und Northwood äußerst gering sind.

Ein weiterer Punkt, den es grundsätzlich bei Pentium 4 Prozessoren zu beachten gilt und der bereits Eingangs kurz erwähnt wurde, wäre das zu verwendende Netzteil. Der Pentium 4 stellte auch neue Anforderungen an die Spannungsversorgung und die Spannungsregler auf den Boards konnten diese nur bedingt erfüllen, so dass Intel für die Versorgung der Schaltregler 12-Volt direkt aus dem Netzteil vorsieht, anstatt sie wie bisher über die 5- und 3,3-Volt-Leitungen zu versorgen. Intel gab auch hier die neue ATX12V-Spezifikation vor, die einen vierpoligen Stecker vorsieht, der die Spannungsregler direkt an das Netzteil anschließt und diese somit immer mit mindestens 10 A und maximal 12 A versorgt. Demnach waren wieder einmal die Netzteilhersteller gefragt, ihre Netzteile diesen neuen Spezifikationen anzupassen, wollen sie auch an Pentium 4 Kunden ihre Netzteile verkaufen. Zusätzliche sollten Pentium 4 Netzteile noch über die Power-Faktor-Korrektur verfügen, um eine möglichst gleichmäßige Spannungs- und Stromversorgung zu gewährleisten. Mit dem neuen Pentium 4 mit Northwood-Kern ist diese Lösung eigentlich überflüssig, da die Prozessoren mit diesem Kern nicht mehr ganz so viel Wärmeleistung entwickeln. Deshalb gibt es inzwischen auch Pentium 4 Mainboards die auf einen 12 Volt Stecker verzichten und den Pentium 4 einzig und allein mit dem normalen ATX (2x10) betreiben. Intel gibt ihn aber nachwievor in seinen Spezifikationen vor. Bei Mainboards, bei denen dieser Stecker vorhanden ist, muss dieser auch, insofern nicht anders im Handbuch angegeben, mit dem Netzteil verbunden werden, da andernfalls das Board beschädigt werden kann.

Zu guter letzt stellt Intel noch spezielle Anforderungen an das Gehäuse selbst. Der Prozessorgigant empfiehlt hierbei eine durchschnittliche Gehäuse-Temperatur unter 40°C, um ein ruhiges und sicheres Arbeiten zu garantieren. Diese Empfehlung gilt allerdings nur für die In-a-Box Variante des Pentium4, die zusammen mit Lüfter und Kühlkörper ausgeliefert wird. Es handelt sich hierbei allerdings mehr um eine Empfehlung, als um eine einzuhaltende Verpflichtung. Tatsache ist, dass der Prozessor auch in wärmeren Umgebungen seinen Dienst vorschriftsmäßig verrichtet. Die zusätzlichen Bohrungen für das Rentention-Modul sind, wie schon erwähnt, beim Sockel 478 wieder unnötig. Das Layout des nun verwendeten Rentention-Moduls zeigen die nächsten beiden Bilder.

Sockel 478 mit Rentention-Modul
Sockel 478 mit Rentention-Modul
Pentium 4 Kühler
Pentium 4 Kühler

Overclocking

Während die Prozessoren von AMD der Freund des Overclocks sind, macht es Intel eben diesen Gesellen schon seit Ewigkeiten deutlich schwerer. Denn so etwas wie die L1-Brücken zum Unlocken des Multiplikators beim Athlon, Athlon XP oder Duron kennt der Pentium 4 nicht. Vielmehr wird bei Intel der Multiplikator bei der Herstellung fest eingebrannt. Damit kann man dem Pentium 4 einzig und allein durch Erhöhen des Front-Side-Buses mehr Leistung entlocken. Dies macht allerdings wenig Sinn, da dadurch automatisch auch der PCI und der APG Takt angehoben wird und damit außerhalb der Spezifikationen läuft. Jedes Megahertz mehr beim FSB schlägt sich damit in einem zunehmend instabilen System wieder. Dies ist insofern tragisch, da in dem in 0,13µm gefertigten Pentium 4 ein großes Overclocking-Potential steckt. Die Kombination aus Head-Spreader und dem Northwoord-Kern, der im Vergleich zu seinem Vorgänger, dem Willamette, deutlich weniger Wärme abstrahlt, erweisen sich als goldrichtig. Aufgrund der Architektur wären ohne größere Probleme 2,5 GHz drin, dafür müsste man jedoch den FSB-Takt auf 114 MHz anheben. Der AGP würde in diesem Falle mit 75,27 MHz (66 MHz Standard) und der PCI mit 37,62 MHz (33 MHz Standard) laufen. Eine mehr als wacklige Angelegenheit. Alles in allem bleibt Intel sich damit auch beim Pentium 4 treu. Die Prozessoren haben viel Potential, das sich aber nicht einfach nutzen lässt. Getreu dem Motto, Stabilität geht vor, bleibt damit nur der Kauf eines neuen Prozessors, wenn die Leistung nicht mehr ausreicht.

Neben dem Manipulieren des Front-Side-Bus ist es noch möglich, die Core-Spannung des Prozessors zu erhöhen, um bei einen Takt außerhalb der vorgesehen Größen die Signalstärke zu erhöhen und damit auch für etwas mehr Stabilität zu sorgen. Das vom Prozessor ausgehende Spannungssignal, das dem Mainboard-Chipsatz übermittelt, welche Spannung für den Prozessor verwendet werden muss, ist folgendermaßen codiert.

Intel Pentium 4 VCore Pins
VID4 VID3 VID2 VID1 VID0 Vore
1 1 1 1 0 1.100
1 1 1 0 1 1.125
1 1 1 0 0 1.150
1 1 0 1 1 1.175
1 1 0 1 0 1.200
1 1 0 0 1 1.225
1 1 0 0 0 1.250
1 0 1 1 1 1.275
1 0 1 1 0 1.300
1 0 1 0 1 1.325
1 0 1 0 0 1.350
1 0 0 1 1 1.375
1 0 0 1 0 1.400
1 0 0 0 1 1.425
1 0 0 0 0 1.450
0 1 1 1 1 1.475
0 1 1 1 0 1.500
0 1 1 0 1 1.525
0 1 1 0 0 1.550
0 1 0 1 1 1.575
0 1 0 1 0 1.600
0 1 0 0 1 1.625
0 1 0 0 0 1.650
0 0 1 1 1 1.675
0 0 1 1 0 1.700
0 0 1 0 1 1.725
0 0 1 0 0 1.750
0 0 0 1 1 1.775
0 0 0 1 0 1.800
0 0 0 0 1 1.825
0 0 0 0 0 1.850

Wie wir sehen, handelt es sich um ein 4-Bit-Signal das über vier Pins auf der Rückseite des Pentium 4 als Output abgegriffen werden kann. Dieses ausgehende Signal ist eigentlich bindend für das Mainboard, allerdings umgehen die meisten Basic Input/Output Systems (BIOSs) der Platinen das Signal und ermöglichen es, die Prozessorspannung frei innerhalb der Grenzen zu manipulieren. Doch Obacht, zu viel Spannung kann den Prozessor beschädigen. Außerdem wird der Prozessor aufgrund physikalischer Gesetze (Q=Cf²U) mit steigender Spannung wärmer. Dies jedoch nur als Information am Rande.

Bekannte Fehler

Im Vergleich zu AMD hat sich Intel schon seit längerem eine gewisse Transparenz auf den Hut geschrieben, was Funktionsfehler in den eigenen Prozessoren angeht.

Demzufolge sind auch die Informationen, die man zu einem Fehler erhalten kann, etwas detaillierter. Wirft man einen Blick in die Liste der bekannten Fehler im Pentium 4, so darf man sich durch insgesamt 49 Seiten Papier mit einer Summe von 61 dokumentieren Fehlern herumschlagen. Das ist eine Menge Holz, wenn man bedenkt, dass der Athlon XP laut AMD in der Summe nur 9 bekannte Fehler aufweist. Eine Zahl, über die man sich sicherlich streiten kann, da zum einen niemand weiß, wie viele Architekturfehler noch im Prozessor stecken und zum anderen, inwiefern die gefundenen Fehler auch alle öffentlich dokumentiert wurden. Wie viele Fehler es auch immer sein mögen, keiner der beiden Hersteller lässt diese Problemchen nach Möglichkeit im Raum stehen. Aus diesem Grund gibt es von Zeit zu Zeit neue Prozessor-Steppings, die ein paar Probleme aus der Welt schaffen sollen. Die folgende Tabelle zeigt die aktuellen Steppings des Pentium 4.

Pentium 4 Erratas im Überblick
Core Stepping Fehler Taktraten
Willamette B2 57 1,4-1,6 GHz
Willamette C1 38 1,4-1,8 GHz
Willamette D0 34 1,4-2,0 GHz
Northwood nB0 23 1,6-2,2 GHz

Wie man an dieser Tabelle recht deutlich erkennen kann, hat Intel durchschnittlich bei einer Taktsteigerung von 200 MHz ein neues Prozessorstepping in den Markt gebracht. Während der Willamette im B2 Stepping noch 57 Erratas, also Irrtümer, in sich trug, waren es beim C1 Stepping nur noch 38 Stück. Eine beachtliche Verbesserung, die sich jedoch nur vereinzelt im normalen Betrieb bemerkbar macht. Beim neusten Pentium 4 mit B0 Northwood-Kern, zur besseren Unterscheidung zum Willamette als nB0 bezeichnet, sind es nur noch 23, von denen lediglich fünf in zukünftigen Pentium 4 Versionen durch leichte Modifikationen entfernt werden sollen. Die Tatsache, dass Intels Dokumentation erst beim B und nicht beim A Stepping beginnt macht einzig und allein deutlich, alle Pentium 4 aus der A Generation stammen aus der Entwicklungsabteilung und sind damit noch nicht für den Verkauf freigegeben gewesen. Beim alten Pentium III gab es übrigens knapp 100 Problemstellen, denen sich Intel annehmen musste. Allerdings war man hier nicht ganz so erfolgreich wie beim Pentium 4, denn nach insgesamt sieben Steppings sind es beim Pentium III mit dem letzten Tualatin Core immer noch gut 80 Irrtümer.

Testsystem

Zum Vergleich der aktuellen Prozessoren der beiden Marktführer kam auf Seiten von AMD ein VIA KT266A System mit 256MB PC2100 DDR Speicher zum Einsatz. Bei Intel haben wir uns dazu entschlossen, ein Rambus System mit Intel i850 Chipsatz zu nutzen. Damit kam für beide Systeme die momentan schnellste Plattform zum Einsatz. Das an dieser Stelle oft eingeworfene Argument, Rambus sei im Vergleich zu DDR SDRAM wesentlich teuerer, zieht nicht mehr, denn für 256MB Speicher von Infineon zahlt man in beiden Varianten nicht mehr als 130 Euro. Anders sieht es dagegen beim Mainboard aus. Das von uns genutzte Asus A7V266-E mit Raid onboard kostet bei einer besseren Ausstattung gut 40 Euro weniger als das Intel D850MD, das für den Pentium 4 zum Einsatz kam. Die Vorteile der Intel Plattform liegen hierbei eindeutig im effektiven Speicherdurchsatz, obgleich das von uns genutzte Intel Board keinesfalls zu den schnellsten Vertretern seiner Art gehört. In wie weit genau das den Pentium 4 beflügeln kann, werden wir in den nächsten Abschnitten sehen.

Die meisten Komplett-Systeme für den Pentium 4 werden momentan zwar mit DDR-RAM verkauft und DDR-RAM dürfte somit auch in den heimischen Stuben am meisten Verwendung finden, doch wir gehen bei diesem Review mit dem Ansatz heran, dass wir erst einmal beleuchten wollen, was man mit dem schnelleren Rambus aus einem Pentium 4 herausholen kann. Auf die natürlich auch in der Performance vorhandenen Unterschiede zu einem DDR-RAM System werden wir in zukünftigen Reviews genauer eingehen.

Als Betriebssystem kam das bei uns übliche Windows XP Professional zum Einsatz. Funktionen wie System Restore oder automatische Systemupdates wurden deaktiviert. Um dennoch eine normale Arbeitsumgebung zu schaffen, haben wir als Qualitätseinstellungen für die Systemoberfläche mit geglätteten Schriften und der Standard Windows XP Oberfläche gearbeitet. Alle weiteren visuellen Optionen wurden ebenfalls aktiviert. Als Grafikkartentreiber für die Inno3D GeForce3 Ti500 verwandten wir den Detonator 27.30, der mit dem GeForce 4 weiter Einzug halten wird. Um Fragen vorzubeugen folgt nun eine komplette Gegenüberstellung der verwendeten Hardware und der installierten Treiber.

P4 Board mit Beschreibungen
P4 Board mit Beschreibungen
Pentium 4 Board mit Kühler
Pentium 4 Board mit Kühler
Intels Board-Anschlüsse
Intels Board-Anschlüsse
Pentium 4 Kühler mit eingebautem Rambus
Pentium 4 Kühler mit eingebautem Rambus
Pentium 4 und Athlon Kühler im Vergleich
Pentium 4 und Athlon Kühler im Vergleich
Testsystemkomponenten
Testsystemkomponenten
Rambus und DDR-RAM im Vergleich
Rambus und DDR-RAM im Vergleich
Größenvergleich
Größenvergleich

Benchmarks

Zum Beurteilen der Leistung kam das bereits beim AMD Prozessorvergleich verwendete Testszenario zum Einsatz, dass diesmal noch um den Magic Music Maker und die 3D Render Software Lightwave 7.0b von Newtek erweitert wurde. Auch Sysmark 2001 ist nun mit von der Partie. Als besonderes Extra haben wir auch Tests mit SETI@Home nicht gescheut. Weiterhin durfte jeder der Prozessoren PI auf die ersten 1 und 4 Millionen Nachkommastellen berechnen. Die verwendeten Benchmarks sollten somit alle für den User relevanten Bereiche abdecken können.

Wer die Benchmarks bei sich zu Hause selbst einmal nachvollziehen möchte, der findet einen Großteil der oben aufgelisteten Testprogramme bei uns in der Downloadsektion.

Windows Boottime

Zum Messen der Bootgeschwindigkeit kam das von Microsoft entwickelte Programm Bootvis zum Einsatz. Dieses Programm ist eigentlich zum Optimieren des Boot-Vorgangs entwickelt worden und analysiert zu diesem Zwecke bis ins kleinste Detail den Systemstart. Unter anderem wird die Boot-Aktivität, CPU-Nutzung, der Festplatten In-/Output die Treiberverzögerung und vieles mehr untersucht. Bei der Bootzeit generell hat sich gezeigt, dass diese so gut wie gar nicht von der Taktfrequenz des Prozessors abhängig ist, da in der Regel andere Komponenten den Systemstart unnötig verzögern. Während die Bootzeit beim Athlon XP 2000+, Athlon XP 1900+ und Athlon XP 1800+ durchschnittlich nur 12,85 Sekunden betrug, war der Pentium 4 2,2 GHz nach gut 14,2 und der Pentium 4 2,0 GHz erst nach 15,69 Sekunden einsatzbereit. Allerdings sind diese Ergebnisse nicht direkt vergleichbar, da beim Systemstart insbesondere das Mainboard und die Onboard-Komponenten einen großen Einfluss haben. Da man einen Pentium 4 aber schlecht in einem Sockel A Board betreiben kann, müssen wir wohl oder übel damit leben. Welchen Einfluss die Installation von Anwendungen auf den Systemstart haben kann, wurde nach der Installation von Sysmark 2001 mehr als deutlich. Um ganze zwei Sekunden wurde der Bootvorgang durch dieses Anwendungspaket verzögert. Damit zeigt sich wieder einmal, wie wichtig es doch ist, das Betriebssystem regelmäßig von unnötigem Ballast zu befreien.

Sandra 2002

Bevor wir die Riege von insgesamt fünf Prozessoren in realen Anwendungen gegeneinander antreten lassen, möchten wir uns an dieser Stelle erst einmal die theoretischen Leistungswerte der Boliden genauer ansehen. Zu diesem Zweck haben wir Sandra herangezogen, da hier sowohl die 3DNow!, SSE1 als auch die SSE2 Erweiterung der Prozessoren korrekt erkannt und dementsprechend auch ausgenutzt wird.

Sandra Prozessor-Test
Sandra 2002 bietet gleich zwei Benchmarks, die ausschließlich die Leistung des Prozessors ermitteln sollen. Hierbei kommt zum einen der Dhrystone Benchmark zum Einsatz, der ursprünglich von Siemens entwickelt wurde, um die Leistung des Hauptprozessors zu messen. Zum anderen wird über den Whetstone Benchmark die Leistung des Co-Prozessors bestimmt. Beide Tests erfolgen ohne die Berücksichtigung der erweiterten Mutlimedia-Befehlssätze. Auch bei der Verwendung von Gleitkommazahlen (Floating Point Data) bestätigt sich dieses Ergebnis.

Sandra 2002 Prozessor Dhyrstone
Sandra 2002 Prozessor Dhyrstone

Sandra 2002 Prozessor Whetstone
Sandra 2002 Prozessor Whetstone

Bereits bei den ersten theoretischen Ergebnissen liefern sich der Pentium4 und der Athlon XP ein Kopf-an-Kopf-Rennen. Während der Athlon XP beim Dhrystone, einem arithmetischen Test, den Pentium 4 klar schlagen kann, selbst der Athlon XP 1800+ ist hier schneller als ein Pentium 2,2, ergibt sich beim Whetstone ein leicht anderes Bild. Zumindest dann, wenn die von einem Intel Mitarbeiter auf SSE2 optimierte Version des Benchmarks zum Einsatz kommt. Hier ist es dem Pentium4 mit 2,0 GHz möglich, den schnellsten Athlon XP gut 100 Punkte abzunehmen. Kommt dagegen der Standard Whetstone Benchmark zum Einsatz, können die Ergebnisse vom Pentium 4 in keinster Weise überzeugen. Mehr als 1000 Punkte trennen in diesem Fall Pentium 4 und Athlon XP. Die vom Whetstone getestete Gleitkomma-Einheit der Prozessoren ist beim Athlon somit wesentlich leistungsfähiger. Der Athlon XP entscheidet damit diesen Test trotz seines deutlich geringeren Taktes für sich.

Sandra Multimedia-Test
Beim Multimedia-Test von Sandra 2002 wird ein Algorithmus (Chaostheorie von Mandelbrot) verwendet, der unter anderem auch beim Generieren von realistischen Naturobjekten wie Bergen oder Wolken zum Einsatz kommt. Bei diesem Benchmark werden auch die erweiterten Befehlssätze des Pentium 4 oder die des Athlon XP berücksichtigt. Da die Implementierung von SSE1 in diesem Teiltest besser als die von 3DNow! ist, haben wir den Athlon XP mit seiner SSE1 Einheit (d.h. 3DNow Professional) arbeiten lassen. Beim Pentium 4 kam dagegen sowohl SSE1, also auch SSE2 zum Einsatz.

Sandra 2002 Multimedia Integer SSE/SSE2
Sandra 2002 Multimedia Integer SSE/SSE2

Auch beim Multimedia-Test bestätigen sich die Ergebnisse vom Test zuvor. In der Integerleistung (Ganze Zahlen) ist der Athlon XP auch hier überlegen. Besonders bei zu Hilfenahme der SS1 Erweiterung macht sich diese Überlegenheit deutlich. In diesem Falle kann selbst der Athlon XP 1800+ einen Pentium 2,2 schlagen. Bei Zuhilfenahme der SSE2 Erweiterung verschiebt sich dieses Bild nur leicht. Der Athlon XP 2000+ bleibt nach wie vor ungeschlagen und selbst der Athlon XP 1900+ mit einem realen Takt von 1,6 GHz kann sich vor dem schnellsten Pentium 4 einreihen.

Sandra 2002 Multimedia Floating Point SSE/SSE2
Sandra 2002 Multimedia Floating Point SSE/SSE2

Beim Mutlimedia-Test mit Gleitkomma-Daten gibt es diesmal ein anderes Ergebnis. Überraschenderweise beschleunigt SSE2 den Pentium 4 in diesem Fall nicht. Offenbar lässt hier die Optimierung noch zu wünschen übrig, obwohl diese auch von Intel vorgenommen worden ist. Konzentrieren wir uns also diesmal auf die SSE1 Ergebnisse. Wie wir sehen macht auch hier der Athlon XP 2000+ eine sehr gute Figur. Dennoch gebührt dem Pentium 4 2,2 GHz diesmal der erste Platz. Der Pentium 4 2,0 GHz wirkt dagegen klar abgeschlagen. Er muss sich selbst dem Athlon XP 1800+ geschlagen geben.

Sandra Speicher-Test
Der Speichertest von Sandra belegt mindestens 50 Prozent des verfügbaren Arbeitsspeichers. Dieser Benchmark ermittelt die Leistung des Speicher-Subsystems, ebenso wie die Caches. Hierfür werden sowohl arithmetische als auch Gleitkommaopertationen durchgeführt. Da dieser Test sehr stark von den Plattformen abhängig ist, wollen wir nur einen kurzen Blick darauf werfen.

Sandra 2002 Memory Int ALU/RAM
Sandra 2002 Memory Int ALU/RAM

Sandra 2002 Memory Float ALU/RAM
Sandra 2002 Memory Float ALU/RAM

Wie wir sehen, kann sich der Pentium 4 aufgrund der Rambus-Plattform deutlich vom DDR-Speicher System, das beim Athlon XP zum Einsatz kam, absetzen. Speziell diesen Umstand sollten wir im späteren Testverlauf im Hinterkopf behalten.

3DMark 2000

Der 3DMark 2000 hat zwar schon einen Nachfolger gefunden, ist allerdings auch weiterhin bestens dafür geeignet, eine Aussage über die Direct3D Leistung des Systems zu geben. Auch die Prozessorleistung lässt sich mit diesem Test recht gut messen. Da es sich um einen synthetischen Benchmark handelt können die Ergebnisse zwar nicht direkt auf Spiele übertragen werden. Aber nichtsdestotrotz wird er überall eingesetzt und gehört einfach zu jedem Test dazu.

3DMark 2000
3DMark 2000

Bei diesen Ergebnissen wird eins deutlich klar: Der 3DMark 2000 ist nicht das richtige Terrain für den Pentium4. Der Athlon XP 2000+ ist hier wieder das Maß aller Dinge. Dies ist vor allem darauf zurückzuführen, dass zur Einführung von 3DMark 2000 nur die SSE1 und 3DNow, aber nicht die SSE2 Erweiterung im Markt war. Somit liegt SSE2 vom Pentium 4 brach. Damit wird bereits jetzt deutlich, dass sich der Pentium 4 bei alten Anwendungen, aufgrund fehlender Optimierungen, nicht ganz so wohl fühlt.

3DMark 2000 CPU Mark
Ein wichtiger Bestandteil des 3DMark2000 ist auch der CPU-Mark. Obwohl hier auch die Grafikkarte eine große Rolle spielt, sowie Chipsatz und Speicher des Mainboards, werden diese Faktoren hier durch die fixierte Testumgebung ausgeschaltet.

3DMark 2000 CPU Mark
3DMark 2000 CPU Mark

Auch hier bestätigen sich die Ergebnisse aus dem 3DMark 2000 Durchlauf. Der Pentium 4 ist erneut unterlegen. In diesem Test sogar noch stärker, als es im Gesamtergebnisse deutlich wird. Die Ursache ist die Tatsache, dass beim CPU Test das Speicherinterface nur eine untergeordnete bis gar keine Rolle spielt. Den Einfluss des Speicherbusses verdeutlicht der nächste Teiltest.

3DMark 2000 HPC
Auch der High Polygon Count ist ein Bestandteil des 3DMark 2000. Da hierbei die Leistung des Speichersubsystems eine größere Rolle spielt, eignet er sich besonders gut, um das Zusammenspiel zwischen Prozessor, RAM und Grafikkarte zu verdeutlichen.

3DMark 2000 HPC
3DMark 2000 HPC

Wie zu erwarten war, kann sich der Pentium 4 2,2 GHz hier leicht vom Athlon XP 2000+ absetzen, wohingegen der Pentium 4 2.0 GHz jetzt in der Mitte des Testfeldes liegt, obwohl er noch beim 3DMark 2000 CPU Test das Schlusslicht bildete. Die Ursache hierfür ist schnell im Rambus gefunden, der, wie bereits die Speichertests von Sandra 2002 zeigten, dem DDR System klar überlegen ist.

3DMark 2001 (SE)

Wenn es derzeit einen Benchmark gibt, der immer wieder als das Vorzeigeprogramm die Leistung des eigenen Rechners repräsentieren muss, dann ist dies sicherlich der 3DMark 2001. Um eventuelle Unterschiede in der Prozessoroptimierung aufzuzeigen, haben wir sowohl mit 3DMark 2001, als auch mit dem Nachfolger, 3DMark 2001 SE getestet.

3DMark 2001
3DMark 2001

3DMark 2001 SE
3DMark 2001 SE

Wie wir sehen können, liegen Pentium 4 und Athlon XP in der Urversion des Benchmarks quasi gleich auf. Die Abweichung von einem Punkt kann hier vernachlässigt werden. Bei der überarbeiteten Version des 3DMark 2001 wandelt sich dieses Bild leicht. Nun konnte sich der Pentium 4 2,2 GHz an die Spitze des Testfeldes schieben. Auch der Pentium 2,0 GHz konnte den Athlon XP 1800+ übertrumpfen. Von der Theorie scheint es dennoch so, als wäre der Athlon XP bei gleichem Taktrating (d.h. Pentium 4 2,0 GHz gegenüber dem Athlon XP 2000+) die bessere Wahl. In wie fern sich dieses Ergebnis später bestätigen soll, wird sich im späteren Verlauf zeigen.

Final Reality

Der Final Reality Benchmark stammt aus dem Jahre 1997 und stellt damit eine ziemlich alte Anwendung dar. Ursprünglich als Grafikkartentest gedacht, bedeutet er für heutige Grafikkarten kein großes Hindernis mehr. Neben einem Test für 3D-Grafik werden auch 2D Operationen getestet, bei denen die Grafikkarte nur wenig Einfluss hat. Der Benchmark unterstützt die MMX Technologie und wird daher nicht durch 3DNow! oder SSE1/2 beeinflusst.

Final Reality Overcall
Final Reality Overcall

Final Reality 2D Image
Final Reality 2D Image
Final Reality 3D Image
Final Reality 3D Image

Final Reality bescheinigt dem Pentium 4 eine ausgezeichnete Leistung. Obwohl dieser Test nicht auf aktuelle Prozessoroptimierungen setzt, kann sich der Pentium 4 mit Rambus klar vom Athlon XP absetzen. Der Ursache hierfür ist im größeren L2-Cache des Pentium4 zu suchen. Während beim Northwood 512kb zum Einsatz kommen, verfügt der Athlon XP seinerseits nur über 256kb Cache. Während Intel bei einer Taktsteigerung von realen 200 MHz nochmals deutlich zulegen kann, bewirkt die 133 MHz Takterhöhung beim Athlon XP keine wirklich spürbare Leistungssteigerung.

Aquamark

Der Aquamark ist ein DirectX 8.0 Benchmark aus dem Hause Massive und basiert ebenso wie Aquanox auf der Krass-Engine. Dargestellt wird eine detaillierte Unterwasserwelt. AquaNox nutzt die GeForce3 nFiniteFX Engine. Mit mehr als 160 Vertex Shaders werden Spezialeffekte wie Layered Fog, Caustics, fotorealistische Materialien, Radiosity Lighting und Shadows in Echtzeit erzeugt. Pixel Shader werden für Bump Mapping und maßgeschneiderte Lighting Effekte verwendet. Die Frameraten aus dem Aquamark liegen jedoch deutlich unterhalb der aus Aquanox. Auch hier beeinflusst der Prozessor verständlicherweise die Ergebnisse.

Aquamark 640
Aquamark 640

Aquamark 1024
Aquamark 1024

Ganz klar, zwei Daumen hoch für den Pentium 4. Auch wenn man die vier Frames Vorsprung mit dem bloßen Auge nur schwer wahrnehmen kann, klafft doch eine klare Lücke zwischen Athlon XP und Pentium 4. Bei den großen Texturmengen spielt an dieser Stelle auch der Speicher eine nicht zu vernachlässigende Rolle. Die letzten beiden Tests (Aquamark und Final Reality) kann der Prozessor von Intel damit klar für sich entscheiden.

GLMark

Der GLMark ist von der deutschen Softwareschmiede Vulpine entwickelt worden und ist ebenso wie 3DMark2000 und 3DMark2001 für DirectX ein rein synthetischer Benchmark für OpenGL. Der Benchmark ist hochkomplex und kann schon einige der neuen GeForce3 Features nutzen. Auch hier lässt sich eine Leistungssteigerung durch einen neuen Prozessor erreichen.

Vulpine GLMark 640
Vulpine GLMark 640

Vulpine GLMark 1024
Vulpine GLMark 1024

Mit GLMark wird die Erfolgsserie vom Pentium 4 leicht gebrochen. In niedrigen Auflösungen, die bekanntlich vom Prozessor und nicht von der Grafikkarte limitiert werden, vermag es der Athlon XP 2000+ im Durchschnitt etwas mehr Bilder auf den Bildschirm zu zaubern. Allerdings erkennt man auch hier mit bloßem Auge den Unterschied nicht. An dieser Stelle könnte man fast meinen, der Athlon XP hätte eine Quantispeedzahl (Performance Rating) von 2200+ verdient. Doch sollte man mit diesem Urteil nicht zu voreilig sein. Schließlich legt AMD das Performance Rating nicht für den Pentium 4 aus, allerdings scheint es sich recht gut auf ihn ummünzen zu lassen und AMD ist den Schritt des Performance Ratings sicherlich aus Marketing-Gründen gegangen, um den Unterschied in den Taktraten zwischen Athlon XP und Pentium 4 geringer erscheinen zu lassen.

Quake 3 Arena

Quake3 Arena verwendet ausschließlich OpenGL. Der Ego-Shooter zeichnet sich durch eine hohe Anzahl an Polygonen und komplexen Szenarien aus. Da viele Spiele auf der Quake III Engine basieren, sind die Tests mit Quake III sehr praxisnah. Bei uns kam neben der in Quake 1.17 bereits enthaltenen Demo 001 noch die NV15 Demo von nVidia zum Einsatz, die den Prozessor auf das Äußerste belastet. Getestet wurde sowohl mit der Normal-Config als auch mit einer Custom-Config (16 Bit, geringe Texturdetails, High Geometic Detail).

Quake3 Normal 640
Quake3 Normal 640

Quake3 Normal 1024
Quake3 Normal 1024
Quake3 Custom 640
Quake3 Custom 640

Quake3 Custom 1024
Quake3 Custom 1024
Quake3 nv15 Normal 640
Quake3 nv15 Normal 640

Quake3 nv15 Normal 1024
Quake3 nv15 Normal 1024

Der erste nicht synthetische Test in unser Testreihe ist wie bei uns üblich Quake 3 Arena. Die Ergebnisse sprechen ganz klar für die Leistung des Pentium 4 mit Rambus. Gut 40 Frames trennen die beiden schnellen Prozessoren in niedrigen Auflösungen. Der Gewinner in diesem Test heißt ganz klar Pentium 4.

Sysmark 2001

Der Sysmark 2001 hat in der Vergangenheit häufig für Aufregung auf Seiten der AMD-Fangemeinde gesorgt. Dieser Benchmark gliedert sich in zwei Bereiche auf. Im ersten Bereich wird die Arbeitsumgebung eines "Webmasters" bzw. "Webdesigners" simuliert, der den Namen Internet Content Creation trägt. In diesem Testabschnitt werden folgende reale Anwendungen mit einer Scriptsprache gesteuert: Macromedia Dreamweaver, Abode Photoshop, Adobe Premiere, Microsoft Windows Media Encoder und Macromedia Flash. Während der Athlon XP in allen Anwendungen eine gute Figur macht, versagt er im Windows Media Encoder völlig. Die Schuld muss man an dieser Stelle aber dem Windows Media Encoder 7.0 in die Schuhe schieben. Diese für SSE1 optimierte Anwendung profitiert unheimlich von dieser Befehlserweiterung. Leider überprüft der Media Encoder allerdings nur auf Intel Prozessoren, ob der Prozessor eine Unterstützung dieser Befehle signalisiert. Da zum Entwicklungszeitpunkt noch gar nicht an die Möglichkeit gedacht wurde, dass AMD neben 3DNow noch auf SSE1 setzten könnte, schien dieser Schritt noch logisch. Dies schlägt sich natürlich auch in diesem Teilbereich von Sysmark 2001 recht deutlich wieder, da die Anwendung beim Pentium 4 natürlich mit SSE1 Erweiterungen arbeitete. Nichts desto trotz simuliert der Sysmark nun einmal die reale Leistung mit handelsüblichen Anwendungen. Dies macht ihm zu einem wichtigen Test zur Beurteilung von Prozessorleistungen bzw., der Leistungen eines gesamten Systems. Damit müssen wir diesen Test mit dem Wissen dieser kleinen Einschränkung hinnehmen.

Im zweiten Bereich von Sysmark 2001 wird der Büroalltag (Office Content Creation) mit einer ganzen Latte von Anwendungen gemessen, die parallel zu einander via Multitasking angesprochen wurden. Zu diesen Anwendungen gehören Microsoft Office, Dragon Naturally Speaking, Netscape Communicator, WinZip und McAfee VirusScan. Die jeweiligen Teilergebnisse die sich aus der Internet Content Creation und Office Content Creationen ergaben, gehen jeweils zu 50 Prozent in das Endergebnis ein. Doch betrachten wir die Ergebnisse erst einmal im Detail:

Sysmark 2001 Internet Content Creation
Sysmark 2001 Internet Content Creation

Wie wir sehen, kann sich der Pentium 4 aufgrund der bereits genannten Einschränkung recht deutlich vom Athlon XP absetzen. Gut 50 Punkte trennen die beiden schnellsten Boliden. Allerdings muss man an dieser Stelle klar zugeben, dass der Athlon XP 2000+ selbst bei korrekter SSE1 Implementierung hier höchstens hinter dem Pentium4 2,2 GHz auf dem zweiten Platz gelandet wäre.

Sysmark 2001 Office Content Creation
Sysmark 2001 Office Content Creation

Im Teilbereich Office Content Creation ist das Ergebnis schon etwas realistischer. Der Pentium 4 2,2 GHz reiht sich aufgrund des hohen Taktes, des größeren L2-Cache und des schnellen Rambus, wie zu erwarten war, auf den ersten Platz ein, gefolgt vom Athlon XP 2000+ und 1900+. Der Pentium 4 2,0A reiht sich dahinter ein. Im Durchschnitt der beiden Teilbereiche ergibt sich damit folgendes Ergebnis.

Sysmark 2001
Sysmark 2001

Der große Vorsprung bei der Internet Content Creation schlägt sich sehr deutlich im Endergebnis nieder. Aufgrund dieser Tatsache können sich Pentium 4 2,2 und 2,0 GHz an die Spitze dieses Tests schieben.

Seti@Home

Besonders stolz bei unserem Vergleichtest sind wir natürlich auf die Einbeziehung des Textclienten von Seti@Home (3.03). Aufgrund der langen Laufzeit sollte sich hier ein klares Bild über die Leistung der einzelnen Prozessoren ergeben. Um die Ergebnisse vergleichbar zu halten, kam immer die gleiche Work Unit mit einer Angle Rate von 0,417 zum Einsatz.

Seti
Seti

Wie wir sehen, ist der Pentium 4 2,2 GHz zwei Minuten eher mit der vorgegebenen Workunit als der Athlon XP 2000+ fertig. Der 200 MHz geringer getaktete Pentium 4 muss sich dagegen dem Rest des Testfeldes geschlagen geben. Besonders in Seti wird hierbei deutlich, wie stark sich eine Erhöhung des Prozessortaktes auswirken kann, auch wenn die Ergebnisse nur 20 Minuten zwischen schnellsten und langsamsten Prozessor auseinander liegen.

SuperPI

Der SuperPI Benchmark ist an für sich eine recht betagte Anwendung, eignet sich allerdings nach wie vor recht gut, um die Leistung von Prozessoren bei Rechenoperationen zu bestimmen. Um die Rechendauer nicht unnötig in die Länge zu ziehen, haben wir uns auf die Berechnung der ersten Millionen Nachkommastellen der Zahl Pi beschränkt. Das Ergebnis war eine 1,5 MB respektive 4,6MB große Textdatei mit der Auflistung der Stellen.

Super PI 1 Mio
Super PI 1 Mio

Super PI 4 Mio
Super PI 4 Mio

Die Ergebnisse von SuperPI unterschieden sich nur geringfügig von den Ergebnissen die bereits der Prozessortest von Sandra 2002 offen legte. Die Integer-Einheit des Pentium 4 scheint der des Athlon XP bei welchem Takt auch immer nicht gewachsen zu sein. Hier scheint die Architektur des Athlon XP, die auf mehr Leistung pro Takt setzt, ihren Geschwindigkeitsvorteil in Operationen, die nicht für den Pentium 4 optimiert wurden, ausspielen zu können. Auch die 20 stufige Pipeline des Pentium 4 ist hier nicht förderlich, da die Bearbeitung einer Operation, wie im Vorfeld beschrieben, im Vergleich zur Pipeline des Athlon XP länger dauert. Da dieser Test jedoch keine besondere Relevanz beim Arbeiten oder Spielen hat, lassen wir dieses Ergebnis mal so stehen.

WinACE

Um den Sinn und Unsinn eines schnelleren Prozessors bei häufig genutzten Applikationen weiter zu verdeutlichen, zogen wir an dieser Stelle WinACE in der Version 2.11 heran. Das Programm hatte die Aufgabe, eine 200 MB große WAV-Audiodatei bei maximaler Kompressionsstufe (bei 4096k) als ACE-Datei zu packen.

WinACE
WinACE

Wie wir sehen, kann der Pentium 4 bei WinACE voll überzeugen. Beide Modelle sind schneller als die Vertreter von AMD, auch wenn Sie nur gut eine halbe Minute trennt.

FlaskMPEG

Natürlich durften die Prozessoren auch zeigen, was beim Encoden von Videos in ihnen steckt. Hierfür durfte jeder der Kontrahenten ein 451MB großes MPEG1 Video mittels Flask in das DiVX (MPEG4) Format bringen. Die im Durchschnitt erreichte Framerate wurde auf Papier festgehalten. Es wurde mit High Quality Bikubiuscher Filterung gearbeitet, wobei lediglich der Video-Stream bearbeitet wurde. Der Audiostream blieb dagegen unverarbeitet. Als iDCT kam MMX zum Einsatz, da alle Testkandidaten diese Multimedia Befehlserweiterung voll unterstützen.

Flask MMX
Flask MMX

Flask SSE2/3DNow
Flask SSE2/3DNow

Auch bei Flask kann der Pentium4 2,2 GHz mit seiner überlegenen Taktfrequenz glänzen. Knapp drei Frames pro Sekunde trennen ihn und den Athlon XP. Im Vergleich dazu, muss sich der langsamere Pentium 4 am unteren Ende einreihen.

Lame

Die zweite Disziplin, die beim Encoding anstand, war das dynamische Umwandeln einer 200 MB WAV-Datei in das MP3 Audioformat. Hierfür kam das Programm Lame 3.90 zum Einsatz, das lediglich MMX unterstützt. Das Programm wurde mit den Parametern -v -V 0 gestartet. Dadurch wird eine MP3-Datei mit variabler Bitrate zwischen 160 kbps und 320 kbps erstellt.

Lame
Lame

Der Pentium 4 und der Athlon XP liefern sich beim Encoden eines WAV-Files ein Kopf an Kopf Rennen, das der Athlon zu seinen Gunsten entscheiden kann. Hierbei wird ganz klar deutlich, dass der Pentium 4 seine SSE Optimierung vermisst. Das Ergebnis ist der zweite und für die 2GHz Variante der mit dem Athlon XP 1800+ geteilte vierte Platz.

Magic Music Maker

Um das Audio-Encoden nicht zu einseitig zu betrachten, kam in diesem Vergleichstest noch der Magic Music Maker zum Einsatz. Zum Glück des Pentium 4 bietet dieser volle SS2 Unterstützung. Wir haben auch hier die 200 MB WAV-Datei gewählt, die bereits bei Lame zum Einsatz kam. Neben MP3s (High Quality, 320 kBit, variable Bitrate) ließen wir das Programm auch MP3Pro (320 kBit, variable Bitrate) Dateien erzeugen. Letztes wurde jedoch von einem anderen Codec übernommen. Welcher kleine, aber feine Unterschied sich dadurch beim Encoden ergibt, verdeutlichen die folgenden Grafiken.

Magic Music Maker MP3
Magic Music Maker MP3

Wie wir sehen ist es nun ein Doppelsieg für die Prozessoren von Intel geworden. Die Prozessoren von AMD sind etwas abgeschlagen. Beim Erstellen von MP3Pro, das sicherlich noch lange nicht so populär wie das MP3 Format ist, ist dagegen wieder der Athlon XP führend.

Magic Music Maker MP3Pro
Magic Music Maker MP3Pro

Wie wir sehen, ist diesmal selbst der Athlon XP 1900+ schneller als der Pentium4 mit seinen 2,2 GHz, die 2,0 GHz wirkt dagegen schon etwas abgeschlagen. Aufgrund der größeren Bedeutung von MP3 kann der Pentium4 diesen Test zwar für sich entscheiden, unter Verwendung eines anderen Codecs bzw. einer anderen Optimierung fällt das Ergebnis aber anders aus.

Cinema 4D

Als Vertreter professioneller 3D Render-Programme wählten wir neben der eher theoretischen Applikation Spec ViewPerf 6.1.2 auch den Cinemark 1.0. Dieser Benchmark ist in drei Teile unterteilt und lässt den Prozessor mit und ohne Unterstützung der Grafikkarte diverse 3D Szenen rendern.

Cinema 4D Shading
Cinema 4D Shading

Cinema 4D Shading OpenGL
Cinema 4D Shading OpenGL

Ohne zu Hilfenahme der Grafikkarte kann der Pentium 4 diesen Test klar für sich entscheiden, wird die Szene dagegen mit OpenGL Unterstützung durch die Grafikkarte erstellt, kann sich der Athlon XP wieder als Spitzenreiter fühlen. Dass die Ursache hierfür nicht in den Treiber der Grafikkarte zu suchen ist, zeigen die Ergebnisse aus Quake 3 oder dem Aquamark. Allgemein hinterlässt Cinema 4D einen verwirrenden Eindruck. Während der Pentium 4 beim Erstellen der Szene ohne Grafikkarte schneller ist, muss er sich bei zu Hilfenahme der Grafikkarte geschlagen geben. Selbst beim Raytracing, wo eigentlich auch nur der Prozessor aktiv ist, kann der Athlon XP den Pentium 4 übertrumpfen, womit dieser als Sieger aus diesem Teiltest geht, obwohl der Pentium 4 nach dem ersten Test wie der eindeutige Sieger aussah.

Cinema 4D Raytracing
Cinema 4D Raytracing

Spec ViewPerf 6.1.2

Der von Spec veröffentlichte Benchmark ViewPerf 6.1.2 basiert insgesamt auf sechs Einzeltests, die zwar primär durch die Leistung der Grafikkarte begrenzt werden. Drei dieser Tests zeigen hierbei jedoch recht gut die Qualitätsunterschiede zwischen den verschiedenen Prozessoren.

Spec Prefview DX-06
Spec Prefview DX-06

Spec Prefview Light-04
Spec Prefview Light-04
Spec Prefview MedMCAD
Spec Prefview MedMCAD

Zu den Ergebnissen von ViewPref kann man eigentlich nur sagen, dass sowohl der Pentium 4 als auch der Athlon XP in einzelnen Bereichen klar dominieren. Ist der Athlon XP in DX-06 und MedMCAD mit seiner Architektur klar überlegen, dominiert der Pentium 4 Light 4 eindeutig.

Lightwave 7.0b

Da uns die bisherigen Ergebnisse im 3D Rendering in keinster Weise überzeugen konnten, haben wir nun Lightwave 7.0b in unseren Testzirkus aufgenommen. Es handelt sich hierbei um eine ausdrücklich Pentium 4 optimierte Software, wohingegen die vorherigen 3D Rendering-Tests keine Optimierung für einen der beiden Prozessoren aufwiesen. Das Ergebnis dieses Tests sollte demnach nicht überraschen.

Lightwave 7.0b Radiocity
Lightwave 7.0b Radiocity

Lightwave 7.0b Skull
Lightwave 7.0b Skull

Wie wir ganz deutlich sehen, kann der Pentium 4 in SSE2 optimierte Software klar dominieren. Wie bereits der Magic Music Maker zeigte, ist er in diesem Fall von keinem aktuellen AMD Prozessor zu schlagen. Somit geht der Pentium 4 aus dem letzten von uns vorgenommenen Test als Sieger hervor.

Fazit

Sicherlich kann man sagen, dass der Pentium 4 mit 2,2 GHz zwar der schnellste Prozessor unserer fünf Kandidaten ist. Aber muss der Athlon XP 2000+ sich keinesfalls verstecken, sondern kann vor allem in älteren Anwendungen gut dagegen halten. Man sollte dabei auch nicht vergessen, dass wir die zwei schnellsten Testumgebungen für diesen Artikel verwendet haben und hier der Pentium 4 durch seine schnellere Rambus-Plattform natürlich profitiert. Sie ist dem DDR-System des Athlon XP besonders in speicherintensiven Anwendungen aufgrund der höheren Bandbreite überlegen. Doch kann der Pentium 4 so auch gleich die schnellste und unserer Meinung nach auch stabilste Plattform sein Eigen nennen. Im Gegenzug muss der Käufer dafür sowohl beim Prozessor als auch beim Board tiefer in die Tasche greifen. Dass der Pentium 4 mit dem i850 die momentan stabilste, schnellste und auch in anderen Gesichtspunkten wie etwa IRQ-Verteilung eine sehr gute Plattform liefert, liegt wohl auch nicht zuletzt daran, dass der Chipsatz direkt von Intel entwickelt wurde. Wie groß der Unterschied eines Pentium 4 Systems mit Rambus im Vergleich zu einem DDR-RAM System ist, werden wir in weiteren Artikeln genauer beleuchten.

Damit der Pentium 4 sich deutlich vom Athlon XP absetzt, darf eines auf keinen Fall fehlen: Die richtige Unterstützung für SSE2. Wenn diese gegeben ist, hat der Pentium 4 das Rennen schon fast gewonnen. In diesem Fall kann sich mitunter sogar der sonst langsamere Pentium4 2,0A vor den Athlon XP 2000+ setzen.

Sollte die SSE2 Unterstützung aber nicht gegeben oder nur mangelhaft umgesetzt worden sein, so haben unsere Tests eindeutig gezeigt, dass durchaus auch der Athlon XP 2000+ schneller sein kann als der 2,2 GHz schnelle Pentium 4. Dies ist besonders dadurch zu begründen, dass der Athlon XP mehr Anweisungen pro Takt (Instructions per Clock, IPC) ausführen kann und deshalb auch bei niedrigerem Takt mit einem weit schneller getakteten Pentium 4 mithalten kann. Der Pentium 4 muss aufgrund seiner Architektur höher getaktet werden, um in derselben Zeit gleich viele Instruktionen zu verarbeiten. Intel hat natürlich den Vorteil, dass man in GHz-Regionen vorstoßen kann, die AMD noch verwehrt bleiben.

Intel ist somit stärker als AMD im Moment auf die Unterstützung durch die Software-Hersteller angewiesen. In letzter Zeit nimmt die Anzahl der für SSE2 optimierten Software aber stetig zu und sollte auch AMD mit dem Hammer auf SSE2 setzen, steht dem langfristigen Durchbruch dieses Befehlssatzes eigentlich nichts mehr im Wege.

Interessant ist auch, dass das von AMD natürlich nicht auf den Pentium 4 ausgelegte Performance Rating sich meistens ziemlich gut auf diesen übertragen lässt. Mitunter würde der Athlon XP diese Angabe sogar überflügeln. Aber noch einmal, es ist von AMD nicht als Vergleich zu Intel CPUs ausgelegt, sondern soll die eigene Überlegenheit über den normalen Athlon verdeutlichen, doch muss AMD sich den Vergleich mit einem Pentium 4 schon gefallen lassen. Da viele Käufer nur auf die MHz-Zahl achten, hat man mit einem Performance Rating natürlich auch weit bessere Verkaufschancen. Würden viele einen Athlon XP 2000+ doch einem Athlon XP 1666MHz vorziehen, auch wenn es außer in der Bezeichnung keinen Unterschied bedeutet. Sicherlich ein gut durchdachter Schritt der Marketingabteilung von AMD, um den optischen Geschwindigkeitsvorteil des Pentium 4 für uninformierte Käufer, die nur nach der MHz-Angabe ihren Kauf tätigen, geringer erscheinen zu lassen.

Doch werfen wir kurz einen Blick auf die aktuellen Preise unserer Testkandidaten:

Preise bei der Abnahme von 1000 Stück
Intel Pentium 4 Preis AMD Athlon XP Preis
1800 MHz (Willamette) 193$ 1533 MHz (1800+) 188$
1900 MHz (Willamette) 241$ 1600 MHz (1900+) 231$
2000A MHz 364$ 1666 MHz (2000+) 339$
2200 MHz 562$

Das beste Preis/Leistungsverhältnis bietet sicherlich nachwievor AMD, auch wenn sich die Preise in der Vergangenheit entweder durch Preissenkungen bei Intel oder Preiserhöhungen im Zuge der Einführung des Athlon XP durch AMD immer mehr angenähert haben.

Das Spielchen, wer den schnellsten Prozessor hat, dürfte aber noch lange nicht ausgefochten sein. AMD stellte gerade erst den neuen Athlon XP 2100+ vor und Intel kontert Anfang April mit dem Pentium4 2400.

Wirklich spannend dürfte es erst dann wieder werden, wenn Intel auf den 133 MHz (533 QDR) schnellen FSB und AMD auf 0,13µm umgestellt hat. Beides verspricht schon jetzt den Prozessoren neue Leistung zu entlocken.

Für Fragen ist wie immer unser Forum [3] zuständig.

URL-Liste:

  1. http://www.computerbase.de/artikel/hardware/prozessoren/amd_prozessor_roundup/
  2. http://www.computerbase.de/artikel/hardware/grafikkarten/inno3d_tornado_geforce3_ti500/
  3. http://www.forumbase.de/
Copyright © 1999–2012 ComputerBase GmbH