3/24 Intel Pentium 4 2,2 GHz und AthlonXP 2000+ im Test : Der Kampf der Titanen

, 22 Kommentare

Technik

NetBurst Architektur

Als erstes wenden wir uns nun dem Oberbegriff für Intels neue Technik des Pentium 4 zu: Der NetBurst Architektur.

NetBurst
NetBurst

Um den Ansprüchen des schnell wachsenden Prozessor-Marktes auch in Sachen Geschwindigkeit gewachsen zu sein, ist es bei Intel üblich alle 3-5 Jahre eine von Grund auf neue Prozessor-Architektur zu entwickeln. Die zuletzt von Intel eingeführte Architektur war die P6 Mikro Architektur, die 1995 mit dem Pentium Pro erstmals zum Einsatz kam. Doch knapp über der 1 GHz Grenze stieß diese Architektur an ihre Grenzen und Intel war gezwungen eine neue zu entwickeln, was man mit der NetBurst Architektur getan hat. Das folgende Blockdiagramm und die DIE-Ansicht geben einen kurzen Überblick über die einzelnen Bausteine der neuen Architektur, auf die wir im Weiteren genauer eingehen werden.

Pentium 4 Design
Pentium 4 Design
Pentium 4 Architektur
Pentium 4 Architektur

Doch zuerst ein kleiner Einblick in die von Intel vorgenommenen Kennungen auf dem Pentium 4. Sie geben Aufschluss über den Prozessortakt, die Cache-Größe, den Front-Side-Bus, die Kern-Spannung und das Produktionsland. Doch alles weitere verdeutlicht die folgende Grafik:

Pentium 4 Prozessor-Kennung
Pentium 4 Prozessor-Kennung

Hyper Pipelined Technology

Die neue Pipeline des Pentium 4 ist sicherlich die grundlegendste und gleichzeitig auch in vielerlei Hinsicht weitreichendste Änderung im Vergleich zu seinen Vorgängern. Die Pipeline ist mit 20 Stufen doppelt so lang wie die des Pentium III. Die verlängerte Pipeline hat den enormen Vorteil, dass sie sehr viele Aufgaben auf einmal erledigen kann und erst durch sie werden die hohen Taktraten des Pentium 4 überhaupt erst möglich. War der Pentium III mit seiner 10 stufigen Pipeline doch schon bei einem Gigahertz in der 0.18µm Technik am Ende, so startete der Pentium 4 erst bei 1.4 GHz, obwohl er damals auch noch in 0.18µm gefertigt wurde.

Doch zunächst sollten wir erst einmal genauer auf die 20 stufige Pipeline eingehen.

Pentium 4 Pipeline
Pentium 4 Pipeline

Da die meisten wahrscheinlich nicht viel mit dem Begriff „Pipeline“ und der Bedeutung anfangen können, sehen wir uns zuerst die Grundlagen einer in Reihe geschalteten und einer gestuften Pipeline an. Wir gehen zur Vereinfachung von fünf einzelnen Schritten aus, die durchgeführt werden müssen, um eine Operation vollständig abzuschließen. Hierbei sind in vereinfachter Form die folgenden fünf Punkte von Bedeutung:

  • Prefetch: Der nächste Befehl wird aus dem Cache geladen.
  • Decode 1: Die x86-Befehle werden in MikroOPs dekodiert
  • Decode 2: Falls noch weitere Daten zur Berechnung benötigt werden, werden diese jetzt geladen
  • Execute: Die Instruktion wird ausgeführt.
  • Wirteback: Das Ergebnis wird im Cache oder Systemspeicher gespeichert.

Eine CPU ohne Pipeline arbeitet diese Schritte einzeln nacheinander ab und startet erst wieder von neuem, wenn ein Befehl komplett ausgeführt wurde. Deshalb befinden sich in unserem Beispiel immer vier der fünf Abteilungen im inaktiven Modus und nur ein Bereich arbeitet. Bei einer CPU mit Pipeline wird genau dies verhindert. Hier arbeiten immer alle fünf Abschnitte, so dass eine unnötige Inaktivität einzelner Bereiche ausgeschlossen wird. Sobald die erste Instruktion einen Bereich verlassen hat, wird gleich der nächste geladen. Es befinden sich somit immer fünf Instruktionen gleichzeitig in der Bearbeitung.

Bei einer 20 stufigen Pipeline, wie sie der Pentium 4 besitzt, befinden sich somit 20 Instruktionen gleichzeitig in der Bearbeitung und alle Bereiche sind ständig beschäftigt. Deshalb darf es auch in keinem Bereich zu einer Verzögerung kommen, da sonst alle anderen Bereiche warten müssen und die Arbeit erheblich ausgebremst wird. Doch dazu kommen wir später noch einmal zurück.

Die höheren Taktraten des Pentium 4 sind vor allem dadurch zu erreichen, dass die einzelnen Schritte jedes Befehls in kleinere Teile aufgeteilt wurden, die einzeln schneller bearbeitet werden können als der komplette Befehl.

Dies hat bei einer 20 stufigen Pipeline natürlich auch seine Nachteile. Ein Befehl muss nun mehr Teilbereiche durchlaufen als früher, um schlussendlich bearbeitet worden zu sein, und dadurch erhöht sich die Gesamtzeit in der eine Operation abgeschlossen ist. Genau hierin liegt auch der Grund, warum ein Pentium 4 mit 1 GHz langsamer wäre als ein Pentium III mit 1 GHz bei einer Software, die nicht speziell auf den Pentium 4 ausgelegt ist! Der Pentium III kann die einzelnen Operationen dank seiner nur 10 stufigen Pipeline schneller abarbeiten als der Pentium 4 bei gleicher Taktfrequenz. Dafür kann der Pentium III eben gerade auch wegen seiner nur 10 stufigen Pipeline aber bei weitem nicht die Taktraten eines Pentium 4 erreichen. Damit der Pentium 4 zu seinem Debüt nicht gleich langsamer als sein Pentium III Pendant abschneidet, hat Intel ihn wohl auch zuerst mit 1.6 GHz beginnen lassen.

Dieser Punkt ist für das weitere Verständnis der Ergebnisse enorm wichtig, da er auch erklärt, warum ein Pentium 4 bei gleichem Takt nicht schneller ist als ein Athlon XP, der einen Mix aus 10 und 15 stufiger Pipeline verwendet. Deshalb finden wir es auch immer etwas bedenklich, wenn ein Pentium 4 mit einem Athlon XP gleichen Taktes verglichen wird. Hier sollte man schon vorher wissen, dass in diesem Fall der Athlon XP in den meisten Anwendungen schon alleine wegen seiner Architektur die Nase vorne haben sollte. Doch muss auch jedem klar sein, dass ein Athlon XP mit seiner derzeitigen Architektur nicht die Taktraten eines Pentium 4 erreichen kann.

Intel und AMD gehen hier momentan zwei verschiedene Wege. Intel muss bei seinem Pentium 4 die Taktrate wegen seiner Architektur deutlich höher ansiedeln, um in derselben Zeit gleich viele Operationen abhandeln zu können, wie ein Athlon XP mit einer niedrigeren Taktfrequenz. AMD setzt hier auf mehr Leistung pro Takt und Intel auf mehr Leistung durch mehr Takt.

Auf der nächsten Seite: Advanced Dynamic Execution

22 Kommentare
Themen: