4/25 Athlon XP 2500+, 2800+ und 3000+ im Test : Der neue Kern

, 86 Kommentare

Ein Wort zum Cache

Ein System ist nur so gut, wie der, der es bedient. Dies trifft natürlich auf jeden Personal Computer zu. Doch ist es nicht ganz so einfach, wie es der Spruch vermuten läßt. Beim Computer sind die Gesamtleistung und die Stabilität entscheidend. Der schnellste Prozessor nutzt beispielsweise rein gar nichts, wenn das Speichersubsystem nicht in der Lage ist, ihn mit ausreichend Daten zu versorgen. Ein hoher Prozessortakt alleine macht also noch lange keinen flinkeren Computer. Die Daten, die es zu berechnen gilt, kommen hierbei aus dem L1 oder L2 Cache oder, falls nötig, aus dem Arbeitsspeicher des Rechners.

Die prozessornahen L1 und L2 Speicher zeichnen sich hierbei durch besonders niedrige Latenzzeiten und hohe Taktraten aus, auf die der Prozessor nahezu ohne größere Verzögerung zugreifen kann. Im Vergleich dazu geht ein Lesevorgang aus dem Arbeitsspeicher nur im Schneckentempo von statten. Ein guter Prozessor versucht also Daten, die er aus dem Arbeitsspeicher benötigt zu laden, bevor er sie eigentlich benötigt. Er schätzt hab, welche Daten zu weiteren Abarbeitung des Prozesses (Threads) oder folgender Threads, die sich schon in der Warteschleife befinden, benötigt werden. Doch beim Schätzen kann man sich natürlich auch verschätzen, was sich dann in einem sogenannten Case Miss äußert. Hier muss der Prozessor mitten in der Bearbeitung eine Pause einlegen und auf die Daten auf den Arbeitsspeicher warten. Das kostet natürlich sehr viel Zeit und somit auch Performance. An dieser Stelle wäre ein Blick in die Grundlagen von HyperThreading anzuraten, wo wir auf den Arbeitsablauf im Prozessor und die damit verbundenen Probleme näher eingegangen sind.

Palomino - Thoroughbred B - Barton
Palomino - Thoroughbred B - Barton
Palomino - Thoroughbred B - Barton
Palomino - Thoroughbred B - Barton

Um die Anzahl der Cache-Misses zu reduzieren, kann es also hilfreich sein, mehr Daten in den schnellen, prozessornahen Caches abzulegen. Eine Vergrößerung kann hier also wahre Wunder bewirken. Hier gilt es jedoch einen idealen Mittelweg zu finden. Denn die Caches sind nur dann schnell, wenn sie klein gehalten werden. Außerdem sind sie in ihrer Fertigung hochkomplex, da sie sehr viele Transistoren beinhalten. So machen 256kB L2 Cache beispielsweise ca. 13 Millionen zusätzliche Transistoren, die je nach Prozessorarchitektur mit dem vollen Prozessortakt betrieben werden. Doch bereits ein fehlerhafter Transistor kann das Aus für den ganzen Prozessor bedeuten.

Während die ersten Pentium 4 Prozessoren mit Willamette-Kern noch über einen 256 kB L2 Cache verfügten, kommen aktuellen Pentium 4 Prozessoren mit Northwood-Kern mit ganzen 512 kB von diesem Speicher daher. Der erreichte Leistungszuwachs bei gleichem Takt ist ernorm, was nicht zuletzt unser Celeron 2,0 GHz Review zeigte, wo der L2 Cache ganz und gar auf 128 kB L2 beschnitten wurden.

Nun hat auch AMD die Größe des L2 Cache von 256 kB L2 beim Thunderbird, Palomino und Thoroughbred-Kern auf 512 kB L2 mit dem Barton-Kern verdoppelt. Von der Theorie dürfte der Leistungszuwachs durch den neuen Barton-Kern jedoch nicht so groß ausfallen, wie beim Kern-Wechsel des Pentium 4. Und dies hat einen einfachen Grund.

Der L2 Cache des Pentium 4 arbeitet im so genannten L1 inclusive Modus. Das heißt, die Daten, die sich im L1 Cache befinden, werden auch im L2 Cache abgelegt. Das ist einfacher zu Verwalten, verschwendet jedoch kostbaren Speicherplatz. Mit der Verdopplung des L2 Cache hat Intel also tatsächlich die Größe der zur Verfügung stehenden Caches verdoppelt.

Beim Athlon XP ist dies anders. AMD hat sich hier nicht vor einen größeren Verwaltungsaufwand gescheut ist somit in der Lage den L2 im L1 exclusive Modus zu betreiben. Daten und Instruktionen, die bereits im L1 gelandet sind, müssen nicht einmal im L2 abgelegt werden. Somit konnten alle bisherigen Sockel A Athlon Prozessoren auf effektiv 384 KB Cache (64 kB L1 Daten + 64 kB L1 Instruktionen + 256 kB L2) zurückgreifen. Dadurch, dass man den L2 Cache vergrößert hat, kann der Athlon XP mit Barton-Kern insgesamt 640 kB im Cache ablegen.

Die Größe der prozessornahen Speicher hat sich somit beim Athlon XP nur um 66 Prozent erhöht, beim Pentium 4 waren es dagegen 100 Prozent.

Auf der nächsten Seite: Ein Wort zum Takt