ComputerBase

Test: Athlon 64 FX-51 und Athlon 64 3200+

von Thomas Hübner

Auftakt

Sie sind da, die beiden Neuen! Richtig gehört, denn wie es vor einigen Wochen plötzlich aus allen Ecken flüsterte, hat AMD nicht nur den schon länger angekündigten Athlon 64 vorgestellt. Auch ein Athlon 64 FX erblickt just in diesem Moment das Licht der Öffentlichkeit. Während der nun kurzer Hand zum kleinen Bruder degradierte Athlon 64 3200+ mit 2,0 GHz und einem Single-Channel-Interface auskommen muss, hat man dem Athlon 64 FX-51 kurzer Hand 2,2 GHz und Dual-DDR400 spendiert. Ja, auch dieses Gerücht, das zur CeBit2003 richtig ins Kochen geriet, hat sich bewahrheitet.

Wir wollen in diesem Artikel, in dem es um mehr geht, als um die x. Takterhöhung einer eingebürgerten Architektur, auf die Neuerungen von AMD64 - vormals x86-64 - eingehen. Was ist neu und was ist alt? Wo liegen die Voraussetzungen für einen der neuen Prozessoren? Was bringt 64 Bit heute und was bringt es morgen? Wie sieht es mit kühlen, übertakten und dem verwendeten Speicher aus? Ein Dickicht voller Fragen, das wir lichten wollen.

Dem ausladenden Theorieteil folgt unser überarbeiteter Benchmarkparcours, den wir vor einiger Zeit mit Hilfe der Mitglieder in unserem Forum gehörig aufgefrischt haben und der in gleich fünf Leistungsratings seinen Höhepunkt findet.

Die Suche nach einer Athlon 64 3200+ CPU, die - nicht wie der FX-51 - von AMD gestellt wurde, erschien übrigens ungleich schwerer, als so manch' andere Hürde in diesem Test. Letztendlich haben wir dennoch ein Exemplar in die Hände bekommen und können auch diesem Chip, der ob seines attraktiven Preises wohl die erste Wahl für den Massenmarkt werden dürfte, über die Schulter schauen. Sicherlich wollte man seitens AMD mit der FX-Brechstange ein Zeichen setzen. Verstecken hätte man die Leistung des Athlon 64 jedoch nicht brauchen - die kann sich ebenfalls durchaus sehen lassen. Fraglich, was einem zu diesem Schritt bewegt hat.

Wir wünschen viel Spass und Durchhaltevermögen!

Athlon 64 Logo Athlon 64 FX Logo

Lesezeichen

Da es möglich ist, dass in diesem Artikel auf bestehendes Wissen aus älteren Prozessortests zurückgegriffen wird, ist es für alle, die etwas "mehr" wissen möchten, keinesfalls verkehrt, auch einen Blick in unsere älteren Berichte (Ausschnitt) zu werfen.

Wer darüber hinaus noch an der Prozessoren-Geschichte von AMD und Intel interessiert ist, wird an den Artikeln „Intels Prozessor History - Der Weg vom Intel 4004 bis zum Pentium 4 [8]“ und „AMD Prozessor History - Ein Überblick vom K5 bis zum Athlon XP [9]“ seine wahre Freude haben.

Ursprünglicher Plan

Die zwei heute vorgestellten Athlon 64-Prozessoren auf Basis der AMD64 Architektur, ehemals x86-64 genannt, welche unter dem Codenamen „Hammer“ entwickelt wurde, haben einen langen, steinigen und von Verzögerungen gepflasterten Weg hinter sich gebracht. Am 10. August 2000 für das Ende 2001 angekündigt, wurde daraus Ende Januar 2001, das erste Halbjahr 2002, das zweite Halbjahr 2002, das vierte Quartal 2002, das erste Halbjahr 2003 und schlussendlich ein Termin im September 2003. Letzteren Termin hatte man bereits am 31. Januar 2003 gesetzt und er sollte auch tatsächlich eingehalten werden. Aufgrund der langen Planungsphase sollten darüber hinaus genügend Mainboards für die neuen Produkte zur Verfügung stehen und jedwede Kompatibilitätsprobleme sollten dank der bereits seit 22. April verfügbaren Opteron-Prozessoren, welche ebenfalls auf der AMD64 Architektur beruhen, aber für den Workstation- und Servereinsatz in Multiprozessorumgebungen entwickelt wurden, weitestgehend aus der Welt geräumt sein. In wie weit das der Realität entspricht, wollen wir im weiteren Verlauf dieses Artikels klären.

Der Vollständigkeit halber folgt an dieser Stelle eine Übersicht der in offiziellen Pressemeldungen genannten Start-Termine für die neue Architektur, welche unter anderem aufgrund von Fertigungsproblemen immer wieder auf ein späteres Datum verschoben wurde.

Von ursprünglich Ende 2001

auf erstes Halbjahr 2002

auf zweites Halbjahr 2002

auf Q4 2002

auf erstes Halbjahr 2003

und anschließend auf September 2003

Dabei sollte jedoch jedem klar sein, dass man eine neue Architektur nicht von heute auf morgen entwickeln kann - häufig treten Probleme auf, welche zu Beginn der Entwicklung nicht einmal für möglich gehalten wurden. Das schließt auch Intel nicht aus, wo man aufgrund von Fertigungsproblemen die immer wieder zitierte Vorstellung des Pentium 4 Nachfolgers vom vierten Quartal 2003 (Anfangs für Oktober geplant, dann auf Dezember verschoben) Gerüchten zufolge auf Februar 2004 verschieben musste.

Häufig sind es auch nicht nur Probleme, auf die man stößt. Manchmal ist es auch eine zu starke Konkurrenz, durch die man gezwungen wird, während der Entwicklung eine andere Richtung einzuschlagen bzw. eine Planänderung vorzunehmen. Bei Intel trifft dies ganz klar auf den Pentium 4 Extreme Edition zu, welcher vollkommen überraschend am 16. September 2003 anlässlich des Intel Developer Forums Fall 2003 vorgestellt wurde - langfristig geplant war diese CPU ganz sicher nicht.

Planänderungen

Betrachtet man nicht mal ein Jahr alte Roadmaps vom 17. November 2002, so ist doch erschreckend, was aus den ursprünglich geplanten Produkten geworden ist. Ausgehend vom damaligen Entwicklungsstand sollte ein „AMD Athlon Processor (ClawHammer-DT), Athlon Processor (ClawHammer-DP) und ein Opteron (SledgeHammer-MP)“ im ersten Halbjahr 2003 erscheinen. Im Detail wurden die Produkte wie folgt geplant:

AMD Athlon Prozessor (ClawHammer-DT)
Desktop Prozessor
Single-Channel DDR mit 200, 266 und 333 MHz
(Weitere Speicher-Technologien, sobald definiert)
Ein 16-bit HyperTransport Link mit 1600MT/s
Produkte mit 256KB und 1MB L2 Cache
754-Pin mPGA Package
AMD Athlon (ClawHammer-DP)
2-Wege Server und Workstation Prozessor
Single-Channel DDR mit 200, 266 und 333 MHz
(Weitere Speicher-Technologien, sobald definiert)
Zwei 8-bit HyperTransport Links mit 1600MT/s
Produkte mit 512KB und 1MB L2 Cache
754-Pin mPGA Package
AMD Opteron (SledgeHammer-MP)
Bis zu 8-Wege Server Prozessor
Dual-Channel DDR mit 200, 266 und 333 MHz
(Weitere Speicher-Technologien, sobald definiert)
Drei 16-bit HyperTransport Links mit 1600MT/s
1MB L2 Cache integriert
940-Pin mPGA Package


Am heutigen Tag ankündigt wurden der Athlon 64 für den Sockel 754 und der Athlon 64 FX für den Sockel 940. Während letztgenannter gar nicht in den Roadmaps erwähnt wird, ist erster keinesfalls Dual-Prozessor-fähig. Eine entsprechende Dual-Prozessor Variante für einen Sockel 754 Prozessor wird es so schnell wohl auch nicht geben - der ClawHammer-DP wurde ersatzlos gestrichen, wenngleich minimale Hinweise existieren, dass der Prozessor, den wir am heutigen Tag als Athlon 64 kennen lernen, in einem Merkmal mit dem ClawHammer-DP übereinstimmen könnte. Während in den offiziellen Pressedokumenten beim Athlon 64 von einem 16 Bit weiten HyperTransport-Kanal die Rede ist, spricht der 'Software Optimization Guide for AMD Athlon 64 and AMD Opteron Processors (25112)' auf Seite 262 unmissverständlich von zwei 8bit weiteren Anbindungen, welche allerdings zu Gunsten einer 16bit HyperTransport-Verbindung zusammengeschlossen werden können. Ist der Athlon 64, da eigentlich ClawHammer-DP, etwa Dual Prozessor fähig? Laut AMD natürlich nicht!

Doch zurück zum Thema: Kleine Athlon-Modelle mit 256 und 512kB großen Cache stehen auf der Liste - sie werden wohl auch nicht erscheinen, wenngleich es auf der aktuellen Roadmap andere Produkte mit neuem Codenamen auf Basis der Hammer-Architektur gibt, welche mit 256kB Cache ausgestattet sind. Dem Thema wollen wir uns jedoch erst in den Zukunftsaussichten zuwenden. Fakt ist, dass kleine Athlon 64 Modelle, d.h. Prozessoren mit kleinerem Cache, am heutigem Tage nicht vorgestellt wurden. Darüber hinaus wurde die Speicherunterstützung der geplanten Prozessoren (Opteron ausgenommen) um DDR400 erweitert.

Übrigens erschien auch bei den Opteron-Prozessoren nicht das, was geplant war, wenngleich der SledgeHammer-MP all das verkörpert, für das die Opteron 1XX, 2XX und 8XX Prozessoren heute stehen. Damals sah die Sache jedoch noch anders aus, wie Justin Boogs, AMD Developer Center Manager, in seinem ebenfalls am 17. November veröffentlichtem Dokument „Developer_Center“ auf Seite 4 schreibt.

Verfügbare Hardware
Single-Prozessor 8. Generation AMD Athlon ("Clawhammer"),
Desktop PCs mit 512MB bis 2GB RAM
Dual-Prozessor AMD Opteron ("Clawhammer DP"),
Server und Workstations mit 1 bis 4GB RAM
Quad-Prozessor AMD Opteron ("Sledgehammer"),
Server mit 4 bis 16GB RAM

Demnach hörte der „Dual processor AMD Opteron“ damals auf dem Codename Clawhammer-DP und sollte somit laut obiger Roadmap für den Sockel 754 mit Single Channel Speicherinterface starten. Nur der „Quad processor AMD Opteron“ sollte auf dem Sledgehammer-Kern im Sockel 940 basieren - widersprüchlich, verglichen mit allen bis dahin veröffentlichen Informationen. Opteron auf zwei verschiedenen Sockeln? Schreibfehler, oder wusste hier die linke Hand nicht was die Rechte tut? Doch was interessiert uns alter Kaffee, das hier und jetzt zählt.

Überlegenheit gegenüber dem Pentium 4?

Bevor wir uns in den Details der AMD64-Architektur verlieren, soll eine Vergleichstabelle zwischen Pentium 4, Athlon XP und den beiden neuen Athlon 64 und Athlon 64 FX für etwas Übersicht sorgen.

Die Prozessoren im Überblick
MerkmalePentium 4Athlon XPAthlon 64 (FX)
Kern NorthwoodThoroughbred "A/B"
Barton
Clawhammer
Frontside-Bus400 MHz QDR
533 MHz QDR
800 MHz QDR
266 MHz DDR
333 MHz DDR
400 MHz DDR
entfällt
Fertigung0,13µm0,13µm0,13µm SOI
SockelSockel 478Sockel ASockel 754
Sockel 940 (FX)
Taktrate o.
Modellnummer
400 MHz QDR
1600 MHz A
1800 MHz A
2000 MHz A
2200 MHz
2400 MHz
2500 MHz
2600 MHz

533 MHz QDR
2266 MHz
2400 MHz B
2533 MHz
2666 MHz
2800 MHz
3066 MHz HT

800 MHz QDR
2400 MHz C HT
2600 MHz C HT
2800 MHz C HT
3000 MHz HT
3200 MHz HT

HT: Hyper-Threading
266 MHz DDR (Tho.)
1800+
1900+
2000+
2100+
2200+
2400+
2600+

333 MHz DDR (Tho.)
2600+
2700+
2800+

333 MHz DDR (Bar)
2500+
2600+
2800+
3000+

400 MHz DDR (Bar.)
3000+
3200+
Athlon 64:
3200+

Athlon 64 FX:
51
Transistoren55 Millionen37,5 Millionen (Tho.)
54,3 Millionen (Bar.)
105.9 Millionen
DIE-Size146mm² (nB0 Step)
131mm² (nC1 Step)
131mm² (nD1 Step)
80 mm² ("A")
84 mm² ("B")
101 mm²(Bar.)
193 mm²
L1-Execution-Cache 12.000 µ-Ops64 kB64 kB
L1-Daten-Cache8 KB64 kB64 kB
L1-TaktCPU-TaktCPU-TaktCPU-Takt
L2-Cache512kB256kB (Tho.)
512kB (Bar.)
1024kB
L2-Anbindung256 Bit64 Bit128 Bit?
L2-Cache-TaktCPU-TaktCPU-TaktCPU-Takt
L2-ModusL1 inclusiveL1 exclusiveL1 exclusive
HW Data PrefetchingJaJaJa
VCore1,475V
1,500V
1,525V
1,550V
1,50V
1,60V
1,65V
1,55V
BefehlssätzeMMX
SSE / SSE2
MMX / 3DNow!
3DNow!+ / SSE
MMX / 3DNow!
3DNow!+ / SSE
SSE2 / AMD64
Temperatur DiodeJaJaJa
Multiprozessor-fähigNeinNeinNein
CPU-Architektur20-stufige Pipeline15-stufige (FPU)
10-stufige (ALU)
Pipeline
17-stufige (FPU)
12-stufige (ALU)
Pipeline

Auf den ersten Blick gibt es nur sehr wenig Auffälligkeiten, doch im Detail hat es der Athlon 64 (FX) in sich. Die Tatsache, dass die Prozessoren auf Basis der AMD64 Architektur keinen klassischen Frontside-Bus besitzen, hat nämlich weitreichende Folgen. Was ist der Frontside-Bus? Über diesen Bus waren bisher alle geläufigen Desktop-Prozessoren mit der Außenwelt (AGP, PCI, USB sowie allen anderen Geräten) und damit auch dem Arbeitsspeicher verbunden. Beim Athlon 64 (FX) sieht die Sache etwas anders aus. Diese Prozessoren besitzen ebenso wie die Server-Variante (Opteron) eine im Prozessor integrierte Northbridge einschließlich eines Speichercontrollers. Hierauf werden wir im Verlauf des Reviews im Detail eingehen.

Athlon 64 Athlon 64 FX als Opteron erkannt

Athlon XP Pentium 4

Des weiteren haben die drei Buchstaben „SOI“, stellvertretend für Silicon on Insulator, bei der Fertigungstechnologie weit reichende Folgen auf die Betriebsspannung, auf den Stromverbrauch und damit auch auf die thermische Verlustleistung. Um noch einen weiteren besonders wichtigen Punkt zu nennen, sei auf die Zeile „Befehlssätze“ das Augenmerk gelenkt: AMD64, ehemals x86-64, ermöglicht den Spagat zwischen der 32bit und 64bit Architektur welche einige Barrieren ins nahezu Unerreichbare verschiebt.

Athlon XP, Athlon 64, Athlon 64 FX, Pentium 4 Athlon XP, Athlon 64, Athlon 64 FX, Pentium 5

In unsere technischen Abhandlungen über die neuen Prozessoren aus dem Hause AMD wollen wir langsam mit den Entwicklungs-Codenamen einsteigen und wenden uns anschließend der AMD64-Architektur zu.

Die Codenamen

Ob der vielen geänderten Codenamen ClawHammer-DP, ClawHammer-DT und SledgeHammer-MP haben wir bei AMD um Klärung gebeten und erhielten von Jan Gütter, AMD Public Relations Zentraleuropa, folgende Codenamenzuweisung:

AMD Athlon 64 Logo

Der Opteron ist also ohne Zweifel ein Sledgehammer, der Athlon 64 ein Clawhammer und der Geistesblitz Athlon 64 FX hat ob der Kürze der Entwicklungsphase nie einen gehabt. Letztendlich sind die Codenamen jedoch nur Schall und Rauch, denn ob Athlon 64, Athlon 64 FX oder Opteron - alle laufen in AMDs Dresdner Produktionsstätte, Fab30, vom selben Band. Das verdeutlichen auch die Features der verschiedenen Prozessoren im Vergleich:

Athlon 64Athlon 64 FXOpteron 1XXOpteron 2XXOpteron 8XX
Prozessorsockel
Sockel 754Sockel 940Sockel 940Sockel 940Sockel 940
Skalierbarkeit
1-fach1-fach1-fachBis zu 2-fachBis zu 8-fach
Integrierter Speichercontroller / Speicherbandbreite
Ja/64-bitJa/128-bitJa/128-bitJa/128-bitJa/128-bit
HyperTransport Technologie / HyperTransport Links
Ja/1Ja/1Ja/3Ja/3Ja/3
AMD64 Erweiterung / Gleichzeitiges 32 & 64-bit Computing
Ja/JaJa/JaJa/JaJa/JaJa/Ja
Größe des L1-Cache (Daten/Instruktion)
64KB/64KB64KB/64KB64KB/64KB64KB/64KB64KB/64KB
Größe des L2-Cache
1MB1MB1MB 1MB 1MB
Pipeline stages (integer/floating point)
12/1712/1712/17 12/17 12/17
L1/L2 data cache protection
ECCECCECC ECC ECC
L1/L2 instruction cache protection
ParityParityParity Parity Parity
Global History Zähler-Einträge
16K16K16K16K16K
L1 TLB Einträge (Daten/Instruktion)
40/4040/4040/4040/4040/40
L1 Assoziativität(Daten/Instruktion)
Voll/VollVoll/VollVoll/VollVoll/VollVoll/Voll
L2 TLB Einträge (Daten/Instruktion)
512/512512/512512/512512/512512/512
L2 Assoziativität (Daten/Instruktion)
4-fach/4-fach4-fach/4-fach4-fach/4-fach4-fach/4-fach4-fach/4-fach
Fertigungs-Technologie
0.13µm SOI0.13µm SOI0.13µm SOI0.13µm SOI0.13µm SOI
Hergestellt in Fab 30, Dresden Deutschland

Im Großen und Ganzen unterscheiden sich die verschieden Prozessoren nur in sehr wenigen Punkten. Insbesondere der Athlon 64 hebt sich durch seinen Sockel und das Speicherinterface von seinen Mitstreitern ab.

Aus dem Wafer werde Athlon 64 oder Opteron

Wafer vom Athlon 64 und Opteron Auch wenn der Prozessorkern des Athlon 64, Athlon 64 FX und des Opterons absolut identisch ist, trennen sich beim Packaging die Wege der Prozessoren. Je nach Qualität des Prozessorkerns (DIE) wird aus dem einen Exemplar ein Opteron mit Dual Channel-Interface und Multi-Prozessor-Fähigkeit, aus dem anderen ein Athlon 64 FX mit Dual Channel-Speicherinterface und aus dem dritten vielleicht ein Athlon 64, welcher mit einem Single Channel Speicherinterface aufwarten kann. Sobald der Prozessorkern seinen Unterbau, das Prozessorgehäuse, verpasst bekommt und entsprechend verdrahtet wird, stehen die Features der jeweiligen CPU fest. Welcher Prozessor für was berufen ist, das entscheidet die Qualitätskontrolle. Ähnlich geht Intel mit der Selektion der Canterwood-Chipsätze vor.

Athlon 64 FX Keramik, Athlon 64 organisch

Das Prozessorgehäuse des Athlon 64 FX und Athlon 64 unterscheidet sich hierbei nicht nur in der Anzahl der Pins (940 gegenüber 754) sondern auch im verwendeten Material. Während beim Athlon 64 FX wie bei dem Opteron-Prozessoren oder den aller ersten Athlon (Thunderbird)-Prozessoren ein CPGA (Ceramic Pin Grid Array), also ein Keramikgehäuse, zum Einsatz kommt, wird der Athlon 64 auf ein OPGA (Organic Pin Grid Arry), einem Gehäuse aus organischen Material, untergebraucht.

Athlon 64 und Athlon 64 FX Athlon 64 und Athlon 64 FX

Dieses kommt unter anderem auch beim Athlon XP oder beim Intel Pentium 4 zum Einsatz. Allgemein gilt letzteres Material als besonders hitzebeständig und zeichnet sich durch eine größere Elastizität aus - warum beim Athlon 64 FX dennoch ein CPGA zum Einsatz kommt, können wir nur damit erklären, dass die vielen PINs mit eben diesem Gehäuse einfacher zu realisieren sind. Letztendlich sollte die thermische Beständigkeit des Gehäuses derzeit eher eine Nebenrolle spielen - wird der Athlon 64 FX unter Volllast nicht ansatzweise richtig heiß.

Prozessorkern in der Großaufnahme

Um die Aussage, die Opterons, der Athlon 64 und der Athlon 64 FX stammen vom selben Wafer, nicht ganz ohne optischen Nachweis dastehen zu lassen, soll ein Detail-Blick auf den Wafer für die nötige Klarheit sorgen.

Athlon 64 FX Die
Athlon 64 Die

Diese Aufnahmen stammen von AMD und unterscheiden sich offensichtlich nur im Logo in der unteren, rechten Ecke. Ein Opteron 1XX, 2XX oder 8XX sieht in der Nahaufnahme nicht viel anders aus.

Die Modellnummern des Athlon 64 und Athlon 64 FX

Im Rahmen der „True Performance Initiative“ hat sich AMD bereits beim Athlon XP dazu entschieden, bei seinem Prozessoren nicht mehr die Taktfrequenz sondern eine Modellnummer bzw. ein Performance-Rating einzuführen, welches den jeweiligen Prozessor mit einem älteren Modell vergleicht. Die Modellnummer beim bisher schnellsten Athlon XP 3200+ sagt hierbei folgendes aus: Ein Athlon Classic (Thunderbird) müsste mit 3,2 GHz takten um eine vergleichbare Leistung zu erreichen. Nachprüfen kann das natürlich keiner - schließlich war beim Athlon mit einem Takt von 1,4 GHz Schluss. Im Vergleich zu den Modellnummern beim Athlon XP trennt man sich bei den Bezeichnungen für den Opteron allerdings von einer der Taktfrequenz ähnlichen Angabe. Beim Opteron hat man eine dreistellige Zahl auserkoren, um die verschiedenen Modelle des 64Bit Serverprozessors voneinander zu unterscheiden. Die erste Ziffer steht hierbei für die Anzahl der in einem System unterstützten Prozessoren. Die Opterons für 1-Wege-Systeme sind also an der Modellnummer 1XX zu erkennen. Insgesamt gibt es drei Serien:

Die zweite und dritte Ziffer gibt die relative Geschwindigkeit des Prozessors innerhalb einer Prozessorserie an. Der Opteron 244 bietet somit eine höhere Leistung als der Opteron 242, wie sich ein Opteron 146 im Vergleich dazu behaupten kann, geht aus den Nummern dagegen nicht hervor. Der derzeit schnelle Opteron in der jeweiligen Serie X46 taktet mit 2,0 GHz, Modelle mit 1,4 GHz (X40), 1,6 GHz (X42) und 1,8 GHz (X44) sind ebenfalls verfügbar.

Auch dem Athlon 64 FX hat man eine abstrakte Zahl verpasst, die in keiner Weise an eine Taktfrequenz erinnert: Der Athlon 64 FX mit einem realen Prozessortakt von 2,2 GHz hört auf die Beizeichnung Athlon 64 FX-51.

Beim Athlon 64 konnte man es dagegen nicht lassen - man hat dieser CPU wieder eine Modellnummer verpasst, die stark einer Taktfrequenz ähnelt. Letztendlich bleibt nur zu hoffen, dass es im Laufe der Zeit nicht zu wieder einer Verschiebung der Modellnummern kommt, nach der dann bestimmte Prozessoren ihre Bezeichnung zu Unrecht tragen.

Der Athlon 64 steht anfangs als 3200+ mit einem Takt von 2,0 GHz parat, der Mobile Athlon 64 wird darüber hinaus noch als 3000+ mit einem Takt von 1,8 GHz angeboten werden. Hier ein Überblick über die aktuellen Modellnummern der Athlon XP und Athlon 64 (FX) Prozessoren. Den Varianten des alten Athlon XP mit Palomino und Throughbred "A"-Kern haben wir dabei zur Übersichtlichkeit entfernt. Diese Modelle wurden jedoch in einem älteren Prozessorreview [16] brücksichtigt.

Athlon XP Prozessoren im Überblick
Bezeichnungrealer TaktFrontside-Bus
Thoroughbred "B", 0,13µm, 64kB + 64kB L1 + 256kB L2 Cache
Athlon XP 1700+ 1466 MHz133 MHz
Athlon XP 1800+ 1533 MHz133 MHz
Athlon XP 1900+ 1600 MHz133 MHz
Athlon XP 2000+ 1666 MHz133 MHz
Athlon XP 2100+ 1733 MHz133 MHz
Athlon XP 2400+ 2000 MHz133 MHz
Athlon XP 2600+ 2133 MHz133 MHz
Athlon XP 2600+ 2083 MHz166 MHz
Athlon XP 2700+ 2166 MHz166 MHz
Athlon XP 2800+ 2250 MHz166 MHz
Barton, 0,13µm, 64kB + 64kB L1 + 512kB L2 Cache
Athlon XP 2500+ 1833 MHz166 MHz
Athlon XP 2600+ 1917 MHz166 MHz
Athlon XP 2800+ 2083 MHz166 MHz
Athlon XP 3000+2100 MHz200 MHz
Athlon XP 3000+ 2166 MHz166 MHz
Athlon XP 3200+2200 MHz200 MHz
Athlon 64 Prozessoren im Überblick
Bezeichnungrealer TaktSpeicherinterface
Clawhammer 0,13µm SOI, 64kB + 64kB L1 + 1MB L2 Cache
Athlon 64 3000+* 1800 MHzSingle-Channel
Athlon 64 3200+ 2000 MHzSingle-Channel
Athlon 64 3400+** 2200 MHzSingle-Channel
Athlon 64 FX-51 2200 MHzDual-Channel

* Nur als Mobile Variante, ** Für Oktober/November geplant

Wie man bei dieser Übersicht besonders gut erkennen kann, hat AMD dem Athlon 64 und dem Athlon XP bei gleichem Prozessortakt die gleiche Modellnummer zugeteilt - doch gerade letzterer wurde seiner Modellnummer eher selten gerecht. Wie wird dies wohl beim Athlon 64 aussehen? Die Benchmarks werden es zeigen.

Die Kraft der AMD64 Architektur

Zur im Athlon 64 und Athlon 64 FX zum Einsatz kommenden Architektur kann man sicherlich besonders viele Worte verlieren. Im Vergleich zum bisher schnellsten Desktop-Prozessor aus dem Hause AMD, dem Athlon XP 3200+, gibt es dabei doch die eine oder andere Gemeinsamkeiten. Letztendlich zählen jedoch nur die Unterschiede.

Architektur des AMD Athlon (Athlon XP verfügt über 32-Entry TLB und SSE-Support)
AMD Athlon Architektur

Die neue AMD AMD64 Architektur, bisher unter der Bezeichnung x86-64 bekannt
AMD64 Architektur

So besitzen alle Prozessoren der AMD64-Architektur eine in den Prozessor integrierte Northbridge, an die unter anderem der Speichercontroller und ein HyperTransport-Interface angebunden sind. Außerdem besitzt der Athlon 64 (FX) einen 1 MB großen L2-Cache, der doppelt so groß wie der des Athlon XP 3200+ ausfällt. Auch der SSE2 Befehlssatz wird nun unterstützt. Darüber hinaus werden die drei Integer-Units des Prozessors nun von einem insgesamt 24 Einträge fassenden Scheduler gefüttert. Die Integer-Scheduler des Athlon XP fassen nur 18 Einträge. Beim FPU-Scheduler des Athlon XP mit seinen 32 Einträgen war man dagegen auch beim Athlon 64 zufrieden. Bei der Branch Prediction Unit hat man allem Anschein nach Bedarf zur Nachbesserung gesehen. So hat man hier z.B. die Größe des Global History Counters auf 16k vervierfacht um somit eine bessere Sprungvorhersage zu ermöglichen. Bei den Translation Look-aside Buffer (TLB) hat man ebenfalls den Speicherplatz vergrößert. Nachdem man dem Athlon XP im Vergleich zum Athlon bereits optimierte TLBs [17] zukommen lies, wurde nun die Größe der L2 TLB von 256 auf 512 Einträge verdoppelt. Die 10-stufige ALU und 15-stufige FPU-Pipeline des Athlon XP wurden bei den Mitgliedern der AMD64-Architektur um jeweils zwei Stufen auf 12 und 17 „Stages“ verlängert. Dadurch wird die Arbeit auf mehrere Einheiten verteilt, wodurch die einzelnen Units weniger komplex ausfallen können und dadurch höhere Taktraten erreicht werden. Je länger die Pipeline, desto leichter kann auch der Prozessortakt angehoben werden. Dafür ist eine lange Pipeline sehr anfällig gegenüber Cache-Misses oder falschen Branch-Predictions, deshalb auch die Vergrößerung des Global History Counters der Branch Prediction Unit. An dieser Stelle soll auch nicht vergessen werden, dass der Prozessorcache nun über einen ECC Fehlerkorrektur-Mechnismus verfügt. Im Detail haben sich darüber hinaus weitere Kleinigkeiten verändert.

Die bisher aufgeführten Verbesserungen sind zwar schön und gut, wirklich neu ist aber die 64 Bit Erweiterung, welche dem Athlon 64 sowie dem Athlon 64 FX auch zu ihrem Namen verholfen hat. Im 32 Bit Modus verhalten sich Athlon 64 (FX) und Opteron wie klassische x86 Prozessoren. In diesem Modus bietet er acht 32 Bit breite General-Purpose Registers (GPRs), acht 64 Bit fassende Media and Floating-Point Registers (für MMX) sowie acht 128 Bit breite Media Registers (für SSE und SSE2).

Als Register bezeichnet man prozessorinterne Zwischenspeicher. Auf diesen Registern werden sämtliche Operationen wie Addition und Multiplikation durchgeführt. Ein Prozessor kann so lange Operationen durchführen, wie seine Register lang sind. Ein 32Bit Prozessor kann also mit Zahlen arbeiten, die eine Länge von maximal 32 Bit haben (wenn man die MMX und SSE/SSE2 Befehle außen vor lässt). Sind die Operanden größer als 32 Bit, so werden diese in logische Teile ausgeführt und müssen einzeln berechnet werden. Dagegen kann ein 64 Bit Prozessor mit 64 Bit großen Operanden arbeiten und benötigt für die Berechnung demzufolge deutlich weniger Taktzyklen als ein 32Bit Prozessor.

Die Kraft der AMD64 Architektur (Fortsetzung)

Im 64-Bit Modus werden die bestehenden 32 Bit GPRs auf 64 Bit erweitert und um weitere 8 ergänzt, womit 16 GPRs mit 64 Bit Fassungsvermögen zur Verfügung stehen - das erste Kennzeichen eines 64 Bit Prozessors. Rein theoretisch müsste eine für AMD64 kompilierte und programmierte Anwendung dabei bereits von dem Mehr an Registern, welche als kleine Datenspeicher zu verstehen sind, profitieren.

Die Register in den verschiedenen Betriebsmodi

Der größere Speicheradressraum ist da nur eine nette Erweiterung. Im reinen 64 Bit-Mode können nämlich physisch 2^40 Byte (1024 GByte = 1 TByte) an Arbeitsspeicher adressiert werden, virtuell sind es sogar 2^48 Byte - im 32 Bit Modus sind es nur 2^32 Byte (4 GByte). Hier zeigt sich also bereits der zweite Vorteil der 64 Bit-Architektur. Wirkliche 64 Bit Speicheradressierung bietet derzeit übrigens kaum ein 64 Bit Prozessor - der Athlon 64 (FX) ist da also keine besondere Ausnahme.

Der große Speicheradressraum wird, wenngleich zum jetzigen Zeitpunkt 4 GByte (inklusive Windows Swapfile, welches zum virtuellen Speicherbereich dazuzuzählen ist) noch ausreichen, doch früher oder später nützlich werden.

Dabei bleibt bei AMD64 im Gegensatz zu Intels Itanium IA64 Architektur jedoch volle Kompatibilität zu allen verfügbaren Anwendungen bestehen. Somit ist man nicht von Anfang an gezwungen, ein 64 Bit Betriebssystem und entsprechende Anwendungen zu nutzen, doch wenn es nicht mehr ohne geht, kann dies ganz simpel auf einem System auf Basis der AMD64-Architektur installiert werden. Und selbst dann können weiterhin 32 Bit Anwendungen ausgeführt werden. Zu diesem Zweck stehen verschiedene Betriebsmodi zur Verfügung.

Die Kraft der AMD64 Architektur (Fortsetzung)

Grundsätzlich unterscheidet AMD zwischen zwei Betriebsmodi, dem „Long Mode“ und dem „Legacy Mode“, die beide wiederum in verschiedene Modi unterteilt sind.

Operating Mode
Operating
System Required
Application
Recompile
Required
DefaultsRegister
Extensions
Typical
Address
Size (bits)
Operand
Size (bits)
GPR
Width (bits)
Long Mode
64-Bit ModeNew 64-bit OS yes6432yes64
Compatibility ModeNew 64-bit OSno 3232 no 32
no16 16 no16
Legacy Mode Protected Mode
Legacy32-bit OSno3232no32
no1616no 32
Virtual-8086 Mode32-bit OSno1616no16
Real ModeLegacy 16-bit OSno1616no16

Der “Long Mode“ besteht aus zwei Modi, dem 64-Bit und dem Kompatibilitäts-Modus. Der 64-Bit Modus unterstützt dabei alle neuen Features und Registererweiterungen der AMD64 Architektur. Hierfür wird ein 64-Bit fähiges Betriebssystem vorausgesetzt und sämtliche Anwendungen müssen neu kompiliert werden, um in diesem Modus zu laufen.

Der Kompatibilitäts-Modus unterstützt unter einem 64-Bit Betriebssystem 32 und 16-Bit Anwendungen. Unter diesem Modus können bisherige 32-Bit Anwendungen ohne ein erneutes Kompilieren genutzt werden, auch wenn das Betriebssystem selbst unter 64-Bit arbeitet. Natürlich machen diese Anwendungen dann jedoch keinen Gebrauch von den neuen Registererweiterungen der AMD64 Architektur und benutzten lediglich 32 oder 16-Bit Adressierung. Der Kompatibilitäts-Modus wird ebenso wie der 64-Bit Modus über eine Code-Segment-Basis durch das Betriebssystem aktiviert. Für eine Anwendung sieht die Umgebung daher wie eine gewöhnliche 32-Bit Umgebung aus. Das Betriebssystem arbeitet aber dann mit den 64-Bit Mechanismen und muss daher eine Übersetzung der Adressierung vornehmen.

Der „Legacy Mode“, der den Betrieb von 16 und 32-Bit Anwendungen unter einem 16 und 32-Bit Betriebssystem sicherstellt, ist wiederum in drei Modi unterteilt, den „Protected Mode“, den „Virtual-8086 Mode“ und den „Real Mode“.

Der „Protected Mode“ unterstützt sowohl 16 als auch 32-Bit Anwendungen, die bis zu 4GB des Speichers belegen können. Hierfür wird ein 32-Bit Betriebssystem benötigt. Die Programme müssen für diesen Modus natürlich nicht neu kompiliert werden, dafür können sie aber auch nicht die neuen Erweiterungen nutzen.

Der „Virtual-8086 Mode“ unterstützt lediglich 16-Bit Programme, die lediglich 1MB des Speichers belegen können. Auch dieser Modus benötigt ein 32-Bit Betriebssystem. Der „Real Mode“ unterstützt ebenso wie der „Virtual-8086 Mode“ nur 16-Bit Anwendungen, dafür jedoch kein Paging und nur simple register-basierende Speicher-Segmentation. Die Programme können auf maximal 1MB Speicher zugreifen. Der „Real Mode“ benötigt ein 16-Bit Betriebssystem. Prozessoren, die die neue AMD64 Architektur implementiert haben, booten im „Legacy Real Mode“, ebenso wie alle anderen Prozessoren, die über die x86 Architektur verfügen.

Betriebssystem- und Anwendungs-Support

Natürlich nützt auch der beste 64-Bit Prozessor nichts, wenn er nicht auch durch Betriebssysteme optimal unterstützt wird. Einer der wohl bekanntesten Vertreter ist Windows XP 64-Bit Edition 2003, das AMD seinen Testsystemen in einer Alpha Version mit der Build 1033 beigelegt hat. Es gibt jedoch bereits eine frühe Beta mit der Buildnummer 1069. Diese bietet bereits einige Treiber etwa für VIAs K8T800, nVidias nForce 3 und GeForce FX Karten (Detonator 51.51). Denn hier liegt gleich die erste Hürde eines 64-Bit Betriebssystems. Treiber, die unter 32-Bit Systemen problemlos ihren Dienst verrichteten, sind für 64-Bit Betriebssysteme völlig ungeeignet. Deshalb müssen alle Treiber und der komplette Kernel-Code auf das 64-Bit Systeme portiert und neu kompiliert werden. Dies hört sich einfacher an, als es ist. Bisher stehen hierfür nämlich nur Compiler in Alpha Versionen bereit und auch mit dem einfachen Kompilieren ist der Umstieg längst nicht vollzogen. Der Code muss natürlich angepasst und auf den neuesten Stand gebracht werden. Zudem ist es nicht möglich 32 und 64-Bit Code in einem Programm zu vermischen. Die Programmierer müssen sich für einen der beiden Wege entscheiden und ihre Programme entweder für 32 oder 64-Bit auslegen.

Windows XP 64 Edition Beta About Windows XP 64 Edition Beta Detonator Treiber 51 Windows XP 64 Edition Beta VIA Treiber

Windows XP 64 Edition Beta 32bit und 64bit zweigeteilt Windows XP 64bit AMD64 not supported

Für Linux 64 gilt dabei im Grunde dasselbe wie für Windows XP 64-Bit Edition 2003. Auch hier müssen die Programme und Treiber angepasst und neu kompiliert werden. Hierfür stehen bisher einige Beta-Compiler zur Verfügung. SuSE ist dabei ein Vorreiter und hat in der Vergangenheit eng mit AMD zusammen gearbeitet. So konnten SuSE und AMD auch zusammen als erstes die SuSE Linux für AMD64 Beta 1.0 veröffentlichen. Red Hat plant ebenso eine AMD64 Version seiner Linux Distribution. Red Hat Advanced Server und Red Hat Workstation sollen dabei zuerst in den Genuss der 64-Bit Unterstützung kommen. Doch auch die Endverbraucher sollen später durch Red Hat mit der AMD64 Technologie vertraut gemacht werden. MandrakeSoft plant ebenso eine Unterstützung, ebenso wie FreeBSD, die bereits an einer Portierung arbeiten. NetBSD hat die Portierung bereits abgeschlossen.

Im Folgenden eine Auflistung der Betreibsysteme, die bereits eine Unterstützung bieten:

Betriebssysteme mit Athlon 64 (FX) Unterstützung
BetriebssystemTyp
SuSE Linux Enterprise Server (SLES) 832 & 64-Bit
SuSE Linux 8.2 Personal & Professional32-Bit
UnitedLinux Version 1.032 & 64-bit
Conectiva Linux Enterprise Edition32-bit
Linux AMD64 kernel patches64-bit
Mandrake Linux 9.064-bit
Mandrake Linux 9.132-bit
Mandrake Linux Corporate Server 2.132-bit
NetBSD32 & 64-bit
SCO Linux32-bit
Scyld Beowulf Cluster Operating System32-bit
Solaris 9 for x86 (32-bit)32-bit
Turbolinux 8 for AMD6432 & 64-bit
Windows 2000 Server (32 bit)32-bit
Windows Server 2003 (32-bit)32-bit

Des Weiteren folgt eine List der Betriebssysteme, die eine Unterstützung für die Zukunft planen:

Betriebssystem TypVerfügbarkeit
Red Hat Enterprise Linux AS 3.032- & 64-bitBeta Mitte 2003
SuSE Linux 8.3 Personal & Professional32- & 64-bitSeptember 2003
Windows XP Professional for AMD6464-bitBeta Mitte 2003
Windows Server 2003 for AMD6464-bitBeta Mitte 2003

Unter einem 64-Bit Betriebssystem können dann sowohl 32 als auch 64-Bit Anwendungen ausgeführt werden. Ein 32-Bit Betriebssystem ermöglicht es jedoch nicht, 64-Bit Anwendungen auszuführen. Um also einen optimalen Nutzen der neuen Technologie zu erhalten, muss man auf 64-Bit Betriebssysteme umsteigen. Um im 64-Bit Modus allerdings 32-Bit Anwendungen ausführen zu können, muss das Betriebssystem über einen so genannten „Thinking Layer“ verfügen, der alle 32-Bit Kernel Aufrufe enthält. 32-Bit Anwendungen werden automatisch an diesen Layer „weitergeleitet“. Dieser übersetzt die Parameter dann, soweit dies nötig ist, und ruft dann den 64-Bit Kernel auf. Des Weiteren werden die Ergebnisse dann wieder zurück übersetzt - falls notwendig.

Betriebssystem- und Anwendungs-Support (Fortsetzung)

Unter Windows XP 64-Bit wird der Modus, um 32-Bit Anwendungen auch auf einem 64-Bit Betriebssystem zu unterstützen, übrigens WoW64 genannt, was soviel heißt wie: „Windows on Windows 64“. Ob diese Technik tatsächlich ohne Leistungseinbußen von Statten geht, wie AMD in ihren Dokumenten immer wieder hervorhebt, werden unsere Benchmarks zeigen, in denen wir auch diesen Punkt behandeln werden. Software, die sich stark ins System einnistet, wie z.B. DirectX oder der Windows Media Player, müssen übrigens zwingend in einer 64-Bit-Variante vorliegen, um installiert werden zu können.

Microsoft hat sein Windows XP 64-Bit Edition 2003 momentan etwas zweigeteilt. So findet sich ein „Program Files“ Ordner speziell für 32 und ein „Program Files“ Ordner speziell für 64-Bit Anwendungen wieder. Auch der Internet Explorer ist bereits in einer 64-Bit Version integriert, aber auch die 32-Bit Version ist noch mit von der Partie.

Da einer Anwendung nicht mehr nur 4GB sondern bis zu 12GB Speicher zugewiesen werden können, hofft AMD auch bei Spielern und den Spieleherstellern, die AMD64 Technologie durchsetzen zu können. Die Unterstützung von Valve hat AMD dabei schon sicher, die aktuell daran arbeiten, die Serverversionen ihrer Spieletitel auf 64-Bit Code zu portieren.

Software Entwickler haben uns jedoch zugetragen, dass sie damit rechnen, dass es Monate dauern wird, bis Programme an den neuen AMD64 Code angepasst sind und Marktreife erreichen. Zur besseren Anpassung der Programme hat AMD so genannte „Key Optimizations“ vorgegeben, die den Rang der Wichtigkeit der Optimierung verdeutlichen sollen. An oberster Stelle steht hierbei „Memory-size Mismacht“, aber auch die SSE und SSE2 Instruktionen werden als sehr wichtig eingestuft. Das liegt vor allem daran, dass unter Windows XP 64-Bit keine FPU/MMX Einheit zur Verfügung steht und entsprechende Befehle über SSE/SSE2 (das macht letztendlich auch die FPU) ausgeführt werden müssen. Hierbei handelt es sich aber weniger um ein Problem vom Athlon 64 sondern vielmehr um eine Eigenart von Windows XP 64-Bit Edition

Für all diejenigen, die vielleicht geneigt sind, selbst etwas mit einigen Compilern herumzuspielen, haben wir die bisher zur Verfügung stehenden Compiler zusammengetragen:

CompilerTyp
GNU 3.2 C & C++ (g++) &
Fortran77 (g77) &
Java (gcj)
GNU glibc 2.2.5
32-bit Linux
64-bit Linux
GNU 3.3 C & C++ (g++)
GNU glibc 2.3.1
64-bit Linux
PGI Workstation 5.032-bit Linux
64-bit Linux
32-bit Windows
PGI CDK 5.032-bit Linux
64-bit Linux
Microsoft Visual Studio.NET32-bit Windows
64-bit Windows (alpha)
Absoft FORTRAN6432-bit Linux
64-bit[Linux
32-bit Windows
NAGWare f95 32-bit32-Bit Linux
64-bit Linux

Für Windows existiert also derzeit nur ein Plattform-SDK, welches einen 64-Bit Compiler in einer Alpha-Version und darüber hinaus Visual Studio.Net voraussetzt und auf insgesamt 7 CDs ausgeliefert wird. Gerade Visual Studio.Net konnte sich jedoch aufgrund seiner Komplexität bisher kaum unter den Entwicklern durchsetzen. Noch in diesem Monat wird übrigens die Beta des Plattform-SDK mit einem 64-Bit Beta-Compiler erwartet. Der derzeit schnellste Compiler für die Windows Plattform, Intels C++ und Fortran Compiler, können dagegen noch keinen 64 Bit Code liefern.

Was bringt uns nun 64-Bit überhaupt? AMD selbst gibt auf diese Frage die passende Antwort:

Zitat:

Die Notwendigkeit einer 64 Bit Architektur ist hauptsächlich bestimmt durch Anwendungen die große Datenmengen verwalten und viel Speicher adressieren müssen. Solche Anwendungen sind beispielsweise High-Performance Server, Datenbanksysteme, CAD und Digital Content Creation Tools.

64Bit Benchmarks

Natürlich wollten auch wir wissen, welche Leistung der Athlon 64 auf einem 64 Bit Betriebssystem mit 64 Bit Anwendungen erbringen kann. Aus diesem Grund haben wir ein System mit Windows XP 64-Bit Edition 1033 (Alpha) mit einem Athlon 64 3200+ aufgesetzt. Für den Test stand uns eine spezielle Version von SiSoft Sandra und Lame zur Verfügung, welche mit dem Microsoft Plattfrom SDK 1039 Alpha Compiler für AMD64 kompiliert wurde.

32 Bit vs 64 Bit - Sandra 200X Arithmetic

 Dhrystone ALU:
Windows XP 64 Bit, 64-Bit App.
9.222
Windows XP 32-Bit
8.296
Windows XP 64 Bit, 32-Bit App.
8.232
Angaben in Punkten

Die uns vorliegende Entwicklungsversion von Sandra [18], welche speziell für AMD64 programmiert wurde, liefert klare Resultate - Den klaren Sieg für Windows XP 64 mit 64 Bit Anwendung.

32 Bit vs 64 Bit - Lame

Windows XP 32-Bit
01:48
Windows XP 64 Bit, 32-Bit App.
01:48
Windows XP 64 Bit, 64-Bit App.
02:07
Angaben in Minuten, Sekunden

Der MP3-Encoder Lame, welcher aus dem unoptimieren Quellcode heraus kompiliert wurde, bricht dagegen deutlich ein. Das Problem: Lame setzt voll auf die FPU/MMX-Anweisungen, welche unter Windows XP 64 nicht zur Verfügung steht und über SSE und SSE2 emuliert werden müssen.

32 Bit vs 64 Bit - Comanche 4

Windows XP 32-Bit
66
Windows XP 64 Bit, 32-Bit App.
55
Windows XP 64 Bit, 64-Bit App.
0
Hinweis: Keine 64 Bit Version
Angaben in Bildern pro Sekunde (FPS)

Auch in Spielen, wo in der Regel kein Quellcode zur Verfügung steht und somit nachträglich keine 64-Bit Version kompiliert werden kann, sieht es nicht viel besser aus. Nicht zuletzt aufgrund recht früher Treiber (Detonator 50.40) ist das Ergebnis eher entäuschend.

Kühllösungen und Referenzdesign

Nachdem Intel bereits seit Ende November 2000 ihre Prozessoren mit einem IHS (Integrated Heat Spreader) ausrüstet, hat sich AMD beim Athlon 64 und Athlon 64 FX dazu durchgerungen, seine Prozessoren mit einem entsprechendem Hitzeverteiler auszustatten, welcher zudem den Prozessorkern vor Beschädigungen schützt. Damit schlägt AMD gleich zwei Fliegen auf einen Streich. Doch das ist noch nicht alles. Dadurch, dass das Kühlergewicht nun gleichmäßig über eine große Fläche verteilt wird, ist auch der für Kühler zulässige Anpressdruck erheblich gestiegen. Maximal sind nun 90lb (gut 40kg) möglich, beim Athlon XP sind es gerade einmal 30lb (13,6kg) wobei die Ecken sogar nur 10lb (4,5kg) vertragen. Da konnte eine Erschütterung mit montiertem Kühler schon das Aus für den Kern bedeuten. Der Intel Pentium 4 verträgt übrigens dauerhaft einen Anpressdruck von bis zu 100lb (45kg). Die Masse des Kühlers darf bis zu 450g betragen.

Doch es ist nicht nur der IHS, durch den Freude aufkommt. Insgesamt ist die zulässige Kühlerfläche auf 77x68 mm angestiegen, wobei im Zentrum mindestens eine 40x40 mm ebene Fläche vorhanden sein muss. Durch die größere Kühlerfläche kann auch die anfallende Wärme besser verteilt werden. Die Montage des Kühlers wurde dabei deutlich vereinfacht - ein Schraubenzieher ist nur noch zur Demontage nötig.

Im Rahmen des AMD Athlon 64 Processor Thermal Design Guide (26633) sind sowohl Kupfer- als auch Aluminiumkühler erlaubt, wobei Kupfer natürlich bessere thermische Eigenschaften besitzt. Die zwei von AMD vorgestellten Kühlerreferenzdesigns sehen hierbei günstige Aluminiumkühlkörper vor, die sich im Test als völlig ausreichend erwiesen.

AMD Athlon 64 Referenzkühlerdesign 1 AMD Athlon 64 Referenzkühlerdesign 1 AMD Athlon 64 Referenzkühlerdesign 1

AMD Athlon 64 Referenzkühlerdesign 2 AMD Athlon 64 Referenzkühlerdesign 2_2 AMD Athlon 64 Referenzkühlerdesign 2_3

Bei beiden Referenzdesigns sorgt eine auf der Rückseite des Mainboards verschraubte Metallplatte für den nötigen Gegenhalt. Und obwohl der Thermal Design Guide auf Seite 10 von einer zusätzlichen Befestigung mit dem Gehäuse spricht, „[…] the heat sink requires attachment to the motherboard and chassis.“ wollte und konnte keiner der uns vorliegenden Kühler mit dem Gehäuse verschraubt werden. Von AMD empfohlene Kühler stehen dabei von Ajigo [19], AVC [20], CoolerMaster [21], Foxconn [22] und ThermalTake [23] zur Verfügung. Dabei freut es zu hören, dass AMD einen maximalen Schalldruckpegel von 38 dbA verlangt.

Athlon XP Kühler, Zwei Athlon 64 (FX) Kühler Athlon XP Kühler, Zwei Athlon 64 (FX) Kühler Athlon XP Kühler, Zwei Athlon 64 (FX) Kühler

Thermische Verlustleistung, Heizkraftwerk?

Beim Kühlerdesign hat AMD einen großen Schritt nach vorne gemacht, doch wie sieht es mit der thermischen Verlustleistung des Prozessors aus? Gleichen der Athlon 64 und Athlon 64 FX eher einem Heizkraftwerk oder fallen sie nicht einmal im Kühlschrank durch infrarote Wärmestrahlung auf?

Bevor wir die Antwort auf diese Frage geben, möchten wir an dieser Stelle einen Vergleich zum Athlon XP 3200+ ziehen. Dieser besitzt eine maximale thermische Verlustleistung von 76,8 Watt und liegt damit recht deutlich unter dem Pentium 3,2 GHz, welcher typischerweise nicht mehr als 82 Watt benötigt, unter extremen Bedingungen aber auch gerne mal 100 Watt verschlingt. Die Zahlen sprechen hierbei klar für den Athlon XP, doch in der Realität sieht die Sache etwas anders aus: Vom Start weg strahlt der Athlon cirka 50°C ab, beim Pentium 4 sind es 5°C weniger. Eigentlich schon verblüffend und dabei schießen erst die Athlon 64 und Athlon 64 FX Prozessoren den Vogel ab.

Auf Anfrage (in den uns vorliegenden technischen Dokumenten wird kein Wort über die thermische Verlustleistung verloren, bzw. zu einem Dokument verwiesen, auf das wir kein Zugriff haben) teilte uns AMD mit, dass die maximale thermische Leistung von Athlon 64 3200+ und Athlon 64 FX-51 (trotz 200 MHz Taktunterschied) identisch ist. Der Schock: beide Prozessoren sollen Maximal 89 Watt verbraten - über 12 Watt mehr als der Athlon XP, welchen man schon zum Heizen kleinerer Räumlichkeiten nutzen kann.

Während unseres mehrtägigen Testbetriebs konnten wie diese Angabe jedoch nicht ganz verstehen. Mit nie über 60°C wurde die CPU nie wirklich heiß und der Kühlkörper nur leicht erhitzt und das mit einem stark gedrosseltem Lüfter, welcher von der Grafikkarte im Schalldruckpegel ganz locker überboten wird. Klasse gemacht, AMD! Da darüber hinaus der Speichercontroller in den Prozessor gewandert ist, werden auch die externen Chips für die Anbindung von Peripheriegeräten deutlich entlastet, und können damit ohne Probleme passiv gekühlt werden.

Geräuschkulisse und “Cool’n’ Quiet”

In Anbetracht des gebotenen Schalldruckpegels kann man sich beim Athlon 64 (FX) also nur freuen. Der Prozessor bleibt kühl, und die Lüfter drehen entsprechend langsam. Doch das ist noch lange nicht alles. So unterstützt der Athlon 64 (aber nicht der Athlon 64 FX) die Cool“n Quiet Technologie. Hierbei wird der Prozessor - ähnlich zu dem von Notebooks bekannten PowerNow! (AMD) oder Speedstep (Intel) - je nach Belastung mit einem geringeren Prozessortakt und einer kleineren Spannung betrieben. Diese Technologie wird im "BIOS and Kernel Developer's Guide for AMD Athlon 64 and AMD Opteron Processors (26094)" auf Seite 219 im Rahmen der Processor Performance States (P-states), welche gleichermaßen für PowerNow! und Cool“n“Quiet stehen, eingehend erläutert.

Für das Verständnis ist dabei wichtig, dass das Heruntertakten des Prozessors durch das Verändern des Multiplikators und nicht des 200 MHz Referenztaktes erfolgt. Der Arbeitsspeicher und HyperTransport können also weiterhin mit voller Kraft zur Verfügung stehen. Anders ist dies natürlich beim Throttling, welches als Überhitzungsschutz dient, bei dem Prozessortakte ausgesetzt werden.

Die Cool“n“ Quiet Technologie soll im nächsten Jahr dann auch vom Athlon 64 FX unterstützt werden. Ob Athlon 64 oder Athlon 64 FX, in beiden Fällen muss diese Technologie auch vom Mainboard unterstützt werden. Dies ist derzeit allerdings noch nicht immer der Fall. Zum jetzigen Zeitpunkt wird das Feature von AMD gerne gesehen, ab 2004 wird es für alle Mainboards, die von AMD empfohlen werden sollen, Pflicht sein. Bei dem uns vorliegenden Athlon 64 3200+ Mainboard konnten wir beispielsweise noch keine Cool“n“ Quiet Option im BIOS ausfindig machen.

Speichercontroller und Support

Ein besonderes Feature der gesamten AMD64 Architekturfamilie ist der in den Prozessor integrierte Speichercontroller. Dieser ermöglicht eine direkte Anbindung des Arbeitsspeichers an den Prozessor und minimiert somit die Latenzzeiten beim Zugriff auf den Arbeitsspeicher erheblich. Die Folge ist je nach Anwendung eine deutliche Leistungssteigerung, da das Nachladen von Informationen bedeutend weniger Zeit in Anspruch nimmt. Dies verdeutlichen auch unsere Speicherbenchmarks, welche wir euch nicht vorenthalten wollen:

Science Mark - Latenzen

 64 byte stride:
Intel Pentium 4 3,20 GHz (Dual DDR400)
20,27
AMD Athlon 64 FX-51 (Dual DDR400)
22,68
AMD Athlon 64 3200+ (Single DDR400)
24,25
AMD Athlon XP 3200+ (Dual DDR400)
54,42
 256 byte stride:
AMD Athlon 64 3200+ (Single DDR400)
45,03
AMD Athlon 64 FX-51 (Dual DDR400)
52,61
Intel Pentium 4 3,20 GHz (Dual DDR400)
85,74
AMD Athlon XP 3200+ (Dual DDR400)
86,62
 512 byte stride:
AMD Athlon 64 3200+ (Single DDR400)
46,03
AMD Athlon 64 FX-51 (Dual DDR400)
55,33
AMD Athlon XP 3200+ (Dual DDR400)
82,64
Intel Pentium 4 3,20 GHz (Dual DDR400)
101,02
Angaben in Nanosekunden

Science Mark - Bandbreite

AMD Athlon 64 FX-51 (Dual DDR400)
5.523,91
Intel Pentium 4 3,20 GHz (Dual DDR400)
3.851,41
AMD Athlon 64 3200+ (Single DDR400)
2.948,51
AMD Athlon XP 3200+ (Dual DDR400)
2.889,46
Angaben in Megabyte pro Sekunde (MB/s)

Besonders bei größeren Datenpaketen muss der Pentium 4 oder auch der Athlon XP deutlich mehr Warteschleifen durchlaufen als dies beim Athlon 64 FX der Fall ist. Der Athlon 64 kann die Ergebnisse dank reaktionsfreudigerem Single Channel-Interface dabei nochmals toppen. Doch zurück zur Theorie.

Externe Speichercontroller

Obwohl die heute vorgestellten Prozessoren über einen integrierten Speichercontoller verfügen, kann es unter bestimmten Umständen von Vorteil sein, den integrierten Controller durch eine externe Lösung zu ersetzen. Dies ist zum Beispiel dann der Fall, wenn man auf Speicher setzt, den der integrierte Memory-Controller nicht unterstützt. Beispielsweise die im nächsten Jahr erscheinenden DDR2-Module. Wer sich keinen neuen Prozessor kaufen möchte (der diesen Speicher dann unterstützen wird), der könnte durch ein neues Mainboard eine Übergangslösung schaffen. Allerdings ist ein externer Speichercontroller aufgrund der Latenzzeiten immer langsamer als die integrierte Lösung, so dass es im Allgemeinen nicht sinnvoll ist, den integrierten Memorycontroller des Athlon 64 oder Athlon 64 FX zu deaktivieren. Möglich ist es jedoch.

Realer Arbeitsspeichertakt

Da der integrierte Speichercontroller mit dem Prozessor gekoppelt ist, ist auch der Takt, mit dem der Speicher angesprochen wird, in gewisser Weise vom Prozessortakt abhängig. Aufgrund der zur Verfügung stehenden, ganzen Teiler wird DDR333 Speicher bei einem mit 2,2 GHz getakteten Athlon 64 FX beispielsweise nur mit einem realen Takt von 157,14 MHz (2,2 GHz geteilt durch 14) betrieben, wie folgende Übersicht zeigt.

MultiplikatorProzessortakt
Speichertakt
100 MHz133 MHz166 MHz200 MHz
4800 MHz100.00 133.33160.00160.00
51000 MHz100.00125.00166.66200.00
61200 MHz100.00133.33150.00200.00
71400 MHz100.00127.27155.55200.00
81600 MHz100.00133.33160.00200.00
91800 MHz100.00128.57163.63200.00
102000 MHz100.00133.33166.66200.00
112200 MHz100.00129.41157.14200.00
122400 MHz100.00133.33160.00 200.00
132600 MHz100.00130.00162.50200.00

Rein theoretisch wären hierbei natürlich auch höhere Taktraten möglich. Übrigens gibt es auch bei den Speichertimings Vorgaben, was der integrierte Speichercontoller kann und was nicht. Die üblichen Timings werden jedoch unterstützt, so dass wir an dieser Stelle nicht näher darauf eingehen wollen.

2000 MHz Speichertakt

Wie ganz klar aus dem “BIOS and Kernel Developer's Guide for AMD Athlon 64 and AMD Opteron Processors (26094)“ hervorgeht, ist es möglich, dem Prozessor über das MemClk-Register einen höheren Speichertakt, als vom Prozessor erlaubt, zuzuweisen. Bestätigt wird dieser Sachverhalt durch den Northbridge Capabilities Register DramFreq, welchem mit dem Datenbit 00b der Wert „No limit“ zugewiesen werden kann. Dennoch stehen die Chancen eher schlecht, dass in absehbarer Zeit DDR4000 Module erscheinen. Aber immerhin sind ja bereits DDR500 Module von diversen Speicherherstellern (Corsair, OCZ, Kingston) lieferbar.

Unbuffered oder Buffered (Registered) Module

Obwohl wir in den folgenden zwei Abschnitten detailliert auf den Speichersupport des Athlon 64 FX und des Athlon 64 eingehen, soll an dieser Stelle auf die Theorie verwiesen werden, welche im Vergleich zur Praxis doch leicht abweicht. So gibt es laut “BIOS and Kernel Developer's Guide for AMD Athlon 64 and AMD Opteron Processors (26094)“ in den DRAM Configuration Registers das UnBuffDimm-Bit, welches den Speichercontroller über den installierten Speichertyp in Kenntnis setzt. Je nachdem, ob Registered (Buffered) oder Unbuffered Speicher im System installiert ist, passt sich der Speichercontroller an die Umgebung an. An dieser Stelle stellt sich nur die Frage, warum der Athlon 64 FX in unserem Verständnis der vorliegenden Technischen Dokumente nur mit Registered Speicher betrieben werden kann. Liegt es am Mainboard-Layout oder dem komplizierten Dual Channel Speicherinterface, dass derzeit einfach noch nicht ohne externe Hilfe durch den Speicher selbst zurecht kommt?

ECC und ChipKill ECC

Durch einen vom Speichercontroller unterstützten Error Correction Code (ECC) lassen sich 1-Bit-Fehler beim Lesen und Schreiben aus und in den Arbeitsspeicher erkennen und korrigieren, und 2-Bit-Fehler zumindest noch erkennen. Dies wird durch das zusätzliche Speichern von 8 Bit pro 64 Bit Daten ermöglicht. Im Dual Channel Mode steht beim Athlon 64 FX darüber hinaus der ChipKill ECC Mode zur Verfügung. In diesem Fall basiert der ECC-Check nicht auf 64/8 Bit Daten, sondern auf 128/16 Bit Informationen, wodurch ein Single Symbol Error (Reihe von Single Bits) erkannt und korrigiert werden kann. Dies kommt klar der Datenintegrität zu Gute. Leider gab es während unseres Tests erhebliche Stabilitätsprobleme mit beiden ECC-Modes, welche mehrmals zu einem Systemversagen führten und ECC somit als nicht lauffähig zu bezeichnen ist.

Athlon 64 FX mit Registered Modulen

Der integrierte Speichercontroller des Athlon 64 FX bietet ein sogenanntes Dual Channel Speicherinterface, bei dem parallel auf zwei Speichermodule geschrieben bzw. gelesen werden kann. Dies hat eine Verdoppelung der theoretischen Speicherbandbreite zur Folge. Beim Einsatz von DDR400 Modulen beträgt diese ganze 6,4 GB/s (2x3,2 GB/s), von denen Messungen zufolge tatsächlich beachtliche 5,7 GB/s zur Verfügung stehen. Im Vergleich dazu erreicht ein Athlon XP 3200+ mit DDR400 Modulen und einem Dual Channel fähigen nForce 2 400 Ultra Chipsatz kaum mehr als 3,1 GB/s. Auch die aktuellen Pentium 4 Prozessoren haben da selbst mit einem i875P Chipsatz das Nachsehen. Mehr als 5,1 GB/s sind da kaum möglich. Der Speichercontroller des Athlon 64 FX weiß also nicht nur in der Theorie sondern auch in der Praxis zu überzeugen.

Verglichen mit dem Athlon XP oder dem Pentium 4 Prozessor, welcher auf externe, in der Northbridge des Mainboards integrierten Speichercontroller setzen, hat die derzeitige Lösung beim Athlon 64 FX im Sockel 940 jedoch einen erheblich Nachteil: Da der Sockel 940 ursprünglich einzig und allein für die Opteron Workstation- und Serverprozessoren entworfen wurde, sehen entsprechende Mainboards auch besonderen Arbeitsspeicher vor, welcher ein höheres Maß an Datenintegrität bietet. Die Rede ist hierbei von so genannten Registered (oder auch Buffered) DDR SDRAM Modulen, welche darüber hinaus über einen Error Correction Code (ECC) verfügen können. Verglichen mit den in Desktop-Computern üblichen Unregistered (Unbuffered) DDR SDRAM Modulen verfügen die für Workstations und Server konzipierten Speichermodule über eine gewisse Intelligenz, ein Register, welches den Speichercontroller bei der Adressverwaltung entlastet.

Damit unterscheiden sich Registered DDR SDRAM Module im Detail doch erheblich von ihren Artgenossen, und fallen aufgrund ihres Einsatzbereiches natürlich auch durch ihren höheren Preis auf.

AMD hat jedoch noch ein weiteres Problem außer dem Preis: Das Joint Electron Device Engineering Council (JEDEC) hat bisher noch keinen Standard für mit 200 MHz getaktete Registered DDR SDRAM Module veröffentlicht, welche der Athlon 64 FX ansteuern kann und mit denen erst das ganze Potential der CPU entfesselt werden kann.

Aus Stabilitätsgründen, begründet durch zunehmendes Signalrauschen, sollte es ursprünglich überhaupt keinen DDR400 Standard geben, welcher jedoch dank Intels Engagement zumindest für normale Unbuffered Module verabschiedet wurde. Bei Registered Modulen sieht es derzeit noch anders aus. So wirft der DDR2 Standard bereits seine Schatten voraus. Erste Chipsätze, die diesen neuen Speicherstandard unterstützen, sollen hier von Intel im zweiten Quartal 2004 verfügbar sein und auch die Speicherproduktion der Speicherhersteller soll bis dahin erste Früchte getragen haben. DDR2 - von Anfang an als Nachfolger von DDR im Mobile, Desktop und Server-Segment konzipiert - ist dabei schon dermaßen greifbar, dass es sehr unwahrscheinlich erscheint, dass es eine Neuauflage des bestehenden Standards für Registered DDR SDRAM Module geben wird.

Athlon 64 FX mit Registered Modulen (Fortsetzung)

Dennoch haben sich einige Speicherhersteller dazu entschlossen, entsprechende Registered DDR400 Module in ihr Produktportfolio aufzunehmen. Allerdings ist das Angebot zum jetzigen Zeitpunkt noch mehr als dürftig. Bei Samsung befinden sich entsprechende Module in der „Sampling-Phase“, sollen jedoch noch Ende September 2003 in die Massenproduktion entlassen werden. Infineon dagegen hält sich voll an die Standards und hat derzeit keine DDR400 Speichermodule für den Athlon 64 FX in Planung. Kingston dagegen wird am heutigen Tag unter dem HyperX-Label entsprechenden Arbeitsspeicher präsentieren - die deutsche Pressestelle wusste von dieser Planung jedoch offensichtlich nichts. Bei Twinmos ist man ebenfalls mit der Entwicklung beschäftigt, kann aber noch keine Module liefern. Anfangs sollen darüber hinaus wenn überhaupt nur 512MB Module zur Verfügung stehen, derer man für den Dual Channel Betrieb natürlich zwei benötigt.

Registered Module Corsair und TakeMS Einzig und allein Corsair ist es gelungen, uns rechtzeitig vor dem Start des Athlon 64 FX mit Registered DDR400 Modulen zu versorgen, welche mit den Timings 2.0-3-2-6 vollkommen problemlos betrieben werden können. Schneller geht es kaum noch und dennoch traten bei uns keinerlei Stabilitätsprobleme im normalen Betrieb auf. Dass es nicht immer Registered DDR400 Module sein müssen, um den Athlon 64 FX zum schnellen Arbeiten zu überreden, beweisen die uns vorliegenden Registered DDR333 Module von takeMS, welche im Probelauf durch einen Trick sogar mit realen 200 MHz und den Timings 2.5-4-4-8 betrieben werden konnten.

Athlon 64 mit Standard-RAM

Deutlich besser sieht es beim Speichersupport des Athlon 64 aus. Dieser begnügt sich mit handelsüblichem DDR SDRAM, kann auf Wunsch jedoch auch mit ECC Speicher bestückt werden. Derzeit werden Module mit einem Takt von bis zu 200 MHz unterstützt, wobei im Vergleich zum Athlon 64 FX jedoch nur ein einfaches Single Channel Speicherinterface zur Verfügung steht, welches ein einfacheres Leitungsrouting ermöglicht und auch den Speichercontroller weitaus weniger fordert. Mit DDR400 Modulen liegt die theoretische Speicherbandbreite bei 3,2 GB/s, welche in der Praxis mit 3,0 GB/s annähernd erreicht wird. Durch die einfachere Datensynchronisation, verglichen mit einem Dual Channel Interface, kann der Athlon 64 dem Athlon 64 FX in den Latenzzeiten sogar deutlich davonziehen. Wo der Athlon 64 FX noch 146 Taktzyklen benötigt, ist der Athlon 64 bereits nach beeindruckenden 92 Takten am Ziel angekommen.

Normale DDR400 Module von Twinmos, Corsair und TakeMS

Die uns für diesen Test zur Verfügung gestellten Corsair TWINX1024-3200LL und die Twinmos 512 MB Twister 3200 CL2 machten hierbei selbst bei schnellen Timings keinerlei Probleme mit dem Athlon 64 und eignen sich entsprechend gut für diesen Prozessor.

HyperTransport

HyperTransport Logo Für die Kommunikation mit der Außenwelt sorgt beim Athlon 64, Athlon 64 FX oder Opteron der neuartige HyperTransport I/O-Bus, den nVidia beispielsweise bei seinen nForce 2 Chipsätzen zur Kommunikation zwischen North- und Southbridge nutzt.

Spezifikation

Bei HyperTransport handelt es sich um einen seriellen Bus, der keinerlei Ambitionen hat, dem AGP, PCI, PCI-X oder PCI Express Standard gefährlich zu werden. Vielmehr möchte der HyperTransport-Bus über eine Punkt-zu-Punkt-Verbindung I/O-Chips, welche z.B. AGP, PCI oder PCI-Express zur Verfügung stellen, möglicht schnell an den Prozessor anbinden. Entsprechend hoch ist auch die theoretisch mögliche Bandbreite, doch dazu später mehr. Hierbei kann HyperTransport von jedem angeschlossenen I/O-Chip mit HyperTransport-Anbindung weitergeleitet, „getunnelt“, werden. Rein theoretisch können auf diese Art und Weise bis zu 31 Tunnel-Geräte angeschlossen werden, welche allesamt direkt mit dem Prozessor oder dem durch ihn verwalteten Arbeitsspeicher kommunizieren können.

Im Gegensatz zu einem parallelen Bus wie dem PCI oder dem allseits bekannten LPT1 Druckerport, erreicht HyperTransport seine Geschwindigkeit nicht durch möglichst viele parallele Datenleitungen, sondern durch einen besonders hohen Takt. Während beim PCI Standard beispielsweise ein 32bit breiter Bus mit 33 MHz betrieben wird, und so eine theoretische Bandbreite von 133 MB/s erreicht, kann bei HyperTransport eine Datenleitung (bestehend aus vier einzelnen Leitungen) alleine in der vollen Ausbaustufe eine Übertragungsrate von 200 MB/s in beide Richtungen erreichen.

Der aktuelle HyperTransport-Standard sieht hierbei 2, 4, 8, 16 und 32 Bit breite Verbindungen mit einem Takt von 200, 400, 600 oder gar 800 MHz vor. Pro Takt können hierbei zwei Informationen (Double Data Rate) übertragen werden. Dabei muss übrigens ein mit einem 16 Bit breiten Interface angeschlossenes Gerät HyperTransport nicht mit der gleichen Busbreite weiter reichen. So gibt z.B. der von AMD entwickelte AGP3.0 Graphics Tunnel Chip (AMD-8151) von den eingehenden 16 Bit nur 8 Bit weiter, an die dann ein weiteres HyperTransport Gerät angeschlossen werden kann.

Ebenso müssen auch die Up- und Downstream-Verbindung nicht die selbe Bitbreite besitzen. Wenn man z.B. von vornherein weiß, dass ein Chip in erster Linie Daten anfordert und eher wenig sendet, können beim Upstream (Rückkanal) Datenleitungen eingespart werden.

Pinanzahl verschiedener HyperTransport-Varianten
Bus Width (Each Way)2481632
Data Pins (total)8163264128
Clock Pins (total)444816
Control Pins (total)44444
Subtotal (High Speed)16244076148
VLDT223610
GND46101937
PWROK11111
RESET_L11111
Gesamt-Pinanzahl243455103197
Max Bandbreite (GB/s)0,81,63,26,412,8

Die theoretische Bandbreite einer 32 Bit HyperTransport Anbindung mit 800 MHz Takt liegt hierbei bei 800 MHz x 2 (Double Data Rate) x 32 Bit (Busbreite) / 8 (Umrechnung Bit auf Bytes) = 6,4 GB/s. Da HyperTransport einen unabhängig voneinander arbeitenden Up- und Downstream besitzt, und das gleichzeitige Senden und Empfangen von Daten möglich ist, ergibt sich eine Gesamtbandbreite von 12,8 GB/s.

Umsetzung beim Athlon 64 (FX)

Alle AMD Opteron-Prozessoren besitzen drei 16 Bit HyperTransport-Anbindungen, der Athlon 64 muss sich dagegen ebenso wie der Athlon 64 FX mit nur einem 16 Bit breiten HyperTransport-Kanal, welcher mit 800 MHz betrieben werden kann, begnügen. Dadurch ergibt sich beim gleichzeitigen Senden und Empfangen von Daten eine maximal 6,4 GB/s schnelle Verbindung mit der Außenwelt, an die entsprechende Tunnel-Chips, über die AGP oder PCI realisiert wird, angeschlossen werden können.

HyperTransport-Implementierung im Vergleich
Athlon 64Athlon 64 FXOpteron 1XXOpteron 2XXOpteron 8XX
HyperTransport Technologie
JaJaJaJaJa
HyperTransport Links (total/kohärent*)
1/01/03/03/13/3
HyperTransport Linkbreite (Up-/Downstream)
16bits/16bits16bits/16bits16bits/16bits16bits/16bits16bits/16bits
HyperTransport Bus Frequenz
800MHz800MHz800MHz800MHz800MHz

* Für Multi-Prozessor-Betrieb notwenig

Laut Seite 48 des BIOS and Kernel Developer's Guide for AMD Athlon 64 and AMD Opteron Processors (26094) hat man übrigens schon vorgesorgt und hat bereits entsprechende Bits für einen 1000 MHz schnellen HyperTransport-Bus definiert.

Überhitzungsschutz und Temperatursonde

Der Athlon 64 besitzt eine Thermal Diode direkt auf dem Die, von der sowohl die Anode als auch Kathode über Pins nach außen geführt werden. Über diese Diode können Programme dann die Temperatur des Prozessors auslesen. Diese Diode hat eine Genauigkeit von ±10°C und muss für jeden Prozessor einzeln justiert werden. Über das Intervall, in dem Temperaturmessungen vorgenommen werden, schweigen sich die bislang erhältlichen Dokumente von AMD leider aus.

Zudem verfügt der Prozessor über eine hardwareseitige Notabschaltung, die über das THERMTRIP#-Signal ausgelöst wird. Sobald der Prozessor eine bestimmte Temperatur erreicht, schützt sich der Prozessor selbst vor einer Beschädigung durch zu hohe Temperaturen und schaltet ab. Doch auch das „Throttling“ beherrscht der Athlon 64 und kann so CPU-Takte auslassen, was zwar dazu führt, dass die Leistung einbricht, den Prozessor jedoch herunterkühlt. Dies kann sowohl mittels Software als auch direkt von der CPU bei zu hohen Temperaturen durch das THERM#-Signal ausgelöst werden. Schaltet das System in den S1, S3 oder S5 Modus um, setzt das „Throttling“ aus. Sobald der S1, S3 oder S5 Modus jedoch wieder verlassen wird, setzt auch das „Throttling“ wieder ein. Leider konnten wir bisher auch keine offiziellen Angaben ausfindig machen, die Aufschluss darüber geben, ab welcher Temperatur das Throttling genau einsetzt, und wann es zu einer Notabschaltung kommt.

Unter dem Parameter „CPULowPwrEn“ (CPU Low Power Enable) verbirgt sich die Funktion, mit welcher der CPU-Takt heruntergesetzt werden kann. Bit 0 deaktiviert den CPU Low Power Status, 1 aktiviert ihn. Das Heruntertakten geschieht dann gegebenenfalls über einen Teiler, der im Clock Divisor Select (ClkSel) Parameter festgesetzt wird. Über diesen wird sowohl der Teiler für das Heruntertakten der Northbridge als auch der CPU festgelegt. Mögliche Teiler sind 8, 16, 32, 64, 128, 256 und 512. Soll die Northbridge heruntergetaktet werden, so muss dies über den Northbridge Low Power Enable (NBLowPwrEn) Parameter geschehen. Wird dieser Modus aktiviert, wird der DRAM gleichzeitig in den „self-refresh“ Modus versetzt. Um die Northbridge über den ClkSel Parameter herunterzutakten, muss auch die CPU im gleichen Verhältnis im Takt gesenkt werden.

Im „Thermtrip Status Register“ wird zudem beispielsweise der „Diode Offset“ festgehalten, der festlegt, inwiefern die ausgelesenen Temperaturen einer zusätzlichen externen Diode korrigiert werden sollen. So kann die Temperatur für jeden Prozessor einzeln justiert und etwa um einige Grad angepasst werden, so dass sie dann die tatsächliche Temperatur des DIEs wiederspiegelt.

Übertakten

War der Athlon XP nicht ein Segen für die Overclocking-Gemeinde? Die ersten Versionen konnten durch das Verbinden der L1-Bücken zur freien Multiplikatoranwahl gebracht werden, bei den neuen in 0,13µm gefertigten Athlon XP Prozessor-Kernen war eine freie Wahl des Taktmultiplikators sogar ab Werk möglich - einfacher geht es schon gar nicht mehr.

Beim Athlon 64 und dem Athlon 64 FX sieht das Ganze etwas anders aus. Wie aus den “Clock Generator Specification for AMD Athlon 64 and AMD Opteron Processors (24707)“ deutlich hervorgeht, sollten die Athlon 64, Athlon 64 FX und Opteron Prozessoren mit einem Referenztakt von 200 MHz versorgt werden. Dieser wird intern Multipliziert und ergibt den Arbeitstakt des Prozessors. Verändert man diesen Referenztakt, so verändert sich natürlich auch der Prozessortakt und damit verbunden auch der Takt der HyperTransport-Verbindung ebenso wie der des Arbeitsspeichers - diese werden damit ebenfalls außerhalb der Spezifikationen betrieben. Allerdings stehen auch für HyperTransport und Arbeitsspeicher verschiedene Multiplikatoren bzw. Teiler zur Verfügung. Bei HyperTransport stehen die Multiplikatoren 1x, 2x, 3x und 4x zur Verfügung. Erhöht man beispielsweise den Systemtakt auf 266 MHz (was bei den vorgegebenen Multiplikatoren von 10 (Athlon 64 3200+) und 11 (Athlon 64 FX-51) jedoch keine CPU schaffen wird) könnte HyperTransport mit einem korrekten Takt von 800 MHz betrieben werden. Auch beim Arbeitsspeicher stehen die passenden Teiler zur Verfügung. Rein theoretisch könnte man damit den Prozessor selbst übertakten, ohne dabei externe Verbindungen außerhalb der Spezifikationen zu betreiben.

Das ist nicht alles! Rein theoretisch, müsste in unserem Verständnis des „BIOS and Kernel Developer's Guide for AMD Athlon 64 and AMD Opteron Processors (26094)“ im Rahmen der durch Cool“n“ Quite Technologie auch das Justieren des Multiplikators im BIOS möglich sein - muss aber nicht zwingend auf Prozessoren mit dieser Technologie beschränkt sein.

Da bei allen Cool“n“ Quite Athlon 64 Prozessoren jedoch in den Power Management Control Registers das Feld FID/VID Change Enable (FidVidEn) den Wert 1 enthält, steht einer Veränderung des Multiplikators nichts im Wege. Über die FIDVID_CTL Register, kann dem Prozessor über das NewFID Feld ein neuer für den Moment gültiger Multiplikator zugewiesen werden. Der kleinste verfügbare Wert ist hierbei die Bitfolge 00_0000b welche für einen Multiplikator von 4x steht. Der Maximalwert ist jeweils der Standardmultiplikator des Prozessors (MaxFID). Nach unten hin ist also theoretisch eine freie Multiplikatorwahl möglich.

Auf diese Art und Weise ließe sich der Frontside-Bus rein theoretisch so weit anheben, dass andere Komponenten wie HyperTransport oder Arbeitsspeicher mit ihrem korrekten Takt angesprochen werden können. Dabei sollte man jedoch nicht vergessen, dass die Komponenten im Prozessor, d.h. z.B. die integrierte Northbridge, welche mit vollem Prozessortakt betrieben wird, außerhalb der Spezifikationen angesprochen wird.

Angenommen, der Prozessor lässt sich auf bis zu 2,4 GHz übertakten, wird aber mit einem Standardmultiplikator von 11 ausgeliefert, so könnte man den Multiplikator auf 9 herabsetzen, den Frontside-Bus hoch auf 266 MHz und wählt für HyperTransport den Multiplikator 3 (für einen Takt von 800 MHz) und für den Arbeitsspeicher den Teiler 3/4 um den korrekten Takt für DDR400 zu erhalten.

Die Sache hat nur einen Haken: Keines der uns bisher vorliegenden Mainboards bietet im BIOS entsprechende Optionen zur Veränderung des Multiplikators (FID) an. Dass die Mainboard-Hersteller diese Möglichkeit übersehen haben sollen, können wir eigentlich nicht glauben, dennoch wird im Rahmen der Cool“n“ Quite Technologie, welcher der Athlon 64 (aber nicht der Athlon 64 FX) definitiv unterstützt, der Multiplikator und die Spannung zum Stromsparen verändert. Die Cool“n“ Quite Technologie lässt sich jedoch ebensowenig im BIOS aktivieren, so dass wir zum jetzigen Zeitpunkt davon ausgehen, dass die ersten Sockel 754 Platinen sie noch nicht zu unterstützen scheinen, und deshalb auch keine Option zum Verändern des Multiplikators anbieten.

Bekannte Fehler im Prozessorkern

Keinem Entwickler, sei es Hard- oder Software, fällt es leicht, Fehler in seinem gehegten und gepflegten Kind zuzugeben. Doch aus Fehlern kann man bekanntlich lernen und diese bei der nächsten Programmversion oder dem nächsten Prozessorstepping (quasi die Versionsnummer eines Prozessorkerns) beseitigen. Laut dem „Revision Guide for AMD Opteron Processors (25759)“, der gleichermaßen für den Athlon 64 FX zu gelten scheint, haben sich im ersten, öffentlichen Prozessorstepping B3 insgesamt 31 Fehler eingeschlichen. Dieses Stepping kommt derzeit nur bei den Opteron Prozessoren zum Einsatz. Seit August diesen Jahres wird in diesem Dokument schon das neue C0 Stepping geführt, welches auch bei dem uns vorliegenden Athlon 64-FX zum Einsatz kommt. Das C0 Stepping kommt nur noch mit insgesamt 18 bekannten Fehlern daher, von denen bei 6 keine Fehlerbeseitigung geplant bzw. möglich ist. AMD hat also nicht weniger als 13 Fehler beseitigt, darunter auch diverse Probleme mit dem Arbeitsspeicher, welche Teilweise einen Systemstillstand zur Folge hatten, weil bestimmte Spezifikationen nicht eingehalten wurden: „Memory Latency with Processor Power States“, „Registered DIMM Exit-Self-Refresh Requirements Not Met“, „Registered DIMM Initialization Requirements Not Met“. Glücklicherweise konnten diese Probleme jedoch rechtzeitig beseitigt werden. Die verbleibenden 18 Errors sind dagegen weniger kritisch, können jedoch unter bestimmten Umständen ebenfalls zu einem Absturz führen - das ist beim Pentium 4 Prozessor jedoch ebenso der Fall.

FehlerbeschreibungBetroffene Revision
SH7-B3SH7-C0
1 Inconsistent Global Page Mappings CanLead to Machine
Check Error
No fix planned
51 Arbitrated Interrupt With Illegal Vector SetsAPIC Error Bit
In All Processors
XX
57 Some Data Cache Tag Eviction Errors Are Reported
As Snoop Errors
No fix planned
58 Memory Latency with Processor Power StatesX
60 Single Machine Check Error May Report OverflowNo fix planned
61 Real Mode RDPMC with Illegal ECX May Cause
Unpredictable Operation
X
62 Task Gates With Breakpoints Enabled May Cause
Unexpected Faults
X
63 TLB Flush Filter Causes Coherency Problem in
Multiprocessor Systems
X
64 Single Step Across I/O SMI Skips One Debug TrapX
65 Uncorrectable NB Machine Check Error May Disrupt
Power Management
X
66 Upstream Read Response Delayed by Downstream
Posted Writes
X
68 Disable DQS Hysteresis Bit Not ReadableX
69 Multiprocessor Coherency Problem with Hardware
Prefetch Mechanism
X
71 RSM from SMM with Paging Enabled May DeadlockX
74 Registered DIMM Exit-Self-Refresh Requirements
Not Met
X
75 APIC Timer Accuracy Across Power Management EventsNo fix planned
76 APIC Timer Undercounts In Divide-by-8 Low Power ModeX
77 Long Mode CALLF or JMPF May Fail To Signal GP When
Callgate Descriptor is Beyond GDT/LDT Limit
No fix planned
78 APIC Interrupt Latency With C2 EnabledXX
79 Power Management Limitations Above 1.50VXX
80 Registered DIMM Initialization Requirements Not MetX
81 Cache Coherency Problem with Hardware Prefetching
and Streaming Stores
X
82 Certain Faults On Far Transfer Instructions In 64-Bit Mode
Save Incorrect RIP
X
83 DC Machine Check Extended Error Code Bit Not WriteableXX
88 SWAPGS May Fail To Read Correct GS BaseXX
89 Potential Deadlock With Locked TransactionsNo fix planned
90 False IC Machine Check Overflow Error Logged On ResetXX
91 Software Prefetches May Report A Page FaultXX
92 Deadlock In Multi-Processor Systems May Occur When
Earlier Operations Prevent An Older Store From Writing Data
XX
94 Sequential Prefetch Feature May Cause Incorrect
Processor Operation
XX
95 RET Instruction May Return To Incorrect EIPXX
97 128-Bit Streaming Stores May Cause Coherency FailureX
98 LDTSTOP Assertion May Be MissedX

Mit welchen Fehlern der Athlon 64 behaftet ist, können wir dagegen nicht sagen. Auch wenn er vom selben Silizium wie der Athlon 64 FX oder der Opteron kommt, so findet er doch in einem völlig anderen Gehäuse Platz und wird auch mit anderem Arbeitsspeicher betrieben.

Silicon on Insulator - Ein Schritt in die Zukunft

Mit dem Opteron und den neuen Prozessoren der Athlon-Familie, Athlon 64 und 64 FX, führte AMD nicht nur eine neue Architektur, genannt AMD64, sondern auch eine neue, fortschrittlichere Fertigungstechnik ein. Diese hört auf den Namen Silicon on Insulator, kurz SOI.

Um den Sinn hinter dieser neuen Technik zu verstehen, muss man zunächst einen Blick auf die heute normale Fertigungstechnik Namens CMOS (Complementary Metal-Oxide Semiconductor-Technologie) werfen. Dies ist eine direkte Weiterentwicklung der alten MOS-Technik, die man bei Prozessoren mit einer Taktrate von bis zu 1GHz einsetze. Sie funktioniert folgendermaßen: In heutigen Transistoren befindet sich auf der Siliziumschicht eine dünne Leiterschicht aus einem Metalloxid, da reines Silizium bekanntlich keinen Strom leiten würde. Um den Strom durch den Transistor weiterzuleiten, fügt man gewollt Unreinheiten in das Substrat ein, um somit eine Leitfähigkeit zu erzeugen. Die Leitfähigkeit des gesamten Transistors wird hingegen wieder von einer Metallschicht und eben jener Metalloxid-Schicht bestimmt. Legt man eine Spannung an die obere Metallschicht an, so lässt die darauf folgende Metalloxid-Schicht den Strom passieren und sorgt somit für einen aktiven Stromfluss.

Transistor nach MOS-Prinzip
(Quelle: IBM)

CMOS dreht nun die Verhältnisse um. Während MOS noch relativ hohe Spannungen brauchte, um eine Leitfähigkeit zu erzielen, nutzt CMOS genau das Gegenteil. Kombiniert man also Transistoren beider Techniken, so lassen sich effektive und schnell taktende Prozessoren entwickeln. Jedoch führt dies auch zu einigen Problemen. So bestand das Metalloxid bis vor einiger Zeit noch aus Aluminium und wurde später durch Kupfer, welches eine bessere Leitfähigkeit besitzt, ersetzt. AMD machte diesen Schritt erstmals mit dem Thunderbird auf dem Sockel A. Ebenfalls sah man schon damals, dass man wohl mit der fortschreitenden Verkleinerung der Leiterbahnen hin zur 90nm-Technik auf weitere Probleme stoßen würde. Silicon on Insulator wurde geboren und soll die bei der CMOS-Technik auftretenden Probleme lösen.

Transistor nach CMOS-Prinzip
(Quelle: IBM)

Silicon on Insulator soll nun die Schaltzeiten eines Transistors stark verbessern. Eines der Probleme der CMOS-Architektur war, dass jedes Medium, welches Strom leitet, auch automatisch Strom speichert. So dauerte es beim CMOS-Standard länger die gespeicherte Ladung vollkommen aus dem Bauteil herauszubekommen, als den Transistor wieder mit einem neuen Schaltvorgang zu belegen. Ebenfalls dauerte es recht lange den Transistor so zu laden, dass er fähig war einen Schaltvorgang hervorzurufen. Die technischen Vorzüge der SOI-Technik sind auf dem unteren Bild sehr gut zu erkennen. Während sich beim CMOS-verfahren (links) bei den beiden Unreinheiten links und rechts noch eine Spannung aufbaute, so umgeht die SOI-Technik dies, indem sie eine Schicht Oxid (oftmals Glas oder Siliziumoxid) auf dem Silizium-Substrat, welches hier als Isolator fungiert, platziert. Durch dieses Verfahren wird verhindert, dass sich Spannungen innerhalb des Transistors so aufbauen, dass sie der Schaltzeit des Gesamtwerkes negativ im Wege stehen könnten. Der Transistor kann nunmehr also schneller schalten und somit ebenfalls weit höhere Taktraten erlauben. Die elektrische Kapazität dieses Stromkreises wäre also sehr gering im Vergleich zur betagten CMOS-Technik. Bei IBM spricht man von 20 bis 25% Geschwindigkeitsvorteil der SOI-Technik gegenüber dem Vorgänger.

Transistor nach CMOS-Prinzip und SOI-Transistor
(Quelle: IBM)

Während Apple zur Zeit die neuesten Prozessoren für ihre G5-Rechner bei IBM fertigen lässt, ließ sich AMD ebenfalls von Big Blue unter die Arme greifen, und zog die Fachmänner dieser Firma gegen harte Dollars zur Hilfe und Optimierung des eigenen SOI-Prozesses heran.

Silicon on Insulator - Ein Schritt in die Zukunft (Fortsetzung)

Eines der Probleme der Silicon on Insulator-Technik ist der hohe Preis der Wafer. So kosten diese zu diesem Zeitpunkt noch en Vielfaches der alten und wirken sich somit nicht positiv auf den Preis des daraus resultierendes Prozessors aus. Doch wie werden diese Wafer überhaupt hergestellt? Wir erklären es euch:

Zur Zeit gibt es mehrere Methoden, um einen Wafer der SOI-Technik herzustellen. IBM selbst nutzt laut eigenen Whitepaper-Angaben eine Technik Namens SIMOX, Separation by Implantation of Oxygen. Bei diesem Verfahren wird bei extrem hohen Temperaturen eine Schicht reinster Sauerstoff auf eine Siliziumschicht aufgetragen. Unter diesen hohen Temperaturen verbinden sich Silizium und Sauerstoff zu jenem Oxid der SOI-Technik. Die so erzeugte SOI-Schicht muss dann nur noch auf einen normalen Silizium-Wafer aufgetragen werden. IBM behauptet sogar, dass man durch dieses Verfahren eine gleich hohe Ausbeute hat wie bei den normalen Wafern.

Eine weitere Technik zur Herstellung von SOI-Wafern ist BESOI, Bond and etch-back SOI. Bei dieser Technik werden zwei Wafer genommen und beide mit einer Oxidschicht unter zur Hilfenahme der Van der Waals-Kräfte zusammengefügt. Um eine angemessene Dicke des Wafers zu erzeugen, wird einer der beiden vor oder nach der Zusammenfügung maschinelles Abschleifen und Polieren auf eine Dicke von knapp 0,1µm geschrumpft. Mit diesem Verfahren ließen sich in der Vergangenheit qualitativ hochwertigere, aber auch teurere Wafer herstellen. Mittlerweile ist aber auch die SIMOX-Technik fortgeschritten und erzeugt Wafer mit gleicher Qualität.

Des Weiteren gibt es zwei verschiedene Modi, in denen Transistoren auf Basis der SOI-Technik hergestellt werden können. AMD nutzt die „half depleted“-Technik für die Produktion der aktuellen Opteron, Athlon 64 und Athlon 64 FX Prozessoren. Ob ein Transistor half oder fully depleted ist bestimmt letztendlich die Dicke der verwendeten Silizium-Schicht. Die Vorteile der Transistoren, deren Silizium-Schicht besonders gering ist (fully depleted), liegen dabei auf der Hand. So weisen diese Transistoren eine geringere Schaltzeit auf und verbrauchen weniger Strom. Ebenfalls wird die minimale Spannung, die für einen Schaltvorgang benötigt wird, herabgesetzt. Intel will ab dem Jahr 2005 voll auf diese Technik setzen, während AMD im Moment im Half-depleted-Modus produziert. Der größte Vorteil dieser Technik ist der geringere Kostenaufwand bei der Produktion. Ebenfalls sind diese Transistoren leichter anzusteuern, da die minimal benötigte Spannung nicht so großen Fluktuationen unterzogen ist wie bei der Fully-depleted-Technik. Der größte Vorteil liegt jedoch darin, dass man größtenteils auf Wafer aufbauen kann, die im kostengünstigen und ebenso effektiven SIMOX-Verfahren hergestellt wurden. Für die Herstellung von Transistoren im Fully-depleted-Verfahren sind hingegen komplizierter aufgebaute Wafer nötig.

"half depleted" und "fully depleted"
(Quelle: NASA)

Silicon on Insulator gehört die Zukunft. Nicht zuletzt wird die Betagtheit des alten CMOS-Prozesses der neuen SOI-Technik den Weg ebnen, auch die vielen Vorteile dieser Technik dürften für sich sprechen. In den letzten Jahren gab es jedoch immer wieder Probleme mit der Massenproduktion dieser Transistoren, ein Grund für die verspätete Veröffentlichung AMDs neuester Prozessoren auf Basis der AMD64-Architektur. Nun, im Jahre 2003, scheint man dieser Probleme jedoch Herr geworden zu sein und startete bereits mit der Massenproduktion. So laufen schon seit einigen Monaten bei AMD Opteron-Prozessoren auf Wafern aus dem schönen Dresden vom Band und auch IBM produziert seit einiger Zeit Prozessoren auf Basis der SOI-Technik für Apple. Die Tatsache, dass sich auch bald Intel diesem Fertigungsprozess anschließen möchte, zeigt weiterhin das vorhandene Potential, wenn es um höhere Schaltzeiten von Transistoren und den damit verbundenen Mehrleistungen bei Prozessoren geht.

Zukunftsaussichten

Wie sieht es nun mit der Zukunft der Athlon XP, Athlon 64, Athlon 64 FX und der Opteron Prozessoren aus? Mit Sicherheit kann man das wohl nicht sagen. Schließlich ist von den ursprünglichen Plänen der Hammer-Architektur, welche im November 2002, also vor gut einem Jahr, vorgestellt wurden, wie bereits Eingangs erwähnt nicht mehr allzuviel übrig geblieben. Den Blick in die Zukunft möchten wir daher anhand der derzeit offiziellen Roadmap, welche auch öffentlich über AMDs Webseite erreichbar ist, und internen Produktfahrplänen wagen.

Letzte offizielle AMD Roadmap vom 14.5.2003

Der öffentliche Fahrplan von AMD wurde zuletzt am 14. Mai 2003 auf Vordermann gebracht, und wird deshalb die Zukunftspläne eher im Groben abstecken, als konkrete, verlässliche Termine zu nennen. Schon in diesem Halbjahr gibt es erste Abweichungen. Ursprünglich geplant waren hier die Vorstellung eines „AMD Athlon 64“ und „Mobile AMD Athlon 64“, doch auch ein Athlon 64 FX wurde am heutigen Tage vorgestellt. Auch ein neuer Duron-Prozessor, welcher mit bis zu 1,8 GHz taktet und mit 2x64kB L1- und 64kB L2-Cache daher kommt, hat vor Kurzem das Licht der Welt erblickt. Das untere Preissegment für Desktop- und Mobile-Prozessoren wird jedoch durch das „As market requires“ - „Wie der Markt es verlangt“ - Prinzip berücksichtigt. Auch das Ende des Pfeils deckt sich mit den neuesten Meldungen: Der neue Duron soll bereits zum Jahresende wieder eingestellt werden. Bis auf den Lapsus mit dem Athlon 64 FX lag die Roadmap bisher also goldrichtig. Im ersten Halbjahr 2004 ist dann der offizielle Wechsel weg von der 130nm SOI-Fertigung, hin zur 90nm SOI-Fertigung, vorgesehen. Der aktuelle Opteron-Kern (Codename Sledgehammer) wird durch den „Athens“ und der Athlon 64-Kern (Codename Clawhammer) durch den „San Diego“ bzw. „Odessa“ beim Mobile Athlon 64 abgelöst. Der Athlon MP soll je nach Kundenverlangen bis Mitte 2004 produziert werden, beim Athlon XP scheint eine Auslieferung bis Ende 2004 als gewiss. Bis zu diesem Punkt ist also alles höchst offiziell. Wie sieht es nun hinter vorgehaltener Hand aus?

An dieser Stelle möchten wir ein paar Informationen aus den uns zugespielten internen Roadmaps des Prozessorherstellers entnehmen. Zum Einstieg sollen hierbei die geplanten Lieferzahlen an den Einzelhandel und OEMs bis Mitte 2004 dienen:

Geplante Lieferzahlen zu 1000 Stück
ProzessorQ3'03Q4'03Q1'04Q2'04
Athlon XP 2664685250510450
Athlon XP 3333321448141951818
Athlon XP 4002744881161582
K8 7547043313203600
K8 939003001350
K8 9401025300

Im dritten Quartal (Juli-September) bilden die „langsamen“ und vergleichsweise günstigen Athlon XP Prozessoren bis 2600+ den Löwenanteil der ausgelieferten Chips, die CPUs Athlon XP 2600+ bis 3000+ mit einem 333 MHz schnellen Frontside-Bus sind mit 40 Prozent jedoch recht deutlich am Umsatz beteiligt. Die geplante Auslieferung von 274.000 Athlon XP 3200+ und XP 3000+ (erst seit kurzem als 400 MHz FSB Version verfügbar) fällt da kaum ins Gewicht. Auch die 80.000 Athlon 64 (FX) Prozessoren sind da nur ein Tropfen auf den heißen Stein. Im vierten Quartal 2003 werden die Athlon XP 333 MHz FSB Prozessoren zum „Mainstream“-Produkt. Bis zum Ende des ersten Quartals 2004 sollen die Athlon XP Prozessoren das Hauptgeschäft im Desktop-Segment des Halbleiterherstellers bilden. Erst dann wird das Blatt eine rasante Wendung nehmen, für die es Gründe gibt - neue Prozessoren. Dazu jedoch später mehr. Die Produktpalette der langsamen Athlon XP soll offenbar im zweiten Quartal des kommenden Jahres eingestellt werden - bis dahin sollten alle neu ausgelieferten Systeme ohnehin mit modernen Hauptplatinen und Arbeitsspeicher versehen sein. Im zweiten Quartal sollen nur noch 32 Prozent der ausgelieferten Prozessoren Athlon XP sein - der Athlon 64 wird zum Trumpf!

Zukunftsaussichten (Fortsetzung)

Doch Vorsicht! Athlon 64 ist nicht gleich Athlon 64. Außerdem scheint man inoffiziell von der Aussage „AMD64 in allen Produktsegmenten“ bereits wieder abgekommen zu sein. Aufgrund des im Prozessor integrierten Speichercontrollers muss man hier von Anfang an zwischen der Dual-Channel-Version, dem Athlon 64 FX, und der Single-Channel-Variante, dem Athlon 64, unterscheiden. Beide Prozessortypen basieren derzeit, geht man nach den Datenblättern, auf dem gleichen „Clawhammer“-Kern. Nichtsdestotrotz ähnelt der Athlon 64 FX in gewissen Punkten, insbesondere dem Sockel und dem Speichersupport, dem Opteron, welcher bekanntlich mit dem „Sledgehammer“-Kern gesegnet ist. Diese Verwandtschaft scheint auch AMD ein Dorn im Auge zu sein. Deshalb fristet der Athlon 64 FX-51, so wie er heute angekündigt wurde, nur ein kurzes Dasein, das sich auch in den geplanten Stückzahlen widerspiegelt. Bereits in der ersten Jahreshälfte 2004 soll der Athlon 64 FX-51 im Sockel 940 eingestellt und durch eine Variante im Sockel 939 abgelöst werden. Auf Rücksprache mit AMD wurde uns jedoch versichert, dass die Sockel 940 Variante noch über das erste Quartal 2004 für einen leichten Übergang hinweg ausgeliefert werden soll.

Doch eins ist klar: AMD möchte den Server/Workstation und Desktop-Markt klar trennen - der Athlon 64 FX-51 stellt hier nur eine Übergangslösung für die Mainboard-Hersteller dar, um sich auf den Sockel 939 vorzubereiten. Schließlich wird dem Athlon 64 FX nicht trivial ein Pin genommen, vielmehr ändert sich das komplette Layout, um so auch einfachere Mainboards ermöglichen zu können.

Der Athlon 64 FX-51 wird im zweiten Quartal 2004 durch den Athlon 64 FX-53 im Sockel 939 und vermutlich 2,4 GHz Realtakt abgelöst werden. Ob der Athlon 64 FX-53 dabei schon auf dem in 90nm gefertigtem „San Diego“-Kern basieren wird, der dann auch AMDs Cool“n Quiet Technologie besitzen wird, ist dabei noch völlig unklar. Wie der FX-51 wird auch der FX-53 mit einem Dual Channel Speicherinterface daher kommen. Ob dann ebenfalls Registered (buffered) Arbeitsspeicher verlangt wird, ist dagegen noch nicht sicher. Wahrscheinlich ist jedoch der Einsatz von Unbuffered Modulen.

Von Anfang an auf lange Sicht geplant war der Athlon 64 für den Sockel 754. Bereits im letzten Quartal 2003 soll sein Lieferanteil mit den Athlon XP Prozessoren mit einem 400 MHz schnellen Frontside-Bus auf einem Niveau liegen. Das liegt nicht zuletzt an der Verstärkung die er im Oktober oder November erhalten wird: zu dem Athlon 64 3200+ mit 2,0 GHz wird sich der Athlon 64 3400+ mit 2,2 GHz hinzugesellen. Der Listenpreis dieses Modells wird bei happigen 637 US-Dollar liegen - das Gegenstück zum Anfang Dezember (laut bisheriger Planung) erscheinenden Pentium 4 3,4 GHz mit Prescott-Kern? Bis zum zweiten Quartal 2004 wird der Athlon 64 3400+ der schnellste Sockel 754 Prozessor bleiben, welcher dann vom Athlon 64 3700+ abgelöst werden wird - auch im Sockel 754.

Der Takt des Athlon 64 3700+ könnte 2,4 GHz oder 2,5 GHz betragen. Hier stellt sich nun die Frage, ob man diesem Takt noch mit in 130nm gefertigtem „Clawhammer“-Kern erreichen kann oder nicht. Ist dem so, sind viele Fragen beantwortet. Erreicht man diesem Takt aber nur mit dem 90nm Kern „San Diego“, werden weitere Fragen aufgeworfen. Laut der uns vorliegenden Roadmap ist dieser Kern nämlich nur für den neuen Sockel 939 vorgesehen, welcher von späteren Versionen des Athlon 64 FX genutzt werden wird und unter anderem für die Dual Channel Anbindung des Speichers Voraussetzung ist.

Auch bei den Sockel 754 Prozessoren muss etwas passieren: Schließlich fährt man die Auslieferung von Athlon XP Prozessoren im zweiten Quartal 2004 deutlich runter! Dies ist schlicht und ergreifend mit einem neuen Athlon XP für den Sockel 754 auf Basis der Hammer-Architektur zu erklären, dem jedoch ein wichtiges Feature dieser Architektur zu fehlen scheint: die 64Bit Erweiterung. Der Prozessor befindet sich derzeit mit dem Codenamen „Paris“ in der Entwicklung und soll, so wie der „Clawhammer“-Kern, im 130nm SOI-Prozess gefertigt werden. Der „Paris“ wird einen 256kB großen L2-Cache besitzen und wird auch die Cool“n'Quiet Technologie beherrschen.

Damit wäre „Paris“ ein Rückzieher. Schließlich wollte AMD die AMD64 Architektur in allen Produktbereichen etablieren.

Preisfrage - Gebrauchtwagen oder Athlon 64

Ein entscheidendes Kriterium für den Kauf eines neuen Prozessors ist neben der Leistung sicherlich der Preis. Hierbei muss man natürlich zwischen den Großhandelspreisen und den Preisen im Laden um die Ecke unterscheiden. In der Vergangenheit konnten Intels Prozessoren zwar auf der Preisliste für Großkunden mit den Preisen für AMDs Boliden konkurrieren, im Einzelhandel schockte den gewillten Käufer jedoch ein gänzlich anderes Bild. Während Athlon XP Prozessoren zumeist unter Listenpreis unter's Volk geworfen wurden, musste man beim Pentium 4 allein schon für den Namen und seinen Ruf als "teure CPU" deutlich mehr bezahlen. Leider Gottes wird dies beim Athlon 64 und vor allem beim Athlon 64 FX nicht mehr der Fall sein, denn wie folgende Tabelle zeigt, verlang AMD für seine neuen Prozessoren eine ganze Menge Geld.

Großhandelspreise bei der Abnahme von 1000 Stück
Intel Pentium 4AMD Athlon XPAMD Athlon 64/FX
TaktPreisModelnr.PreisModelnr.Preis
Seit 21.5.03Ab 23.6.03Seit 13.5.03Seit 26.5.03Seit 23.9.03
Athlon 64 FX 51$733
3,20 GHz-$6373200+$464$464Athlon 64 3200+$417
3,00 GHz$417$4173000+$325$265
3,06 GHz$401$4012800+$225$180
2,80C GHz$278$2782700+$180$137
2,80 GHz$262$2622600+$151$103
2,66 GHz$193$1932500+$124$89
2,60C GHz$218$2182400+$103$84
2,60 GHz$193$1932200+$81$74
2,53 GHz$193$193
2,40C GHz