Sie sind da, die beiden Neuen! Richtig gehört, denn wie es vor einigen Wochen plötzlich aus allen Ecken flüsterte, hat AMD nicht nur den schon länger angekündigten Athlon 64 vorgestellt. Auch ein Athlon 64 FX erblickt just in diesem Moment das Licht der Öffentlichkeit. Während der nun kurzer Hand zum kleinen Bruder degradierte Athlon 64 3200+ mit 2,0 GHz und einem Single-Channel-Interface auskommen muss, hat man dem Athlon 64 FX-51 kurzer Hand 2,2 GHz und Dual-DDR400 spendiert. Ja, auch dieses Gerücht, das zur CeBit2003 richtig ins Kochen geriet, hat sich bewahrheitet.
Wir wollen in diesem Artikel, in dem es um mehr geht, als um die x. Takterhöhung einer eingebürgerten Architektur, auf die Neuerungen von AMD64 - vormals x86-64 - eingehen. Was ist neu und was ist alt? Wo liegen die Voraussetzungen für einen der neuen Prozessoren? Was bringt 64 Bit heute und was bringt es morgen? Wie sieht es mit kühlen, übertakten und dem verwendeten Speicher aus? Ein Dickicht voller Fragen, das wir lichten wollen.
Dem ausladenden Theorieteil folgt unser überarbeiteter Benchmarkparcours, den wir vor einiger Zeit mit Hilfe der Mitglieder in unserem Forum gehörig aufgefrischt haben und der in gleich fünf Leistungsratings seinen Höhepunkt findet.
Die Suche nach einer Athlon 64 3200+ CPU, die - nicht wie der FX-51 - von AMD gestellt wurde, erschien übrigens ungleich schwerer, als so manch' andere Hürde in diesem Test. Letztendlich haben wir dennoch ein Exemplar in die Hände bekommen und können auch diesem Chip, der ob seines attraktiven Preises wohl die erste Wahl für den Massenmarkt werden dürfte, über die Schulter schauen. Sicherlich wollte man seitens AMD mit der FX-Brechstange ein Zeichen setzen. Verstecken hätte man die Leistung des Athlon 64 jedoch nicht brauchen - die kann sich ebenfalls durchaus sehen lassen. Fraglich, was einem zu diesem Schritt bewegt hat.
Wir wünschen viel Spass und Durchhaltevermögen!
Da es möglich ist, dass in diesem Artikel auf bestehendes Wissen aus älteren Prozessortests zurückgegriffen wird, ist es für alle, die etwas "mehr" wissen möchten, keinesfalls verkehrt, auch einen Blick in unsere älteren Berichte (Ausschnitt) zu werfen.
Wer darüber hinaus noch an der Prozessoren-Geschichte von AMD und Intel interessiert ist, wird an den Artikeln „Intels Prozessor History - Der Weg vom Intel 4004 bis zum Pentium 4 [8]“ und „AMD Prozessor History - Ein Überblick vom K5 bis zum Athlon XP [9]“ seine wahre Freude haben.
Die zwei heute vorgestellten Athlon 64-Prozessoren auf Basis der AMD64 Architektur, ehemals x86-64 genannt, welche unter dem Codenamen „Hammer“ entwickelt wurde, haben einen langen, steinigen und von Verzögerungen gepflasterten Weg hinter sich gebracht. Am 10. August 2000 für das Ende 2001 angekündigt, wurde daraus Ende Januar 2001, das erste Halbjahr 2002, das zweite Halbjahr 2002, das vierte Quartal 2002, das erste Halbjahr 2003 und schlussendlich ein Termin im September 2003. Letzteren Termin hatte man bereits am 31. Januar 2003 gesetzt und er sollte auch tatsächlich eingehalten werden. Aufgrund der langen Planungsphase sollten darüber hinaus genügend Mainboards für die neuen Produkte zur Verfügung stehen und jedwede Kompatibilitätsprobleme sollten dank der bereits seit 22. April verfügbaren Opteron-Prozessoren, welche ebenfalls auf der AMD64 Architektur beruhen, aber für den Workstation- und Servereinsatz in Multiprozessorumgebungen entwickelt wurden, weitestgehend aus der Welt geräumt sein. In wie weit das der Realität entspricht, wollen wir im weiteren Verlauf dieses Artikels klären.
Der Vollständigkeit halber folgt an dieser Stelle eine Übersicht der in offiziellen Pressemeldungen genannten Start-Termine für die neue Architektur, welche unter anderem aufgrund von Fertigungsproblemen immer wieder auf ein späteres Datum verschoben wurde.
Von ursprünglich Ende 2001
auf erstes Halbjahr 2002
auf zweites Halbjahr 2002
auf Q4 2002
auf erstes Halbjahr 2003
und anschließend auf September 2003
Dabei sollte jedoch jedem klar sein, dass man eine neue Architektur nicht von heute auf morgen entwickeln kann - häufig treten Probleme auf, welche zu Beginn der Entwicklung nicht einmal für möglich gehalten wurden. Das schließt auch Intel nicht aus, wo man aufgrund von Fertigungsproblemen die immer wieder zitierte Vorstellung des Pentium 4 Nachfolgers vom vierten Quartal 2003 (Anfangs für Oktober geplant, dann auf Dezember verschoben) Gerüchten zufolge auf Februar 2004 verschieben musste.
Häufig sind es auch nicht nur Probleme, auf die man stößt. Manchmal ist es auch eine zu starke Konkurrenz, durch die man gezwungen wird, während der Entwicklung eine andere Richtung einzuschlagen bzw. eine Planänderung vorzunehmen. Bei Intel trifft dies ganz klar auf den Pentium 4 Extreme Edition zu, welcher vollkommen überraschend am 16. September 2003 anlässlich des Intel Developer Forums Fall 2003 vorgestellt wurde - langfristig geplant war diese CPU ganz sicher nicht.
Betrachtet man nicht mal ein Jahr alte Roadmaps vom 17. November 2002, so ist doch erschreckend, was aus den ursprünglich geplanten Produkten geworden ist. Ausgehend vom damaligen Entwicklungsstand sollte ein „AMD Athlon Processor (ClawHammer-DT), Athlon Processor (ClawHammer-DP) und ein Opteron (SledgeHammer-MP)“ im ersten Halbjahr 2003 erscheinen. Im Detail wurden die Produkte wie folgt geplant:
| AMD Athlon Prozessor (ClawHammer-DT) |
| Desktop Prozessor |
| Single-Channel DDR mit 200, 266 und 333 MHz (Weitere Speicher-Technologien, sobald definiert) |
| Ein 16-bit HyperTransport Link mit 1600MT/s |
| Produkte mit 256KB und 1MB L2 Cache |
| 754-Pin mPGA Package |
| AMD Athlon (ClawHammer-DP) |
| 2-Wege Server und Workstation Prozessor |
| Single-Channel DDR mit 200, 266 und 333 MHz (Weitere Speicher-Technologien, sobald definiert) |
| Zwei 8-bit HyperTransport Links mit 1600MT/s |
| Produkte mit 512KB und 1MB L2 Cache |
| 754-Pin mPGA Package |
| AMD Opteron (SledgeHammer-MP) |
| Bis zu 8-Wege Server Prozessor |
| Dual-Channel DDR mit 200, 266 und 333 MHz (Weitere Speicher-Technologien, sobald definiert) |
| Drei 16-bit HyperTransport Links mit 1600MT/s |
| 1MB L2 Cache integriert |
| 940-Pin mPGA Package |
Am heutigen Tag ankündigt wurden der Athlon 64 für den Sockel 754 und der Athlon 64 FX für den Sockel 940. Während letztgenannter gar nicht in den Roadmaps erwähnt wird, ist erster keinesfalls Dual-Prozessor-fähig. Eine entsprechende Dual-Prozessor Variante für einen Sockel 754 Prozessor wird es so schnell wohl auch nicht geben - der ClawHammer-DP wurde ersatzlos gestrichen, wenngleich minimale Hinweise existieren, dass der Prozessor, den wir am heutigen Tag als Athlon 64 kennen lernen, in einem Merkmal mit dem ClawHammer-DP übereinstimmen könnte. Während in den offiziellen Pressedokumenten beim Athlon 64 von einem 16 Bit weiten HyperTransport-Kanal die Rede ist, spricht der 'Software Optimization Guide for AMD Athlon 64 and AMD Opteron Processors (25112)' auf Seite 262 unmissverständlich von zwei 8bit weiteren Anbindungen, welche allerdings zu Gunsten einer 16bit HyperTransport-Verbindung zusammengeschlossen werden können. Ist der Athlon 64, da eigentlich ClawHammer-DP, etwa Dual Prozessor fähig? Laut AMD natürlich nicht!
Doch zurück zum Thema: Kleine Athlon-Modelle mit 256 und 512kB großen Cache stehen auf der Liste - sie werden wohl auch nicht erscheinen, wenngleich es auf der aktuellen Roadmap andere Produkte mit neuem Codenamen auf Basis der Hammer-Architektur gibt, welche mit 256kB Cache ausgestattet sind. Dem Thema wollen wir uns jedoch erst in den Zukunftsaussichten zuwenden. Fakt ist, dass kleine Athlon 64 Modelle, d.h. Prozessoren mit kleinerem Cache, am heutigem Tage nicht vorgestellt wurden. Darüber hinaus wurde die Speicherunterstützung der geplanten Prozessoren (Opteron ausgenommen) um DDR400 erweitert.
Übrigens erschien auch bei den Opteron-Prozessoren nicht das, was geplant war, wenngleich der SledgeHammer-MP all das verkörpert, für das die Opteron 1XX, 2XX und 8XX Prozessoren heute stehen. Damals sah die Sache jedoch noch anders aus, wie Justin Boogs, AMD Developer Center Manager, in seinem ebenfalls am 17. November veröffentlichtem Dokument „Developer_Center“ auf Seite 4 schreibt.
| Verfügbare Hardware |
| Single-Prozessor 8. Generation AMD Athlon ("Clawhammer"), Desktop PCs mit 512MB bis 2GB RAM |
| Dual-Prozessor AMD Opteron ("Clawhammer DP"), Server und Workstations mit 1 bis 4GB RAM |
| Quad-Prozessor AMD Opteron ("Sledgehammer"), Server mit 4 bis 16GB RAM |
Demnach hörte der „Dual processor AMD Opteron“ damals auf dem Codename Clawhammer-DP und sollte somit laut obiger Roadmap für den Sockel 754 mit Single Channel Speicherinterface starten. Nur der „Quad processor AMD Opteron“ sollte auf dem Sledgehammer-Kern im Sockel 940 basieren - widersprüchlich, verglichen mit allen bis dahin veröffentlichen Informationen. Opteron auf zwei verschiedenen Sockeln? Schreibfehler, oder wusste hier die linke Hand nicht was die Rechte tut? Doch was interessiert uns alter Kaffee, das hier und jetzt zählt.
Bevor wir uns in den Details der AMD64-Architektur verlieren, soll eine Vergleichstabelle zwischen Pentium 4, Athlon XP und den beiden neuen Athlon 64 und Athlon 64 FX für etwas Übersicht sorgen.
| Merkmale | Pentium 4 | Athlon XP | Athlon 64 (FX) |
| Kern | Northwood | Thoroughbred "A/B" Barton | Clawhammer |
| Frontside-Bus | 400 MHz QDR 533 MHz QDR 800 MHz QDR | 266 MHz DDR 333 MHz DDR 400 MHz DDR | entfällt |
| Fertigung | 0,13µm | 0,13µm | 0,13µm SOI |
| Sockel | Sockel 478 | Sockel A | Sockel 754 Sockel 940 (FX) |
| Taktrate o. Modellnummer | 400 MHz QDR 1600 MHz A 1800 MHz A 2000 MHz A 2200 MHz 2400 MHz 2500 MHz 2600 MHz 533 MHz QDR 2266 MHz 2400 MHz B 2533 MHz 2666 MHz 2800 MHz 3066 MHz HT 800 MHz QDR 2400 MHz C HT 2600 MHz C HT 2800 MHz C HT 3000 MHz HT 3200 MHz HT HT: Hyper-Threading | 266 MHz DDR (Tho.) 1800+ 1900+ 2000+ 2100+ 2200+ 2400+ 2600+ 333 MHz DDR (Tho.) 2600+ 2700+ 2800+ 333 MHz DDR (Bar) 2500+ 2600+ 2800+ 3000+ 400 MHz DDR (Bar.) 3000+ 3200+ | Athlon 64: 3200+ Athlon 64 FX: 51 |
| Transistoren | 55 Millionen | 37,5 Millionen (Tho.) 54,3 Millionen (Bar.) | 105.9 Millionen |
| DIE-Size | 146mm² (nB0 Step) 131mm² (nC1 Step) 131mm² (nD1 Step) | 80 mm² ("A") 84 mm² ("B") 101 mm²(Bar.) | 193 mm² |
| L1-Execution-Cache | 12.000 µ-Ops | 64 kB | 64 kB |
| L1-Daten-Cache | 8 KB | 64 kB | 64 kB |
| L1-Takt | CPU-Takt | CPU-Takt | CPU-Takt |
| L2-Cache | 512kB | 256kB (Tho.) 512kB (Bar.) | 1024kB |
| L2-Anbindung | 256 Bit | 64 Bit | 128 Bit? |
| L2-Cache-Takt | CPU-Takt | CPU-Takt | CPU-Takt |
| L2-Modus | L1 inclusive | L1 exclusive | L1 exclusive |
| HW Data Prefetching | Ja | Ja | Ja |
| VCore | 1,475V 1,500V 1,525V 1,550V | 1,50V 1,60V 1,65V | 1,55V |
| Befehlssätze | MMX SSE / SSE2 | MMX / 3DNow! 3DNow!+ / SSE | MMX / 3DNow! 3DNow!+ / SSE SSE2 / AMD64 |
| Temperatur Diode | Ja | Ja | Ja |
| Multiprozessor-fähig | Nein | Nein | Nein |
| CPU-Architektur | 20-stufige Pipeline | 15-stufige (FPU) 10-stufige (ALU) Pipeline | 17-stufige (FPU) 12-stufige (ALU) Pipeline |
Auf den ersten Blick gibt es nur sehr wenig Auffälligkeiten, doch im Detail hat es der Athlon 64 (FX) in sich. Die Tatsache, dass die Prozessoren auf Basis der AMD64 Architektur keinen klassischen Frontside-Bus besitzen, hat nämlich weitreichende Folgen. Was ist der Frontside-Bus? Über diesen Bus waren bisher alle geläufigen Desktop-Prozessoren mit der Außenwelt (AGP, PCI, USB sowie allen anderen Geräten) und damit auch dem Arbeitsspeicher verbunden. Beim Athlon 64 (FX) sieht die Sache etwas anders aus. Diese Prozessoren besitzen ebenso wie die Server-Variante (Opteron) eine im Prozessor integrierte Northbridge einschließlich eines Speichercontrollers. Hierauf werden wir im Verlauf des Reviews im Detail eingehen.
Des weiteren haben die drei Buchstaben „SOI“, stellvertretend für Silicon on Insulator, bei der Fertigungstechnologie weit reichende Folgen auf die Betriebsspannung, auf den Stromverbrauch und damit auch auf die thermische Verlustleistung. Um noch einen weiteren besonders wichtigen Punkt zu nennen, sei auf die Zeile „Befehlssätze“ das Augenmerk gelenkt: AMD64, ehemals x86-64, ermöglicht den Spagat zwischen der 32bit und 64bit Architektur welche einige Barrieren ins nahezu Unerreichbare verschiebt.
In unsere technischen Abhandlungen über die neuen Prozessoren aus dem Hause AMD wollen wir langsam mit den Entwicklungs-Codenamen einsteigen und wenden uns anschließend der AMD64-Architektur zu.
Ob der vielen geänderten Codenamen ClawHammer-DP, ClawHammer-DT und SledgeHammer-MP haben wir bei AMD um Klärung gebeten und erhielten von Jan Gütter, AMD Public Relations Zentraleuropa, folgende Codenamenzuweisung:
Der Opteron ist also ohne Zweifel ein Sledgehammer, der Athlon 64 ein Clawhammer und der Geistesblitz Athlon 64 FX hat ob der Kürze der Entwicklungsphase nie einen gehabt. Letztendlich sind die Codenamen jedoch nur Schall und Rauch, denn ob Athlon 64, Athlon 64 FX oder Opteron - alle laufen in AMDs Dresdner Produktionsstätte, Fab30, vom selben Band. Das verdeutlichen auch die Features der verschiedenen Prozessoren im Vergleich:
| Athlon 64 | Athlon 64 FX | Opteron 1XX | Opteron 2XX | Opteron 8XX |
| Prozessorsockel | ||||
| Sockel 754 | Sockel 940 | Sockel 940 | Sockel 940 | Sockel 940 |
| Skalierbarkeit | ||||
| 1-fach | 1-fach | 1-fach | Bis zu 2-fach | Bis zu 8-fach |
| Integrierter Speichercontroller / Speicherbandbreite | ||||
| Ja/64-bit | Ja/128-bit | Ja/128-bit | Ja/128-bit | Ja/128-bit |
| HyperTransport Technologie / HyperTransport Links | ||||
| Ja/1 | Ja/1 | Ja/3 | Ja/3 | Ja/3 |
| AMD64 Erweiterung / Gleichzeitiges 32 & 64-bit Computing | ||||
| Ja/Ja | Ja/Ja | Ja/Ja | Ja/Ja | Ja/Ja |
| Größe des L1-Cache (Daten/Instruktion) | ||||
| 64KB/64KB | 64KB/64KB | 64KB/64KB | 64KB/64KB | 64KB/64KB |
| Größe des L2-Cache | ||||
| 1MB | 1MB | 1MB | 1MB | 1MB |
| Pipeline stages (integer/floating point) | ||||
| 12/17 | 12/17 | 12/17 | 12/17 | 12/17 |
| L1/L2 data cache protection | ||||
| ECC | ECC | ECC | ECC | ECC |
| L1/L2 instruction cache protection | ||||
| Parity | Parity | Parity | Parity | Parity |
| Global History Zähler-Einträge | ||||
| 16K | 16K | 16K | 16K | 16K |
| L1 TLB Einträge (Daten/Instruktion) | ||||
| 40/40 | 40/40 | 40/40 | 40/40 | 40/40 |
| L1 Assoziativität(Daten/Instruktion) | ||||
| Voll/Voll | Voll/Voll | Voll/Voll | Voll/Voll | Voll/Voll |
| L2 TLB Einträge (Daten/Instruktion) | ||||
| 512/512 | 512/512 | 512/512 | 512/512 | 512/512 |
| L2 Assoziativität (Daten/Instruktion) | ||||
| 4-fach/4-fach | 4-fach/4-fach | 4-fach/4-fach | 4-fach/4-fach | 4-fach/4-fach |
| Fertigungs-Technologie | ||||
| 0.13µm SOI | 0.13µm SOI | 0.13µm SOI | 0.13µm SOI | 0.13µm SOI |
Hergestellt in Fab 30, Dresden Deutschland | ||||
Im Großen und Ganzen unterscheiden sich die verschieden Prozessoren nur in sehr wenigen Punkten. Insbesondere der Athlon 64 hebt sich durch seinen Sockel und das Speicherinterface von seinen Mitstreitern ab.
Auch wenn der Prozessorkern des Athlon 64, Athlon 64 FX und des Opterons absolut identisch ist, trennen sich beim Packaging die Wege der Prozessoren. Je nach Qualität des Prozessorkerns (DIE) wird aus dem einen Exemplar ein Opteron mit Dual Channel-Interface und Multi-Prozessor-Fähigkeit, aus dem anderen ein Athlon 64 FX mit Dual Channel-Speicherinterface und aus dem dritten vielleicht ein Athlon 64, welcher mit einem Single Channel Speicherinterface aufwarten kann. Sobald der Prozessorkern seinen Unterbau, das Prozessorgehäuse, verpasst bekommt und entsprechend verdrahtet wird, stehen die Features der jeweiligen CPU fest. Welcher Prozessor für was berufen ist, das entscheidet die Qualitätskontrolle. Ähnlich geht Intel mit der Selektion der Canterwood-Chipsätze vor.
Das Prozessorgehäuse des Athlon 64 FX und Athlon 64 unterscheidet sich hierbei nicht nur in der Anzahl der Pins (940 gegenüber 754) sondern auch im verwendeten Material. Während beim Athlon 64 FX wie bei dem Opteron-Prozessoren oder den aller ersten Athlon (Thunderbird)-Prozessoren ein CPGA (Ceramic Pin Grid Array), also ein Keramikgehäuse, zum Einsatz kommt, wird der Athlon 64 auf ein OPGA (Organic Pin Grid Arry), einem Gehäuse aus organischen Material, untergebraucht.
Dieses kommt unter anderem auch beim Athlon XP oder beim Intel Pentium 4 zum Einsatz. Allgemein gilt letzteres Material als besonders hitzebeständig und zeichnet sich durch eine größere Elastizität aus - warum beim Athlon 64 FX dennoch ein CPGA zum Einsatz kommt, können wir nur damit erklären, dass die vielen PINs mit eben diesem Gehäuse einfacher zu realisieren sind. Letztendlich sollte die thermische Beständigkeit des Gehäuses derzeit eher eine Nebenrolle spielen - wird der Athlon 64 FX unter Volllast nicht ansatzweise richtig heiß.
Um die Aussage, die Opterons, der Athlon 64 und der Athlon 64 FX stammen vom selben Wafer, nicht ganz ohne optischen Nachweis dastehen zu lassen, soll ein Detail-Blick auf den Wafer für die nötige Klarheit sorgen.
Diese Aufnahmen stammen von AMD und unterscheiden sich offensichtlich nur im Logo in der unteren, rechten Ecke. Ein Opteron 1XX, 2XX oder 8XX sieht in der Nahaufnahme nicht viel anders aus.
Im Rahmen der „True Performance Initiative“ hat sich AMD bereits beim Athlon XP dazu entschieden, bei seinem Prozessoren nicht mehr die Taktfrequenz sondern eine Modellnummer bzw. ein Performance-Rating einzuführen, welches den jeweiligen Prozessor mit einem älteren Modell vergleicht. Die Modellnummer beim bisher schnellsten Athlon XP 3200+ sagt hierbei folgendes aus: Ein Athlon Classic (Thunderbird) müsste mit 3,2 GHz takten um eine vergleichbare Leistung zu erreichen. Nachprüfen kann das natürlich keiner - schließlich war beim Athlon mit einem Takt von 1,4 GHz Schluss. Im Vergleich zu den Modellnummern beim Athlon XP trennt man sich bei den Bezeichnungen für den Opteron allerdings von einer der Taktfrequenz ähnlichen Angabe. Beim Opteron hat man eine dreistellige Zahl auserkoren, um die verschiedenen Modelle des 64Bit Serverprozessors voneinander zu unterscheiden. Die erste Ziffer steht hierbei für die Anzahl der in einem System unterstützten Prozessoren. Die Opterons für 1-Wege-Systeme sind also an der Modellnummer 1XX zu erkennen. Insgesamt gibt es drei Serien:
Die zweite und dritte Ziffer gibt die relative Geschwindigkeit des Prozessors innerhalb einer Prozessorserie an. Der Opteron 244 bietet somit eine höhere Leistung als der Opteron 242, wie sich ein Opteron 146 im Vergleich dazu behaupten kann, geht aus den Nummern dagegen nicht hervor. Der derzeit schnelle Opteron in der jeweiligen Serie X46 taktet mit 2,0 GHz, Modelle mit 1,4 GHz (X40), 1,6 GHz (X42) und 1,8 GHz (X44) sind ebenfalls verfügbar.
Auch dem Athlon 64 FX hat man eine abstrakte Zahl verpasst, die in keiner Weise an eine Taktfrequenz erinnert: Der Athlon 64 FX mit einem realen Prozessortakt von 2,2 GHz hört auf die Beizeichnung Athlon 64 FX-51.
Beim Athlon 64 konnte man es dagegen nicht lassen - man hat dieser CPU wieder eine Modellnummer verpasst, die stark einer Taktfrequenz ähnelt. Letztendlich bleibt nur zu hoffen, dass es im Laufe der Zeit nicht zu wieder einer Verschiebung der Modellnummern kommt, nach der dann bestimmte Prozessoren ihre Bezeichnung zu Unrecht tragen.
Der Athlon 64 steht anfangs als 3200+ mit einem Takt von 2,0 GHz parat, der Mobile Athlon 64 wird darüber hinaus noch als 3000+ mit einem Takt von 1,8 GHz angeboten werden. Hier ein Überblick über die aktuellen Modellnummern der Athlon XP und Athlon 64 (FX) Prozessoren. Den Varianten des alten Athlon XP mit Palomino und Throughbred "A"-Kern haben wir dabei zur Übersichtlichkeit entfernt. Diese Modelle wurden jedoch in einem älteren Prozessorreview [16] brücksichtigt.
| Bezeichnung | realer Takt | Frontside-Bus |
| Thoroughbred "B", 0,13µm, 64kB + 64kB L1 + 256kB L2 Cache | ||
| Athlon XP 1700+ | 1466 MHz | 133 MHz |
| Athlon XP 1800+ | 1533 MHz | 133 MHz |
| Athlon XP 1900+ | 1600 MHz | 133 MHz |
| Athlon XP 2000+ | 1666 MHz | 133 MHz |
| Athlon XP 2100+ | 1733 MHz | 133 MHz |
| Athlon XP 2400+ | 2000 MHz | 133 MHz |
| Athlon XP 2600+ | 2133 MHz | 133 MHz |
| Athlon XP 2600+ | 2083 MHz | 166 MHz |
| Athlon XP 2700+ | 2166 MHz | 166 MHz |
| Athlon XP 2800+ | 2250 MHz | 166 MHz |
| Barton, 0,13µm, 64kB + 64kB L1 + 512kB L2 Cache | ||
| Athlon XP 2500+ | 1833 MHz | 166 MHz |
| Athlon XP 2600+ | 1917 MHz | 166 MHz |
| Athlon XP 2800+ | 2083 MHz | 166 MHz |
| Athlon XP 3000+ | 2100 MHz | 200 MHz |
| Athlon XP 3000+ | 2166 MHz | 166 MHz |
| Athlon XP 3200+ | 2200 MHz | 200 MHz |
| Bezeichnung | realer Takt | Speicherinterface |
| Clawhammer 0,13µm SOI, 64kB + 64kB L1 + 1MB L2 Cache | ||
| Athlon 64 3000+* | 1800 MHz | Single-Channel |
| Athlon 64 3200+ | 2000 MHz | Single-Channel |
| Athlon 64 3400+** | 2200 MHz | Single-Channel |
| Athlon 64 FX-51 | 2200 MHz | Dual-Channel |
* Nur als Mobile Variante, ** Für Oktober/November geplant
Wie man bei dieser Übersicht besonders gut erkennen kann, hat AMD dem Athlon 64 und dem Athlon XP bei gleichem Prozessortakt die gleiche Modellnummer zugeteilt - doch gerade letzterer wurde seiner Modellnummer eher selten gerecht. Wie wird dies wohl beim Athlon 64 aussehen? Die Benchmarks werden es zeigen.
Zur im Athlon 64 und Athlon 64 FX zum Einsatz kommenden Architektur kann man sicherlich besonders viele Worte verlieren. Im Vergleich zum bisher schnellsten Desktop-Prozessor aus dem Hause AMD, dem Athlon XP 3200+, gibt es dabei doch die eine oder andere Gemeinsamkeiten. Letztendlich zählen jedoch nur die Unterschiede.
Architektur des AMD Athlon (Athlon XP verfügt über 32-Entry TLB und SSE-Support)
Die neue AMD AMD64 Architektur, bisher unter der Bezeichnung x86-64 bekannt
So besitzen alle Prozessoren der AMD64-Architektur eine in den Prozessor integrierte Northbridge, an die unter anderem der Speichercontroller und ein HyperTransport-Interface angebunden sind. Außerdem besitzt der Athlon 64 (FX) einen 1 MB großen L2-Cache, der doppelt so groß wie der des Athlon XP 3200+ ausfällt. Auch der SSE2 Befehlssatz wird nun unterstützt. Darüber hinaus werden die drei Integer-Units des Prozessors nun von einem insgesamt 24 Einträge fassenden Scheduler gefüttert. Die Integer-Scheduler des Athlon XP fassen nur 18 Einträge. Beim FPU-Scheduler des Athlon XP mit seinen 32 Einträgen war man dagegen auch beim Athlon 64 zufrieden. Bei der Branch Prediction Unit hat man allem Anschein nach Bedarf zur Nachbesserung gesehen. So hat man hier z.B. die Größe des Global History Counters auf 16k vervierfacht um somit eine bessere Sprungvorhersage zu ermöglichen. Bei den Translation Look-aside Buffer (TLB) hat man ebenfalls den Speicherplatz vergrößert. Nachdem man dem Athlon XP im Vergleich zum Athlon bereits optimierte TLBs [17] zukommen lies, wurde nun die Größe der L2 TLB von 256 auf 512 Einträge verdoppelt. Die 10-stufige ALU und 15-stufige FPU-Pipeline des Athlon XP wurden bei den Mitgliedern der AMD64-Architektur um jeweils zwei Stufen auf 12 und 17 „Stages“ verlängert. Dadurch wird die Arbeit auf mehrere Einheiten verteilt, wodurch die einzelnen Units weniger komplex ausfallen können und dadurch höhere Taktraten erreicht werden. Je länger die Pipeline, desto leichter kann auch der Prozessortakt angehoben werden. Dafür ist eine lange Pipeline sehr anfällig gegenüber Cache-Misses oder falschen Branch-Predictions, deshalb auch die Vergrößerung des Global History Counters der Branch Prediction Unit. An dieser Stelle soll auch nicht vergessen werden, dass der Prozessorcache nun über einen ECC Fehlerkorrektur-Mechnismus verfügt. Im Detail haben sich darüber hinaus weitere Kleinigkeiten verändert.
Die bisher aufgeführten Verbesserungen sind zwar schön und gut, wirklich neu ist aber die 64 Bit Erweiterung, welche dem Athlon 64 sowie dem Athlon 64 FX auch zu ihrem Namen verholfen hat. Im 32 Bit Modus verhalten sich Athlon 64 (FX) und Opteron wie klassische x86 Prozessoren. In diesem Modus bietet er acht 32 Bit breite General-Purpose Registers (GPRs), acht 64 Bit fassende Media and Floating-Point Registers (für MMX) sowie acht 128 Bit breite Media Registers (für SSE und SSE2).
Als Register bezeichnet man prozessorinterne Zwischenspeicher. Auf diesen Registern werden sämtliche Operationen wie Addition und Multiplikation durchgeführt. Ein Prozessor kann so lange Operationen durchführen, wie seine Register lang sind. Ein 32Bit Prozessor kann also mit Zahlen arbeiten, die eine Länge von maximal 32 Bit haben (wenn man die MMX und SSE/SSE2 Befehle außen vor lässt). Sind die Operanden größer als 32 Bit, so werden diese in logische Teile ausgeführt und müssen einzeln berechnet werden. Dagegen kann ein 64 Bit Prozessor mit 64 Bit großen Operanden arbeiten und benötigt für die Berechnung demzufolge deutlich weniger Taktzyklen als ein 32Bit Prozessor.
Im 64-Bit Modus werden die bestehenden 32 Bit GPRs auf 64 Bit erweitert und um weitere 8 ergänzt, womit 16 GPRs mit 64 Bit Fassungsvermögen zur Verfügung stehen - das erste Kennzeichen eines 64 Bit Prozessors. Rein theoretisch müsste eine für AMD64 kompilierte und programmierte Anwendung dabei bereits von dem Mehr an Registern, welche als kleine Datenspeicher zu verstehen sind, profitieren.
Der größere Speicheradressraum ist da nur eine nette Erweiterung. Im reinen 64 Bit-Mode können nämlich physisch 2^40 Byte (1024 GByte = 1 TByte) an Arbeitsspeicher adressiert werden, virtuell sind es sogar 2^48 Byte - im 32 Bit Modus sind es nur 2^32 Byte (4 GByte). Hier zeigt sich also bereits der zweite Vorteil der 64 Bit-Architektur. Wirkliche 64 Bit Speicheradressierung bietet derzeit übrigens kaum ein 64 Bit Prozessor - der Athlon 64 (FX) ist da also keine besondere Ausnahme.
Der große Speicheradressraum wird, wenngleich zum jetzigen Zeitpunkt 4 GByte (inklusive Windows Swapfile, welches zum virtuellen Speicherbereich dazuzuzählen ist) noch ausreichen, doch früher oder später nützlich werden.
Dabei bleibt bei AMD64 im Gegensatz zu Intels Itanium IA64 Architektur jedoch volle Kompatibilität zu allen verfügbaren Anwendungen bestehen. Somit ist man nicht von Anfang an gezwungen, ein 64 Bit Betriebssystem und entsprechende Anwendungen zu nutzen, doch wenn es nicht mehr ohne geht, kann dies ganz simpel auf einem System auf Basis der AMD64-Architektur installiert werden. Und selbst dann können weiterhin 32 Bit Anwendungen ausgeführt werden. Zu diesem Zweck stehen verschiedene Betriebsmodi zur Verfügung.
Grundsätzlich unterscheidet AMD zwischen zwei Betriebsmodi, dem „Long Mode“ und dem „Legacy Mode“, die beide wiederum in verschiedene Modi unterteilt sind.
| Operating Mode Operating | System Required Application | Recompile Required | Defaults | Register Extensions | Typical | ||
| Address Size (bits) | Operand Size (bits) | GPR Width (bits) | |||||
| Long Mode | |||||||
| 64-Bit Mode | New 64-bit OS | yes | 64 | 32 | yes | 64 | |
| Compatibility Mode | New 64-bit OS | no | 32 | 32 | no | 32 | |
| no | 16 | 16 | no | 16 | |||
| Legacy Mode Protected Mode | |||||||
| Legacy | 32-bit OS | no | 32 | 32 | no | 32 | |
| no | 16 | 16 | no | 32 | |||
| Virtual-8086 Mode | 32-bit OS | no | 16 | 16 | no | 16 | |
| Real Mode | Legacy 16-bit OS | no | 16 | 16 | no | 16 | |
Der “Long Mode“ besteht aus zwei Modi, dem 64-Bit und dem Kompatibilitäts-Modus. Der 64-Bit Modus unterstützt dabei alle neuen Features und Registererweiterungen der AMD64 Architektur. Hierfür wird ein 64-Bit fähiges Betriebssystem vorausgesetzt und sämtliche Anwendungen müssen neu kompiliert werden, um in diesem Modus zu laufen.
Der Kompatibilitäts-Modus unterstützt unter einem 64-Bit Betriebssystem 32 und 16-Bit Anwendungen. Unter diesem Modus können bisherige 32-Bit Anwendungen ohne ein erneutes Kompilieren genutzt werden, auch wenn das Betriebssystem selbst unter 64-Bit arbeitet. Natürlich machen diese Anwendungen dann jedoch keinen Gebrauch von den neuen Registererweiterungen der AMD64 Architektur und benutzten lediglich 32 oder 16-Bit Adressierung. Der Kompatibilitäts-Modus wird ebenso wie der 64-Bit Modus über eine Code-Segment-Basis durch das Betriebssystem aktiviert. Für eine Anwendung sieht die Umgebung daher wie eine gewöhnliche 32-Bit Umgebung aus. Das Betriebssystem arbeitet aber dann mit den 64-Bit Mechanismen und muss daher eine Übersetzung der Adressierung vornehmen.
Der „Legacy Mode“, der den Betrieb von 16 und 32-Bit Anwendungen unter einem 16 und 32-Bit Betriebssystem sicherstellt, ist wiederum in drei Modi unterteilt, den „Protected Mode“, den „Virtual-8086 Mode“ und den „Real Mode“.
Der „Protected Mode“ unterstützt sowohl 16 als auch 32-Bit Anwendungen, die bis zu 4GB des Speichers belegen können. Hierfür wird ein 32-Bit Betriebssystem benötigt. Die Programme müssen für diesen Modus natürlich nicht neu kompiliert werden, dafür können sie aber auch nicht die neuen Erweiterungen nutzen.
Der „Virtual-8086 Mode“ unterstützt lediglich 16-Bit Programme, die lediglich 1MB des Speichers belegen können. Auch dieser Modus benötigt ein 32-Bit Betriebssystem. Der „Real Mode“ unterstützt ebenso wie der „Virtual-8086 Mode“ nur 16-Bit Anwendungen, dafür jedoch kein Paging und nur simple register-basierende Speicher-Segmentation. Die Programme können auf maximal 1MB Speicher zugreifen. Der „Real Mode“ benötigt ein 16-Bit Betriebssystem. Prozessoren, die die neue AMD64 Architektur implementiert haben, booten im „Legacy Real Mode“, ebenso wie alle anderen Prozessoren, die über die x86 Architektur verfügen.
Natürlich nützt auch der beste 64-Bit Prozessor nichts, wenn er nicht auch durch Betriebssysteme optimal unterstützt wird. Einer der wohl bekanntesten Vertreter ist Windows XP 64-Bit Edition 2003, das AMD seinen Testsystemen in einer Alpha Version mit der Build 1033 beigelegt hat. Es gibt jedoch bereits eine frühe Beta mit der Buildnummer 1069. Diese bietet bereits einige Treiber etwa für VIAs K8T800, nVidias nForce 3 und GeForce FX Karten (Detonator 51.51). Denn hier liegt gleich die erste Hürde eines 64-Bit Betriebssystems. Treiber, die unter 32-Bit Systemen problemlos ihren Dienst verrichteten, sind für 64-Bit Betriebssysteme völlig ungeeignet. Deshalb müssen alle Treiber und der komplette Kernel-Code auf das 64-Bit Systeme portiert und neu kompiliert werden. Dies hört sich einfacher an, als es ist. Bisher stehen hierfür nämlich nur Compiler in Alpha Versionen bereit und auch mit dem einfachen Kompilieren ist der Umstieg längst nicht vollzogen. Der Code muss natürlich angepasst und auf den neuesten Stand gebracht werden. Zudem ist es nicht möglich 32 und 64-Bit Code in einem Programm zu vermischen. Die Programmierer müssen sich für einen der beiden Wege entscheiden und ihre Programme entweder für 32 oder 64-Bit auslegen.
Für Linux 64 gilt dabei im Grunde dasselbe wie für Windows XP 64-Bit Edition 2003. Auch hier müssen die Programme und Treiber angepasst und neu kompiliert werden. Hierfür stehen bisher einige Beta-Compiler zur Verfügung. SuSE ist dabei ein Vorreiter und hat in der Vergangenheit eng mit AMD zusammen gearbeitet. So konnten SuSE und AMD auch zusammen als erstes die SuSE Linux für AMD64 Beta 1.0 veröffentlichen. Red Hat plant ebenso eine AMD64 Version seiner Linux Distribution. Red Hat Advanced Server und Red Hat Workstation sollen dabei zuerst in den Genuss der 64-Bit Unterstützung kommen. Doch auch die Endverbraucher sollen später durch Red Hat mit der AMD64 Technologie vertraut gemacht werden. MandrakeSoft plant ebenso eine Unterstützung, ebenso wie FreeBSD, die bereits an einer Portierung arbeiten. NetBSD hat die Portierung bereits abgeschlossen.
Im Folgenden eine Auflistung der Betreibsysteme, die bereits eine Unterstützung bieten:
| Betriebssystem | Typ |
| SuSE Linux Enterprise Server (SLES) 8 | 32 & 64-Bit |
| SuSE Linux 8.2 Personal & Professional | 32-Bit |
| UnitedLinux Version 1.0 | 32 & 64-bit |
| Conectiva Linux Enterprise Edition | 32-bit |
| Linux AMD64 kernel patches | 64-bit |
| Mandrake Linux 9.0 | 64-bit |
| Mandrake Linux 9.1 | 32-bit |
| Mandrake Linux Corporate Server 2.1 | 32-bit |
| NetBSD | 32 & 64-bit |
| SCO Linux | 32-bit |
| Scyld Beowulf Cluster Operating System | 32-bit |
| Solaris 9 for x86 (32-bit) | 32-bit |
| Turbolinux 8 for AMD64 | 32 & 64-bit |
| Windows 2000 Server (32 bit) | 32-bit |
| Windows Server 2003 (32-bit) | 32-bit |
Des Weiteren folgt eine List der Betriebssysteme, die eine Unterstützung für die Zukunft planen:
| Betriebssystem | Typ | Verfügbarkeit |
| Red Hat Enterprise Linux AS 3.0 | 32- & 64-bit | Beta Mitte 2003 |
| SuSE Linux 8.3 Personal & Professional | 32- & 64-bit | September 2003 |
| Windows XP Professional for AMD64 | 64-bit | Beta Mitte 2003 |
| Windows Server 2003 for AMD64 | 64-bit | Beta Mitte 2003 |
Unter einem 64-Bit Betriebssystem können dann sowohl 32 als auch 64-Bit Anwendungen ausgeführt werden. Ein 32-Bit Betriebssystem ermöglicht es jedoch nicht, 64-Bit Anwendungen auszuführen. Um also einen optimalen Nutzen der neuen Technologie zu erhalten, muss man auf 64-Bit Betriebssysteme umsteigen. Um im 64-Bit Modus allerdings 32-Bit Anwendungen ausführen zu können, muss das Betriebssystem über einen so genannten „Thinking Layer“ verfügen, der alle 32-Bit Kernel Aufrufe enthält. 32-Bit Anwendungen werden automatisch an diesen Layer „weitergeleitet“. Dieser übersetzt die Parameter dann, soweit dies nötig ist, und ruft dann den 64-Bit Kernel auf. Des Weiteren werden die Ergebnisse dann wieder zurück übersetzt - falls notwendig.
Unter Windows XP 64-Bit wird der Modus, um 32-Bit Anwendungen auch auf einem 64-Bit Betriebssystem zu unterstützen, übrigens WoW64 genannt, was soviel heißt wie: „Windows on Windows 64“. Ob diese Technik tatsächlich ohne Leistungseinbußen von Statten geht, wie AMD in ihren Dokumenten immer wieder hervorhebt, werden unsere Benchmarks zeigen, in denen wir auch diesen Punkt behandeln werden. Software, die sich stark ins System einnistet, wie z.B. DirectX oder der Windows Media Player, müssen übrigens zwingend in einer 64-Bit-Variante vorliegen, um installiert werden zu können.
Microsoft hat sein Windows XP 64-Bit Edition 2003 momentan etwas zweigeteilt. So findet sich ein „Program Files“ Ordner speziell für 32 und ein „Program Files“ Ordner speziell für 64-Bit Anwendungen wieder. Auch der Internet Explorer ist bereits in einer 64-Bit Version integriert, aber auch die 32-Bit Version ist noch mit von der Partie.
Da einer Anwendung nicht mehr nur 4GB sondern bis zu 12GB Speicher zugewiesen werden können, hofft AMD auch bei Spielern und den Spieleherstellern, die AMD64 Technologie durchsetzen zu können. Die Unterstützung von Valve hat AMD dabei schon sicher, die aktuell daran arbeiten, die Serverversionen ihrer Spieletitel auf 64-Bit Code zu portieren.
Software Entwickler haben uns jedoch zugetragen, dass sie damit rechnen, dass es Monate dauern wird, bis Programme an den neuen AMD64 Code angepasst sind und Marktreife erreichen. Zur besseren Anpassung der Programme hat AMD so genannte „Key Optimizations“ vorgegeben, die den Rang der Wichtigkeit der Optimierung verdeutlichen sollen. An oberster Stelle steht hierbei „Memory-size Mismacht“, aber auch die SSE und SSE2 Instruktionen werden als sehr wichtig eingestuft. Das liegt vor allem daran, dass unter Windows XP 64-Bit keine FPU/MMX Einheit zur Verfügung steht und entsprechende Befehle über SSE/SSE2 (das macht letztendlich auch die FPU) ausgeführt werden müssen. Hierbei handelt es sich aber weniger um ein Problem vom Athlon 64 sondern vielmehr um eine Eigenart von Windows XP 64-Bit Edition
Für all diejenigen, die vielleicht geneigt sind, selbst etwas mit einigen Compilern herumzuspielen, haben wir die bisher zur Verfügung stehenden Compiler zusammengetragen:
| Compiler | Typ |
| GNU 3.2 C & C++ (g++) & Fortran77 (g77) & Java (gcj) GNU glibc 2.2.5 | 32-bit Linux 64-bit Linux |
| GNU 3.3 C & C++ (g++) GNU glibc 2.3.1 | 64-bit Linux |
| PGI Workstation 5.0 | 32-bit Linux 64-bit Linux 32-bit Windows |
| PGI CDK 5.0 | 32-bit Linux 64-bit Linux |
| Microsoft Visual Studio.NET | 32-bit Windows 64-bit Windows (alpha) |
| Absoft FORTRAN64 | 32-bit Linux 64-bit[Linux 32-bit Windows |
| NAGWare f95 32-bit | 32-Bit Linux 64-bit Linux |
Für Windows existiert also derzeit nur ein Plattform-SDK, welches einen 64-Bit Compiler in einer Alpha-Version und darüber hinaus Visual Studio.Net voraussetzt und auf insgesamt 7 CDs ausgeliefert wird. Gerade Visual Studio.Net konnte sich jedoch aufgrund seiner Komplexität bisher kaum unter den Entwicklern durchsetzen. Noch in diesem Monat wird übrigens die Beta des Plattform-SDK mit einem 64-Bit Beta-Compiler erwartet. Der derzeit schnellste Compiler für die Windows Plattform, Intels C++ und Fortran Compiler, können dagegen noch keinen 64 Bit Code liefern.
Was bringt uns nun 64-Bit überhaupt? AMD selbst gibt auf diese Frage die passende Antwort:
Natürlich wollten auch wir wissen, welche Leistung der Athlon 64 auf einem 64 Bit Betriebssystem mit 64 Bit Anwendungen erbringen kann. Aus diesem Grund haben wir ein System mit Windows XP 64-Bit Edition 1033 (Alpha) mit einem Athlon 64 3200+ aufgesetzt. Für den Test stand uns eine spezielle Version von SiSoft Sandra und Lame zur Verfügung, welche mit dem Microsoft Plattfrom SDK 1039 Alpha Compiler für AMD64 kompiliert wurde.
32 Bit vs 64 Bit - Sandra 200X Arithmetic
Angaben in Punkten
|
Die uns vorliegende Entwicklungsversion von Sandra [18], welche speziell für AMD64 programmiert wurde, liefert klare Resultate - Den klaren Sieg für Windows XP 64 mit 64 Bit Anwendung.
32 Bit vs 64 Bit - Lame
Angaben in Minuten, Sekunden
|
Der MP3-Encoder Lame, welcher aus dem unoptimieren Quellcode heraus kompiliert wurde, bricht dagegen deutlich ein. Das Problem: Lame setzt voll auf die FPU/MMX-Anweisungen, welche unter Windows XP 64 nicht zur Verfügung steht und über SSE und SSE2 emuliert werden müssen.
32 Bit vs 64 Bit - Comanche 4
Angaben in Bildern pro Sekunde (FPS)
|
Auch in Spielen, wo in der Regel kein Quellcode zur Verfügung steht und somit nachträglich keine 64-Bit Version kompiliert werden kann, sieht es nicht viel besser aus. Nicht zuletzt aufgrund recht früher Treiber (Detonator 50.40) ist das Ergebnis eher entäuschend.
Nachdem Intel bereits seit Ende November 2000 ihre Prozessoren mit einem IHS (Integrated Heat Spreader) ausrüstet, hat sich AMD beim Athlon 64 und Athlon 64 FX dazu durchgerungen, seine Prozessoren mit einem entsprechendem Hitzeverteiler auszustatten, welcher zudem den Prozessorkern vor Beschädigungen schützt. Damit schlägt AMD gleich zwei Fliegen auf einen Streich. Doch das ist noch nicht alles. Dadurch, dass das Kühlergewicht nun gleichmäßig über eine große Fläche verteilt wird, ist auch der für Kühler zulässige Anpressdruck erheblich gestiegen. Maximal sind nun 90lb (gut 40kg) möglich, beim Athlon XP sind es gerade einmal 30lb (13,6kg) wobei die Ecken sogar nur 10lb (4,5kg) vertragen. Da konnte eine Erschütterung mit montiertem Kühler schon das Aus für den Kern bedeuten. Der Intel Pentium 4 verträgt übrigens dauerhaft einen Anpressdruck von bis zu 100lb (45kg). Die Masse des Kühlers darf bis zu 450g betragen.
Doch es ist nicht nur der IHS, durch den Freude aufkommt. Insgesamt ist die zulässige Kühlerfläche auf 77x68 mm angestiegen, wobei im Zentrum mindestens eine 40x40 mm ebene Fläche vorhanden sein muss. Durch die größere Kühlerfläche kann auch die anfallende Wärme besser verteilt werden. Die Montage des Kühlers wurde dabei deutlich vereinfacht - ein Schraubenzieher ist nur noch zur Demontage nötig.
Im Rahmen des AMD Athlon 64 Processor Thermal Design Guide (26633) sind sowohl Kupfer- als auch Aluminiumkühler erlaubt, wobei Kupfer natürlich bessere thermische Eigenschaften besitzt. Die zwei von AMD vorgestellten Kühlerreferenzdesigns sehen hierbei günstige Aluminiumkühlkörper vor, die sich im Test als völlig ausreichend erwiesen.
Bei beiden Referenzdesigns sorgt eine auf der Rückseite des Mainboards verschraubte Metallplatte für den nötigen Gegenhalt. Und obwohl der Thermal Design Guide auf Seite 10 von einer zusätzlichen Befestigung mit dem Gehäuse spricht, „[…] the heat sink requires attachment to the motherboard and chassis.“ wollte und konnte keiner der uns vorliegenden Kühler mit dem Gehäuse verschraubt werden. Von AMD empfohlene Kühler stehen dabei von Ajigo [19], AVC [20], CoolerMaster [21], Foxconn [22] und ThermalTake [23] zur Verfügung. Dabei freut es zu hören, dass AMD einen maximalen Schalldruckpegel von 38 dbA verlangt.
Beim Kühlerdesign hat AMD einen großen Schritt nach vorne gemacht, doch wie sieht es mit der thermischen Verlustleistung des Prozessors aus? Gleichen der Athlon 64 und Athlon 64 FX eher einem Heizkraftwerk oder fallen sie nicht einmal im Kühlschrank durch infrarote Wärmestrahlung auf?
Bevor wir die Antwort auf diese Frage geben, möchten wir an dieser Stelle einen Vergleich zum Athlon XP 3200+ ziehen. Dieser besitzt eine maximale thermische Verlustleistung von 76,8 Watt und liegt damit recht deutlich unter dem Pentium 3,2 GHz, welcher typischerweise nicht mehr als 82 Watt benötigt, unter extremen Bedingungen aber auch gerne mal 100 Watt verschlingt. Die Zahlen sprechen hierbei klar für den Athlon XP, doch in der Realität sieht die Sache etwas anders aus: Vom Start weg strahlt der Athlon cirka 50°C ab, beim Pentium 4 sind es 5°C weniger. Eigentlich schon verblüffend und dabei schießen erst die Athlon 64 und Athlon 64 FX Prozessoren den Vogel ab.
Auf Anfrage (in den uns vorliegenden technischen Dokumenten wird kein Wort über die thermische Verlustleistung verloren, bzw. zu einem Dokument verwiesen, auf das wir kein Zugriff haben) teilte uns AMD mit, dass die maximale thermische Leistung von Athlon 64 3200+ und Athlon 64 FX-51 (trotz 200 MHz Taktunterschied) identisch ist. Der Schock: beide Prozessoren sollen Maximal 89 Watt verbraten - über 12 Watt mehr als der Athlon XP, welchen man schon zum Heizen kleinerer Räumlichkeiten nutzen kann.
Während unseres mehrtägigen Testbetriebs konnten wie diese Angabe jedoch nicht ganz verstehen. Mit nie über 60°C wurde die CPU nie wirklich heiß und der Kühlkörper nur leicht erhitzt und das mit einem stark gedrosseltem Lüfter, welcher von der Grafikkarte im Schalldruckpegel ganz locker überboten wird. Klasse gemacht, AMD! Da darüber hinaus der Speichercontroller in den Prozessor gewandert ist, werden auch die externen Chips für die Anbindung von Peripheriegeräten deutlich entlastet, und können damit ohne Probleme passiv gekühlt werden.
In Anbetracht des gebotenen Schalldruckpegels kann man sich beim Athlon 64 (FX) also nur freuen. Der Prozessor bleibt kühl, und die Lüfter drehen entsprechend langsam. Doch das ist noch lange nicht alles. So unterstützt der Athlon 64 (aber nicht der Athlon 64 FX) die Cool“n Quiet Technologie. Hierbei wird der Prozessor - ähnlich zu dem von Notebooks bekannten PowerNow! (AMD) oder Speedstep (Intel) - je nach Belastung mit einem geringeren Prozessortakt und einer kleineren Spannung betrieben. Diese Technologie wird im "BIOS and Kernel Developer's Guide for AMD Athlon 64 and AMD Opteron Processors (26094)" auf Seite 219 im Rahmen der Processor Performance States (P-states), welche gleichermaßen für PowerNow! und Cool“n“Quiet stehen, eingehend erläutert.
Für das Verständnis ist dabei wichtig, dass das Heruntertakten des Prozessors durch das Verändern des Multiplikators und nicht des 200 MHz Referenztaktes erfolgt. Der Arbeitsspeicher und HyperTransport können also weiterhin mit voller Kraft zur Verfügung stehen. Anders ist dies natürlich beim Throttling, welches als Überhitzungsschutz dient, bei dem Prozessortakte ausgesetzt werden.
Die Cool“n“ Quiet Technologie soll im nächsten Jahr dann auch vom Athlon 64 FX unterstützt werden. Ob Athlon 64 oder Athlon 64 FX, in beiden Fällen muss diese Technologie auch vom Mainboard unterstützt werden. Dies ist derzeit allerdings noch nicht immer der Fall. Zum jetzigen Zeitpunkt wird das Feature von AMD gerne gesehen, ab 2004 wird es für alle Mainboards, die von AMD empfohlen werden sollen, Pflicht sein. Bei dem uns vorliegenden Athlon 64 3200+ Mainboard konnten wir beispielsweise noch keine Cool“n“ Quiet Option im BIOS ausfindig machen.
Ein besonderes Feature der gesamten AMD64 Architekturfamilie ist der in den Prozessor integrierte Speichercontroller. Dieser ermöglicht eine direkte Anbindung des Arbeitsspeichers an den Prozessor und minimiert somit die Latenzzeiten beim Zugriff auf den Arbeitsspeicher erheblich. Die Folge ist je nach Anwendung eine deutliche Leistungssteigerung, da das Nachladen von Informationen bedeutend weniger Zeit in Anspruch nimmt. Dies verdeutlichen auch unsere Speicherbenchmarks, welche wir euch nicht vorenthalten wollen:
Science Mark - Latenzen
Angaben in Nanosekunden
|
Science Mark - Bandbreite
Angaben in Megabyte pro Sekunde (MB/s)
|
Besonders bei größeren Datenpaketen muss der Pentium 4 oder auch der Athlon XP deutlich mehr Warteschleifen durchlaufen als dies beim Athlon 64 FX der Fall ist. Der Athlon 64 kann die Ergebnisse dank reaktionsfreudigerem Single Channel-Interface dabei nochmals toppen. Doch zurück zur Theorie.
Obwohl die heute vorgestellten Prozessoren über einen integrierten Speichercontoller verfügen, kann es unter bestimmten Umständen von Vorteil sein, den integrierten Controller durch eine externe Lösung zu ersetzen. Dies ist zum Beispiel dann der Fall, wenn man auf Speicher setzt, den der integrierte Memory-Controller nicht unterstützt. Beispielsweise die im nächsten Jahr erscheinenden DDR2-Module. Wer sich keinen neuen Prozessor kaufen möchte (der diesen Speicher dann unterstützen wird), der könnte durch ein neues Mainboard eine Übergangslösung schaffen. Allerdings ist ein externer Speichercontroller aufgrund der Latenzzeiten immer langsamer als die integrierte Lösung, so dass es im Allgemeinen nicht sinnvoll ist, den integrierten Memorycontroller des Athlon 64 oder Athlon 64 FX zu deaktivieren. Möglich ist es jedoch.
Da der integrierte Speichercontroller mit dem Prozessor gekoppelt ist, ist auch der Takt, mit dem der Speicher angesprochen wird, in gewisser Weise vom Prozessortakt abhängig. Aufgrund der zur Verfügung stehenden, ganzen Teiler wird DDR333 Speicher bei einem mit 2,2 GHz getakteten Athlon 64 FX beispielsweise nur mit einem realen Takt von 157,14 MHz (2,2 GHz geteilt durch 14) betrieben, wie folgende Übersicht zeigt.
| Multiplikator | Prozessortakt | Speichertakt | |||
| 100 MHz | 133 MHz | 166 MHz | 200 MHz | ||
| 4 | 800 MHz | 100.00 | 133.33 | 160.00 | 160.00 |
| 5 | 1000 MHz | 100.00 | 125.00 | 166.66 | 200.00 |
| 6 | 1200 MHz | 100.00 | 133.33 | 150.00 | 200.00 |
| 7 | 1400 MHz | 100.00 | 127.27 | 155.55 | 200.00 |
| 8 | 1600 MHz | 100.00 | 133.33 | 160.00 | 200.00 |
| 9 | 1800 MHz | 100.00 | 128.57 | 163.63 | 200.00 |
| 10 | 2000 MHz | 100.00 | 133.33 | 166.66 | 200.00 |
| 11 | 2200 MHz | 100.00 | 129.41 | 157.14 | 200.00 |
| 12 | 2400 MHz | 100.00 | 133.33 | 160.00 | 200.00 |
| 13 | 2600 MHz | 100.00 | 130.00 | 162.50 | 200.00 |
Rein theoretisch wären hierbei natürlich auch höhere Taktraten möglich. Übrigens gibt es auch bei den Speichertimings Vorgaben, was der integrierte Speichercontoller kann und was nicht. Die üblichen Timings werden jedoch unterstützt, so dass wir an dieser Stelle nicht näher darauf eingehen wollen.
Wie ganz klar aus dem “BIOS and Kernel Developer's Guide for AMD Athlon 64 and AMD Opteron Processors (26094)“ hervorgeht, ist es möglich, dem Prozessor über das MemClk-Register einen höheren Speichertakt, als vom Prozessor erlaubt, zuzuweisen. Bestätigt wird dieser Sachverhalt durch den Northbridge Capabilities Register DramFreq, welchem mit dem Datenbit 00b der Wert „No limit“ zugewiesen werden kann. Dennoch stehen die Chancen eher schlecht, dass in absehbarer Zeit DDR4000 Module erscheinen. Aber immerhin sind ja bereits DDR500 Module von diversen Speicherherstellern (Corsair, OCZ, Kingston) lieferbar.
Obwohl wir in den folgenden zwei Abschnitten detailliert auf den Speichersupport des Athlon 64 FX und des Athlon 64 eingehen, soll an dieser Stelle auf die Theorie verwiesen werden, welche im Vergleich zur Praxis doch leicht abweicht. So gibt es laut “BIOS and Kernel Developer's Guide for AMD Athlon 64 and AMD Opteron Processors (26094)“ in den DRAM Configuration Registers das UnBuffDimm-Bit, welches den Speichercontroller über den installierten Speichertyp in Kenntnis setzt. Je nachdem, ob Registered (Buffered) oder Unbuffered Speicher im System installiert ist, passt sich der Speichercontroller an die Umgebung an. An dieser Stelle stellt sich nur die Frage, warum der Athlon 64 FX in unserem Verständnis der vorliegenden Technischen Dokumente nur mit Registered Speicher betrieben werden kann. Liegt es am Mainboard-Layout oder dem komplizierten Dual Channel Speicherinterface, dass derzeit einfach noch nicht ohne externe Hilfe durch den Speicher selbst zurecht kommt?
Durch einen vom Speichercontroller unterstützten Error Correction Code (ECC) lassen sich 1-Bit-Fehler beim Lesen und Schreiben aus und in den Arbeitsspeicher erkennen und korrigieren, und 2-Bit-Fehler zumindest noch erkennen. Dies wird durch das zusätzliche Speichern von 8 Bit pro 64 Bit Daten ermöglicht. Im Dual Channel Mode steht beim Athlon 64 FX darüber hinaus der ChipKill ECC Mode zur Verfügung. In diesem Fall basiert der ECC-Check nicht auf 64/8 Bit Daten, sondern auf 128/16 Bit Informationen, wodurch ein Single Symbol Error (Reihe von Single Bits) erkannt und korrigiert werden kann. Dies kommt klar der Datenintegrität zu Gute. Leider gab es während unseres Tests erhebliche Stabilitätsprobleme mit beiden ECC-Modes, welche mehrmals zu einem Systemversagen führten und ECC somit als nicht lauffähig zu bezeichnen ist.
Der integrierte Speichercontroller des Athlon 64 FX bietet ein sogenanntes Dual Channel Speicherinterface, bei dem parallel auf zwei Speichermodule geschrieben bzw. gelesen werden kann. Dies hat eine Verdoppelung der theoretischen Speicherbandbreite zur Folge. Beim Einsatz von DDR400 Modulen beträgt diese ganze 6,4 GB/s (2x3,2 GB/s), von denen Messungen zufolge tatsächlich beachtliche 5,7 GB/s zur Verfügung stehen. Im Vergleich dazu erreicht ein Athlon XP 3200+ mit DDR400 Modulen und einem Dual Channel fähigen nForce 2 400 Ultra Chipsatz kaum mehr als 3,1 GB/s. Auch die aktuellen Pentium 4 Prozessoren haben da selbst mit einem i875P Chipsatz das Nachsehen. Mehr als 5,1 GB/s sind da kaum möglich. Der Speichercontroller des Athlon 64 FX weiß also nicht nur in der Theorie sondern auch in der Praxis zu überzeugen.
Verglichen mit dem Athlon XP oder dem Pentium 4 Prozessor, welcher auf externe, in der Northbridge des Mainboards integrierten Speichercontroller setzen, hat die derzeitige Lösung beim Athlon 64 FX im Sockel 940 jedoch einen erheblich Nachteil: Da der Sockel 940 ursprünglich einzig und allein für die Opteron Workstation- und Serverprozessoren entworfen wurde, sehen entsprechende Mainboards auch besonderen Arbeitsspeicher vor, welcher ein höheres Maß an Datenintegrität bietet. Die Rede ist hierbei von so genannten Registered (oder auch Buffered) DDR SDRAM Modulen, welche darüber hinaus über einen Error Correction Code (ECC) verfügen können. Verglichen mit den in Desktop-Computern üblichen Unregistered (Unbuffered) DDR SDRAM Modulen verfügen die für Workstations und Server konzipierten Speichermodule über eine gewisse Intelligenz, ein Register, welches den Speichercontroller bei der Adressverwaltung entlastet.
Damit unterscheiden sich Registered DDR SDRAM Module im Detail doch erheblich von ihren Artgenossen, und fallen aufgrund ihres Einsatzbereiches natürlich auch durch ihren höheren Preis auf.
AMD hat jedoch noch ein weiteres Problem außer dem Preis: Das Joint Electron Device Engineering Council (JEDEC) hat bisher noch keinen Standard für mit 200 MHz getaktete Registered DDR SDRAM Module veröffentlicht, welche der Athlon 64 FX ansteuern kann und mit denen erst das ganze Potential der CPU entfesselt werden kann.
Aus Stabilitätsgründen, begründet durch zunehmendes Signalrauschen, sollte es ursprünglich überhaupt keinen DDR400 Standard geben, welcher jedoch dank Intels Engagement zumindest für normale Unbuffered Module verabschiedet wurde. Bei Registered Modulen sieht es derzeit noch anders aus. So wirft der DDR2 Standard bereits seine Schatten voraus. Erste Chipsätze, die diesen neuen Speicherstandard unterstützen, sollen hier von Intel im zweiten Quartal 2004 verfügbar sein und auch die Speicherproduktion der Speicherhersteller soll bis dahin erste Früchte getragen haben. DDR2 - von Anfang an als Nachfolger von DDR im Mobile, Desktop und Server-Segment konzipiert - ist dabei schon dermaßen greifbar, dass es sehr unwahrscheinlich erscheint, dass es eine Neuauflage des bestehenden Standards für Registered DDR SDRAM Module geben wird.
Dennoch haben sich einige Speicherhersteller dazu entschlossen, entsprechende Registered DDR400 Module in ihr Produktportfolio aufzunehmen. Allerdings ist das Angebot zum jetzigen Zeitpunkt noch mehr als dürftig. Bei Samsung befinden sich entsprechende Module in der „Sampling-Phase“, sollen jedoch noch Ende September 2003 in die Massenproduktion entlassen werden. Infineon dagegen hält sich voll an die Standards und hat derzeit keine DDR400 Speichermodule für den Athlon 64 FX in Planung. Kingston dagegen wird am heutigen Tag unter dem HyperX-Label entsprechenden Arbeitsspeicher präsentieren - die deutsche Pressestelle wusste von dieser Planung jedoch offensichtlich nichts. Bei Twinmos ist man ebenfalls mit der Entwicklung beschäftigt, kann aber noch keine Module liefern. Anfangs sollen darüber hinaus wenn überhaupt nur 512MB Module zur Verfügung stehen, derer man für den Dual Channel Betrieb natürlich zwei benötigt.
Einzig und allein Corsair ist es gelungen, uns rechtzeitig vor dem Start des Athlon 64 FX mit Registered DDR400 Modulen zu versorgen, welche mit den Timings 2.0-3-2-6 vollkommen problemlos betrieben werden können. Schneller geht es kaum noch und dennoch traten bei uns keinerlei Stabilitätsprobleme im normalen Betrieb auf. Dass es nicht immer Registered DDR400 Module sein müssen, um den Athlon 64 FX zum schnellen Arbeiten zu überreden, beweisen die uns vorliegenden Registered DDR333 Module von takeMS, welche im Probelauf durch einen Trick sogar mit realen 200 MHz und den Timings 2.5-4-4-8 betrieben werden konnten.
Deutlich besser sieht es beim Speichersupport des Athlon 64 aus. Dieser begnügt sich mit handelsüblichem DDR SDRAM, kann auf Wunsch jedoch auch mit ECC Speicher bestückt werden. Derzeit werden Module mit einem Takt von bis zu 200 MHz unterstützt, wobei im Vergleich zum Athlon 64 FX jedoch nur ein einfaches Single Channel Speicherinterface zur Verfügung steht, welches ein einfacheres Leitungsrouting ermöglicht und auch den Speichercontroller weitaus weniger fordert. Mit DDR400 Modulen liegt die theoretische Speicherbandbreite bei 3,2 GB/s, welche in der Praxis mit 3,0 GB/s annähernd erreicht wird. Durch die einfachere Datensynchronisation, verglichen mit einem Dual Channel Interface, kann der Athlon 64 dem Athlon 64 FX in den Latenzzeiten sogar deutlich davonziehen. Wo der Athlon 64 FX noch 146 Taktzyklen benötigt, ist der Athlon 64 bereits nach beeindruckenden 92 Takten am Ziel angekommen.
Die uns für diesen Test zur Verfügung gestellten Corsair TWINX1024-3200LL und die Twinmos 512 MB Twister 3200 CL2 machten hierbei selbst bei schnellen Timings keinerlei Probleme mit dem Athlon 64 und eignen sich entsprechend gut für diesen Prozessor.
Für die Kommunikation mit der Außenwelt sorgt beim Athlon 64, Athlon 64 FX oder Opteron der neuartige HyperTransport I/O-Bus, den nVidia beispielsweise bei seinen nForce 2 Chipsätzen zur Kommunikation zwischen North- und Southbridge nutzt.
Bei HyperTransport handelt es sich um einen seriellen Bus, der keinerlei Ambitionen hat, dem AGP, PCI, PCI-X oder PCI Express Standard gefährlich zu werden. Vielmehr möchte der HyperTransport-Bus über eine Punkt-zu-Punkt-Verbindung I/O-Chips, welche z.B. AGP, PCI oder PCI-Express zur Verfügung stellen, möglicht schnell an den Prozessor anbinden. Entsprechend hoch ist auch die theoretisch mögliche Bandbreite, doch dazu später mehr. Hierbei kann HyperTransport von jedem angeschlossenen I/O-Chip mit HyperTransport-Anbindung weitergeleitet, „getunnelt“, werden. Rein theoretisch können auf diese Art und Weise bis zu 31 Tunnel-Geräte angeschlossen werden, welche allesamt direkt mit dem Prozessor oder dem durch ihn verwalteten Arbeitsspeicher kommunizieren können.
Im Gegensatz zu einem parallelen Bus wie dem PCI oder dem allseits bekannten LPT1 Druckerport, erreicht HyperTransport seine Geschwindigkeit nicht durch möglichst viele parallele Datenleitungen, sondern durch einen besonders hohen Takt. Während beim PCI Standard beispielsweise ein 32bit breiter Bus mit 33 MHz betrieben wird, und so eine theoretische Bandbreite von 133 MB/s erreicht, kann bei HyperTransport eine Datenleitung (bestehend aus vier einzelnen Leitungen) alleine in der vollen Ausbaustufe eine Übertragungsrate von 200 MB/s in beide Richtungen erreichen.
Der aktuelle HyperTransport-Standard sieht hierbei 2, 4, 8, 16 und 32 Bit breite Verbindungen mit einem Takt von 200, 400, 600 oder gar 800 MHz vor. Pro Takt können hierbei zwei Informationen (Double Data Rate) übertragen werden. Dabei muss übrigens ein mit einem 16 Bit breiten Interface angeschlossenes Gerät HyperTransport nicht mit der gleichen Busbreite weiter reichen. So gibt z.B. der von AMD entwickelte AGP3.0 Graphics Tunnel Chip (AMD-8151) von den eingehenden 16 Bit nur 8 Bit weiter, an die dann ein weiteres HyperTransport Gerät angeschlossen werden kann.
Ebenso müssen auch die Up- und Downstream-Verbindung nicht die selbe Bitbreite besitzen. Wenn man z.B. von vornherein weiß, dass ein Chip in erster Linie Daten anfordert und eher wenig sendet, können beim Upstream (Rückkanal) Datenleitungen eingespart werden.
| Bus Width (Each Way) | 2 | 4 | 8 | 16 | 32 | |
| Data Pins (total) | 8 | 16 | 32 | 64 | 128 | |
| Clock Pins (total) | 4 | 4 | 4 | 8 | 16 | |
| Control Pins (total) | 4 | 4 | 4 | 4 | 4 | |
| Subtotal (High Speed) | 16 | 24 | 40 | 76 | 148 | |
| VLDT | 2 | 2 | 3 | 6 | 10 | |
| GND | 4 | 6 | 10 | 19 | 37 | |
| PWROK | 1 | 1 | 1 | 1 | 1 | |
| RESET_L | 1 | 1 | 1 | 1 | 1 | |
| Gesamt-Pinanzahl | 24 | 34 | 55 | 103 | 197 | |
| Max Bandbreite (GB/s) | 0,8 | 1,6 | 3,2 | 6,4 | 12,8 | |
Die theoretische Bandbreite einer 32 Bit HyperTransport Anbindung mit 800 MHz Takt liegt hierbei bei 800 MHz x 2 (Double Data Rate) x 32 Bit (Busbreite) / 8 (Umrechnung Bit auf Bytes) = 6,4 GB/s. Da HyperTransport einen unabhängig voneinander arbeitenden Up- und Downstream besitzt, und das gleichzeitige Senden und Empfangen von Daten möglich ist, ergibt sich eine Gesamtbandbreite von 12,8 GB/s.
Alle AMD Opteron-Prozessoren besitzen drei 16 Bit HyperTransport-Anbindungen, der Athlon 64 muss sich dagegen ebenso wie der Athlon 64 FX mit nur einem 16 Bit breiten HyperTransport-Kanal, welcher mit 800 MHz betrieben werden kann, begnügen. Dadurch ergibt sich beim gleichzeitigen Senden und Empfangen von Daten eine maximal 6,4 GB/s schnelle Verbindung mit der Außenwelt, an die entsprechende Tunnel-Chips, über die AGP oder PCI realisiert wird, angeschlossen werden können.
| Athlon 64 | Athlon 64 FX | Opteron 1XX | Opteron 2XX | Opteron 8XX |
| HyperTransport Technologie | ||||
| Ja | Ja | Ja | Ja | Ja |
| HyperTransport Links (total/kohärent*) | ||||
| 1/0 | 1/0 | 3/0 | 3/1 | 3/3 |
| HyperTransport Linkbreite (Up-/Downstream) | ||||
| 16bits/16bits | 16bits/16bits | 16bits/16bits | 16bits/16bits | 16bits/16bits |
| HyperTransport Bus Frequenz | ||||
| 800MHz | 800MHz | 800MHz | 800MHz | 800MHz |
* Für Multi-Prozessor-Betrieb notwenig
Laut Seite 48 des BIOS and Kernel Developer's Guide for AMD Athlon 64 and AMD Opteron Processors (26094) hat man übrigens schon vorgesorgt und hat bereits entsprechende Bits für einen 1000 MHz schnellen HyperTransport-Bus definiert.
Der Athlon 64 besitzt eine Thermal Diode direkt auf dem Die, von der sowohl die Anode als auch Kathode über Pins nach außen geführt werden. Über diese Diode können Programme dann die Temperatur des Prozessors auslesen. Diese Diode hat eine Genauigkeit von ±10°C und muss für jeden Prozessor einzeln justiert werden. Über das Intervall, in dem Temperaturmessungen vorgenommen werden, schweigen sich die bislang erhältlichen Dokumente von AMD leider aus.
Zudem verfügt der Prozessor über eine hardwareseitige Notabschaltung, die über das THERMTRIP#-Signal ausgelöst wird. Sobald der Prozessor eine bestimmte Temperatur erreicht, schützt sich der Prozessor selbst vor einer Beschädigung durch zu hohe Temperaturen und schaltet ab. Doch auch das „Throttling“ beherrscht der Athlon 64 und kann so CPU-Takte auslassen, was zwar dazu führt, dass die Leistung einbricht, den Prozessor jedoch herunterkühlt. Dies kann sowohl mittels Software als auch direkt von der CPU bei zu hohen Temperaturen durch das THERM#-Signal ausgelöst werden. Schaltet das System in den S1, S3 oder S5 Modus um, setzt das „Throttling“ aus. Sobald der S1, S3 oder S5 Modus jedoch wieder verlassen wird, setzt auch das „Throttling“ wieder ein. Leider konnten wir bisher auch keine offiziellen Angaben ausfindig machen, die Aufschluss darüber geben, ab welcher Temperatur das Throttling genau einsetzt, und wann es zu einer Notabschaltung kommt.
Unter dem Parameter „CPULowPwrEn“ (CPU Low Power Enable) verbirgt sich die Funktion, mit welcher der CPU-Takt heruntergesetzt werden kann. Bit 0 deaktiviert den CPU Low Power Status, 1 aktiviert ihn. Das Heruntertakten geschieht dann gegebenenfalls über einen Teiler, der im Clock Divisor Select (ClkSel) Parameter festgesetzt wird. Über diesen wird sowohl der Teiler für das Heruntertakten der Northbridge als auch der CPU festgelegt. Mögliche Teiler sind 8, 16, 32, 64, 128, 256 und 512. Soll die Northbridge heruntergetaktet werden, so muss dies über den Northbridge Low Power Enable (NBLowPwrEn) Parameter geschehen. Wird dieser Modus aktiviert, wird der DRAM gleichzeitig in den „self-refresh“ Modus versetzt. Um die Northbridge über den ClkSel Parameter herunterzutakten, muss auch die CPU im gleichen Verhältnis im Takt gesenkt werden.
Im „Thermtrip Status Register“ wird zudem beispielsweise der „Diode Offset“ festgehalten, der festlegt, inwiefern die ausgelesenen Temperaturen einer zusätzlichen externen Diode korrigiert werden sollen. So kann die Temperatur für jeden Prozessor einzeln justiert und etwa um einige Grad angepasst werden, so dass sie dann die tatsächliche Temperatur des DIEs wiederspiegelt.
War der Athlon XP nicht ein Segen für die Overclocking-Gemeinde? Die ersten Versionen konnten durch das Verbinden der L1-Bücken zur freien Multiplikatoranwahl gebracht werden, bei den neuen in 0,13µm gefertigten Athlon XP Prozessor-Kernen war eine freie Wahl des Taktmultiplikators sogar ab Werk möglich - einfacher geht es schon gar nicht mehr.
Beim Athlon 64 und dem Athlon 64 FX sieht das Ganze etwas anders aus. Wie aus den “Clock Generator Specification for AMD Athlon 64 and AMD Opteron Processors (24707)“ deutlich hervorgeht, sollten die Athlon 64, Athlon 64 FX und Opteron Prozessoren mit einem Referenztakt von 200 MHz versorgt werden. Dieser wird intern Multipliziert und ergibt den Arbeitstakt des Prozessors. Verändert man diesen Referenztakt, so verändert sich natürlich auch der Prozessortakt und damit verbunden auch der Takt der HyperTransport-Verbindung ebenso wie der des Arbeitsspeichers - diese werden damit ebenfalls außerhalb der Spezifikationen betrieben. Allerdings stehen auch für HyperTransport und Arbeitsspeicher verschiedene Multiplikatoren bzw. Teiler zur Verfügung. Bei HyperTransport stehen die Multiplikatoren 1x, 2x, 3x und 4x zur Verfügung. Erhöht man beispielsweise den Systemtakt auf 266 MHz (was bei den vorgegebenen Multiplikatoren von 10 (Athlon 64 3200+) und 11 (Athlon 64 FX-51) jedoch keine CPU schaffen wird) könnte HyperTransport mit einem korrekten Takt von 800 MHz betrieben werden. Auch beim Arbeitsspeicher stehen die passenden Teiler zur Verfügung. Rein theoretisch könnte man damit den Prozessor selbst übertakten, ohne dabei externe Verbindungen außerhalb der Spezifikationen zu betreiben.
Das ist nicht alles! Rein theoretisch, müsste in unserem Verständnis des „BIOS and Kernel Developer's Guide for AMD Athlon 64 and AMD Opteron Processors (26094)“ im Rahmen der durch Cool“n“ Quite Technologie auch das Justieren des Multiplikators im BIOS möglich sein - muss aber nicht zwingend auf Prozessoren mit dieser Technologie beschränkt sein.
Da bei allen Cool“n“ Quite Athlon 64 Prozessoren jedoch in den Power Management Control Registers das Feld FID/VID Change Enable (FidVidEn) den Wert 1 enthält, steht einer Veränderung des Multiplikators nichts im Wege. Über die FIDVID_CTL Register, kann dem Prozessor über das NewFID Feld ein neuer für den Moment gültiger Multiplikator zugewiesen werden. Der kleinste verfügbare Wert ist hierbei die Bitfolge 00_0000b welche für einen Multiplikator von 4x steht. Der Maximalwert ist jeweils der Standardmultiplikator des Prozessors (MaxFID). Nach unten hin ist also theoretisch eine freie Multiplikatorwahl möglich.
Auf diese Art und Weise ließe sich der Frontside-Bus rein theoretisch so weit anheben, dass andere Komponenten wie HyperTransport oder Arbeitsspeicher mit ihrem korrekten Takt angesprochen werden können. Dabei sollte man jedoch nicht vergessen, dass die Komponenten im Prozessor, d.h. z.B. die integrierte Northbridge, welche mit vollem Prozessortakt betrieben wird, außerhalb der Spezifikationen angesprochen wird.
Angenommen, der Prozessor lässt sich auf bis zu 2,4 GHz übertakten, wird aber mit einem Standardmultiplikator von 11 ausgeliefert, so könnte man den Multiplikator auf 9 herabsetzen, den Frontside-Bus hoch auf 266 MHz und wählt für HyperTransport den Multiplikator 3 (für einen Takt von 800 MHz) und für den Arbeitsspeicher den Teiler 3/4 um den korrekten Takt für DDR400 zu erhalten.
Die Sache hat nur einen Haken: Keines der uns bisher vorliegenden Mainboards bietet im BIOS entsprechende Optionen zur Veränderung des Multiplikators (FID) an. Dass die Mainboard-Hersteller diese Möglichkeit übersehen haben sollen, können wir eigentlich nicht glauben, dennoch wird im Rahmen der Cool“n“ Quite Technologie, welcher der Athlon 64 (aber nicht der Athlon 64 FX) definitiv unterstützt, der Multiplikator und die Spannung zum Stromsparen verändert. Die Cool“n“ Quite Technologie lässt sich jedoch ebensowenig im BIOS aktivieren, so dass wir zum jetzigen Zeitpunkt davon ausgehen, dass die ersten Sockel 754 Platinen sie noch nicht zu unterstützen scheinen, und deshalb auch keine Option zum Verändern des Multiplikators anbieten.
Keinem Entwickler, sei es Hard- oder Software, fällt es leicht, Fehler in seinem gehegten und gepflegten Kind zuzugeben. Doch aus Fehlern kann man bekanntlich lernen und diese bei der nächsten Programmversion oder dem nächsten Prozessorstepping (quasi die Versionsnummer eines Prozessorkerns) beseitigen. Laut dem „Revision Guide for AMD Opteron Processors (25759)“, der gleichermaßen für den Athlon 64 FX zu gelten scheint, haben sich im ersten, öffentlichen Prozessorstepping B3 insgesamt 31 Fehler eingeschlichen. Dieses Stepping kommt derzeit nur bei den Opteron Prozessoren zum Einsatz. Seit August diesen Jahres wird in diesem Dokument schon das neue C0 Stepping geführt, welches auch bei dem uns vorliegenden Athlon 64-FX zum Einsatz kommt. Das C0 Stepping kommt nur noch mit insgesamt 18 bekannten Fehlern daher, von denen bei 6 keine Fehlerbeseitigung geplant bzw. möglich ist. AMD hat also nicht weniger als 13 Fehler beseitigt, darunter auch diverse Probleme mit dem Arbeitsspeicher, welche Teilweise einen Systemstillstand zur Folge hatten, weil bestimmte Spezifikationen nicht eingehalten wurden: „Memory Latency with Processor Power States“, „Registered DIMM Exit-Self-Refresh Requirements Not Met“, „Registered DIMM Initialization Requirements Not Met“. Glücklicherweise konnten diese Probleme jedoch rechtzeitig beseitigt werden. Die verbleibenden 18 Errors sind dagegen weniger kritisch, können jedoch unter bestimmten Umständen ebenfalls zu einem Absturz führen - das ist beim Pentium 4 Prozessor jedoch ebenso der Fall.
| Fehlerbeschreibung | Betroffene Revision | |
| SH7-B3 | SH7-C0 | |
| 1 Inconsistent Global Page Mappings CanLead to Machine Check Error | No fix planned | |
| 51 Arbitrated Interrupt With Illegal Vector SetsAPIC Error Bit In All Processors | X | X |
| 57 Some Data Cache Tag Eviction Errors Are Reported As Snoop Errors | No fix planned | |
| 58 Memory Latency with Processor Power States | X | |
| 60 Single Machine Check Error May Report Overflow | No fix planned | |
| 61 Real Mode RDPMC with Illegal ECX May Cause Unpredictable Operation | X | |
| 62 Task Gates With Breakpoints Enabled May Cause Unexpected Faults | X | |
| 63 TLB Flush Filter Causes Coherency Problem in Multiprocessor Systems | X | |
| 64 Single Step Across I/O SMI Skips One Debug Trap | X | |
| 65 Uncorrectable NB Machine Check Error May Disrupt Power Management | X | |
| 66 Upstream Read Response Delayed by Downstream Posted Writes | X | |
| 68 Disable DQS Hysteresis Bit Not Readable | X | |
| 69 Multiprocessor Coherency Problem with Hardware Prefetch Mechanism | X | |
| 71 RSM from SMM with Paging Enabled May Deadlock | X | |
| 74 Registered DIMM Exit-Self-Refresh Requirements Not Met | X | |
| 75 APIC Timer Accuracy Across Power Management Events | No fix planned | |
| 76 APIC Timer Undercounts In Divide-by-8 Low Power Mode | X | |
| 77 Long Mode CALLF or JMPF May Fail To Signal GP When Callgate Descriptor is Beyond GDT/LDT Limit | No fix planned | |
| 78 APIC Interrupt Latency With C2 Enabled | X | X |
| 79 Power Management Limitations Above 1.50V | X | X |
| 80 Registered DIMM Initialization Requirements Not Met | X | |
| 81 Cache Coherency Problem with Hardware Prefetching and Streaming Stores | X | |
| 82 Certain Faults On Far Transfer Instructions In 64-Bit Mode Save Incorrect RIP | X | |
| 83 DC Machine Check Extended Error Code Bit Not Writeable | X | X |
| 88 SWAPGS May Fail To Read Correct GS Base | X | X |
| 89 Potential Deadlock With Locked Transactions | No fix planned | |
| 90 False IC Machine Check Overflow Error Logged On Reset | X | X |
| 91 Software Prefetches May Report A Page Fault | X | X |
| 92 Deadlock In Multi-Processor Systems May Occur When Earlier Operations Prevent An Older Store From Writing Data | X | X |
| 94 Sequential Prefetch Feature May Cause Incorrect Processor Operation | X | X |
| 95 RET Instruction May Return To Incorrect EIP | X | X |
| 97 128-Bit Streaming Stores May Cause Coherency Failure | X | |
| 98 LDTSTOP Assertion May Be Missed | X | |
Mit welchen Fehlern der Athlon 64 behaftet ist, können wir dagegen nicht sagen. Auch wenn er vom selben Silizium wie der Athlon 64 FX oder der Opteron kommt, so findet er doch in einem völlig anderen Gehäuse Platz und wird auch mit anderem Arbeitsspeicher betrieben.
Mit dem Opteron und den neuen Prozessoren der Athlon-Familie, Athlon 64 und 64 FX, führte AMD nicht nur eine neue Architektur, genannt AMD64, sondern auch eine neue, fortschrittlichere Fertigungstechnik ein. Diese hört auf den Namen Silicon on Insulator, kurz SOI.
Um den Sinn hinter dieser neuen Technik zu verstehen, muss man zunächst einen Blick auf die heute normale Fertigungstechnik Namens CMOS (Complementary Metal-Oxide Semiconductor-Technologie) werfen. Dies ist eine direkte Weiterentwicklung der alten MOS-Technik, die man bei Prozessoren mit einer Taktrate von bis zu 1GHz einsetze. Sie funktioniert folgendermaßen: In heutigen Transistoren befindet sich auf der Siliziumschicht eine dünne Leiterschicht aus einem Metalloxid, da reines Silizium bekanntlich keinen Strom leiten würde. Um den Strom durch den Transistor weiterzuleiten, fügt man gewollt Unreinheiten in das Substrat ein, um somit eine Leitfähigkeit zu erzeugen. Die Leitfähigkeit des gesamten Transistors wird hingegen wieder von einer Metallschicht und eben jener Metalloxid-Schicht bestimmt. Legt man eine Spannung an die obere Metallschicht an, so lässt die darauf folgende Metalloxid-Schicht den Strom passieren und sorgt somit für einen aktiven Stromfluss.
(Quelle: IBM)
CMOS dreht nun die Verhältnisse um. Während MOS noch relativ hohe Spannungen brauchte, um eine Leitfähigkeit zu erzielen, nutzt CMOS genau das Gegenteil. Kombiniert man also Transistoren beider Techniken, so lassen sich effektive und schnell taktende Prozessoren entwickeln. Jedoch führt dies auch zu einigen Problemen. So bestand das Metalloxid bis vor einiger Zeit noch aus Aluminium und wurde später durch Kupfer, welches eine bessere Leitfähigkeit besitzt, ersetzt. AMD machte diesen Schritt erstmals mit dem Thunderbird auf dem Sockel A. Ebenfalls sah man schon damals, dass man wohl mit der fortschreitenden Verkleinerung der Leiterbahnen hin zur 90nm-Technik auf weitere Probleme stoßen würde. Silicon on Insulator wurde geboren und soll die bei der CMOS-Technik auftretenden Probleme lösen.
(Quelle: IBM)
Silicon on Insulator soll nun die Schaltzeiten eines Transistors stark verbessern. Eines der Probleme der CMOS-Architektur war, dass jedes Medium, welches Strom leitet, auch automatisch Strom speichert. So dauerte es beim CMOS-Standard länger die gespeicherte Ladung vollkommen aus dem Bauteil herauszubekommen, als den Transistor wieder mit einem neuen Schaltvorgang zu belegen. Ebenfalls dauerte es recht lange den Transistor so zu laden, dass er fähig war einen Schaltvorgang hervorzurufen. Die technischen Vorzüge der SOI-Technik sind auf dem unteren Bild sehr gut zu erkennen. Während sich beim CMOS-verfahren (links) bei den beiden Unreinheiten links und rechts noch eine Spannung aufbaute, so umgeht die SOI-Technik dies, indem sie eine Schicht Oxid (oftmals Glas oder Siliziumoxid) auf dem Silizium-Substrat, welches hier als Isolator fungiert, platziert. Durch dieses Verfahren wird verhindert, dass sich Spannungen innerhalb des Transistors so aufbauen, dass sie der Schaltzeit des Gesamtwerkes negativ im Wege stehen könnten. Der Transistor kann nunmehr also schneller schalten und somit ebenfalls weit höhere Taktraten erlauben. Die elektrische Kapazität dieses Stromkreises wäre also sehr gering im Vergleich zur betagten CMOS-Technik. Bei IBM spricht man von 20 bis 25% Geschwindigkeitsvorteil der SOI-Technik gegenüber dem Vorgänger.
(Quelle: IBM)
Während Apple zur Zeit die neuesten Prozessoren für ihre G5-Rechner bei IBM fertigen lässt, ließ sich AMD ebenfalls von Big Blue unter die Arme greifen, und zog die Fachmänner dieser Firma gegen harte Dollars zur Hilfe und Optimierung des eigenen SOI-Prozesses heran.
Eines der Probleme der Silicon on Insulator-Technik ist der hohe Preis der Wafer. So kosten diese zu diesem Zeitpunkt noch en Vielfaches der alten und wirken sich somit nicht positiv auf den Preis des daraus resultierendes Prozessors aus. Doch wie werden diese Wafer überhaupt hergestellt? Wir erklären es euch:
Zur Zeit gibt es mehrere Methoden, um einen Wafer der SOI-Technik herzustellen. IBM selbst nutzt laut eigenen Whitepaper-Angaben eine Technik Namens SIMOX, Separation by Implantation of Oxygen. Bei diesem Verfahren wird bei extrem hohen Temperaturen eine Schicht reinster Sauerstoff auf eine Siliziumschicht aufgetragen. Unter diesen hohen Temperaturen verbinden sich Silizium und Sauerstoff zu jenem Oxid der SOI-Technik. Die so erzeugte SOI-Schicht muss dann nur noch auf einen normalen Silizium-Wafer aufgetragen werden. IBM behauptet sogar, dass man durch dieses Verfahren eine gleich hohe Ausbeute hat wie bei den normalen Wafern.
Eine weitere Technik zur Herstellung von SOI-Wafern ist BESOI, Bond and etch-back SOI. Bei dieser Technik werden zwei Wafer genommen und beide mit einer Oxidschicht unter zur Hilfenahme der Van der Waals-Kräfte zusammengefügt. Um eine angemessene Dicke des Wafers zu erzeugen, wird einer der beiden vor oder nach der Zusammenfügung maschinelles Abschleifen und Polieren auf eine Dicke von knapp 0,1µm geschrumpft. Mit diesem Verfahren ließen sich in der Vergangenheit qualitativ hochwertigere, aber auch teurere Wafer herstellen. Mittlerweile ist aber auch die SIMOX-Technik fortgeschritten und erzeugt Wafer mit gleicher Qualität.
Des Weiteren gibt es zwei verschiedene Modi, in denen Transistoren auf Basis der SOI-Technik hergestellt werden können. AMD nutzt die „half depleted“-Technik für die Produktion der aktuellen Opteron, Athlon 64 und Athlon 64 FX Prozessoren. Ob ein Transistor half oder fully depleted ist bestimmt letztendlich die Dicke der verwendeten Silizium-Schicht. Die Vorteile der Transistoren, deren Silizium-Schicht besonders gering ist (fully depleted), liegen dabei auf der Hand. So weisen diese Transistoren eine geringere Schaltzeit auf und verbrauchen weniger Strom. Ebenfalls wird die minimale Spannung, die für einen Schaltvorgang benötigt wird, herabgesetzt. Intel will ab dem Jahr 2005 voll auf diese Technik setzen, während AMD im Moment im Half-depleted-Modus produziert. Der größte Vorteil dieser Technik ist der geringere Kostenaufwand bei der Produktion. Ebenfalls sind diese Transistoren leichter anzusteuern, da die minimal benötigte Spannung nicht so großen Fluktuationen unterzogen ist wie bei der Fully-depleted-Technik. Der größte Vorteil liegt jedoch darin, dass man größtenteils auf Wafer aufbauen kann, die im kostengünstigen und ebenso effektiven SIMOX-Verfahren hergestellt wurden. Für die Herstellung von Transistoren im Fully-depleted-Verfahren sind hingegen komplizierter aufgebaute Wafer nötig.
Silicon on Insulator gehört die Zukunft. Nicht zuletzt wird die Betagtheit des alten CMOS-Prozesses der neuen SOI-Technik den Weg ebnen, auch die vielen Vorteile dieser Technik dürften für sich sprechen. In den letzten Jahren gab es jedoch immer wieder Probleme mit der Massenproduktion dieser Transistoren, ein Grund für die verspätete Veröffentlichung AMDs neuester Prozessoren auf Basis der AMD64-Architektur. Nun, im Jahre 2003, scheint man dieser Probleme jedoch Herr geworden zu sein und startete bereits mit der Massenproduktion. So laufen schon seit einigen Monaten bei AMD Opteron-Prozessoren auf Wafern aus dem schönen Dresden vom Band und auch IBM produziert seit einiger Zeit Prozessoren auf Basis der SOI-Technik für Apple. Die Tatsache, dass sich auch bald Intel diesem Fertigungsprozess anschließen möchte, zeigt weiterhin das vorhandene Potential, wenn es um höhere Schaltzeiten von Transistoren und den damit verbundenen Mehrleistungen bei Prozessoren geht.
Wie sieht es nun mit der Zukunft der Athlon XP, Athlon 64, Athlon 64 FX und der Opteron Prozessoren aus? Mit Sicherheit kann man das wohl nicht sagen. Schließlich ist von den ursprünglichen Plänen der Hammer-Architektur, welche im November 2002, also vor gut einem Jahr, vorgestellt wurden, wie bereits Eingangs erwähnt nicht mehr allzuviel übrig geblieben. Den Blick in die Zukunft möchten wir daher anhand der derzeit offiziellen Roadmap, welche auch öffentlich über AMDs Webseite erreichbar ist, und internen Produktfahrplänen wagen.
Der öffentliche Fahrplan von AMD wurde zuletzt am 14. Mai 2003 auf Vordermann gebracht, und wird deshalb die Zukunftspläne eher im Groben abstecken, als konkrete, verlässliche Termine zu nennen. Schon in diesem Halbjahr gibt es erste Abweichungen. Ursprünglich geplant waren hier die Vorstellung eines „AMD Athlon 64“ und „Mobile AMD Athlon 64“, doch auch ein Athlon 64 FX wurde am heutigen Tage vorgestellt. Auch ein neuer Duron-Prozessor, welcher mit bis zu 1,8 GHz taktet und mit 2x64kB L1- und 64kB L2-Cache daher kommt, hat vor Kurzem das Licht der Welt erblickt. Das untere Preissegment für Desktop- und Mobile-Prozessoren wird jedoch durch das „As market requires“ - „Wie der Markt es verlangt“ - Prinzip berücksichtigt. Auch das Ende des Pfeils deckt sich mit den neuesten Meldungen: Der neue Duron soll bereits zum Jahresende wieder eingestellt werden. Bis auf den Lapsus mit dem Athlon 64 FX lag die Roadmap bisher also goldrichtig. Im ersten Halbjahr 2004 ist dann der offizielle Wechsel weg von der 130nm SOI-Fertigung, hin zur 90nm SOI-Fertigung, vorgesehen. Der aktuelle Opteron-Kern (Codename Sledgehammer) wird durch den „Athens“ und der Athlon 64-Kern (Codename Clawhammer) durch den „San Diego“ bzw. „Odessa“ beim Mobile Athlon 64 abgelöst. Der Athlon MP soll je nach Kundenverlangen bis Mitte 2004 produziert werden, beim Athlon XP scheint eine Auslieferung bis Ende 2004 als gewiss. Bis zu diesem Punkt ist also alles höchst offiziell. Wie sieht es nun hinter vorgehaltener Hand aus?
An dieser Stelle möchten wir ein paar Informationen aus den uns zugespielten internen Roadmaps des Prozessorherstellers entnehmen. Zum Einstieg sollen hierbei die geplanten Lieferzahlen an den Einzelhandel und OEMs bis Mitte 2004 dienen:
| Prozessor | Q3'03 | Q4'03 | Q1'04 | Q2'04 |
| Athlon XP 266 | 4685 | 2505 | 1045 | 0 |
| Athlon XP 333 | 3321 | 4481 | 4195 | 1818 |
| Athlon XP 400 | 274 | 488 | 1161 | 582 |
| K8 754 | 70 | 433 | 1320 | 3600 |
| K8 939 | 0 | 0 | 300 | 1350 |
| K8 940 | 10 | 25 | 30 | 0 |
Im dritten Quartal (Juli-September) bilden die „langsamen“ und vergleichsweise günstigen Athlon XP Prozessoren bis 2600+ den Löwenanteil der ausgelieferten Chips, die CPUs Athlon XP 2600+ bis 3000+ mit einem 333 MHz schnellen Frontside-Bus sind mit 40 Prozent jedoch recht deutlich am Umsatz beteiligt. Die geplante Auslieferung von 274.000 Athlon XP 3200+ und XP 3000+ (erst seit kurzem als 400 MHz FSB Version verfügbar) fällt da kaum ins Gewicht. Auch die 80.000 Athlon 64 (FX) Prozessoren sind da nur ein Tropfen auf den heißen Stein. Im vierten Quartal 2003 werden die Athlon XP 333 MHz FSB Prozessoren zum „Mainstream“-Produkt. Bis zum Ende des ersten Quartals 2004 sollen die Athlon XP Prozessoren das Hauptgeschäft im Desktop-Segment des Halbleiterherstellers bilden. Erst dann wird das Blatt eine rasante Wendung nehmen, für die es Gründe gibt - neue Prozessoren. Dazu jedoch später mehr. Die Produktpalette der langsamen Athlon XP soll offenbar im zweiten Quartal des kommenden Jahres eingestellt werden - bis dahin sollten alle neu ausgelieferten Systeme ohnehin mit modernen Hauptplatinen und Arbeitsspeicher versehen sein. Im zweiten Quartal sollen nur noch 32 Prozent der ausgelieferten Prozessoren Athlon XP sein - der Athlon 64 wird zum Trumpf!
Doch Vorsicht! Athlon 64 ist nicht gleich Athlon 64. Außerdem scheint man inoffiziell von der Aussage „AMD64 in allen Produktsegmenten“ bereits wieder abgekommen zu sein. Aufgrund des im Prozessor integrierten Speichercontrollers muss man hier von Anfang an zwischen der Dual-Channel-Version, dem Athlon 64 FX, und der Single-Channel-Variante, dem Athlon 64, unterscheiden. Beide Prozessortypen basieren derzeit, geht man nach den Datenblättern, auf dem gleichen „Clawhammer“-Kern. Nichtsdestotrotz ähnelt der Athlon 64 FX in gewissen Punkten, insbesondere dem Sockel und dem Speichersupport, dem Opteron, welcher bekanntlich mit dem „Sledgehammer“-Kern gesegnet ist. Diese Verwandtschaft scheint auch AMD ein Dorn im Auge zu sein. Deshalb fristet der Athlon 64 FX-51, so wie er heute angekündigt wurde, nur ein kurzes Dasein, das sich auch in den geplanten Stückzahlen widerspiegelt. Bereits in der ersten Jahreshälfte 2004 soll der Athlon 64 FX-51 im Sockel 940 eingestellt und durch eine Variante im Sockel 939 abgelöst werden. Auf Rücksprache mit AMD wurde uns jedoch versichert, dass die Sockel 940 Variante noch über das erste Quartal 2004 für einen leichten Übergang hinweg ausgeliefert werden soll.
Doch eins ist klar: AMD möchte den Server/Workstation und Desktop-Markt klar trennen - der Athlon 64 FX-51 stellt hier nur eine Übergangslösung für die Mainboard-Hersteller dar, um sich auf den Sockel 939 vorzubereiten. Schließlich wird dem Athlon 64 FX nicht trivial ein Pin genommen, vielmehr ändert sich das komplette Layout, um so auch einfachere Mainboards ermöglichen zu können.
Der Athlon 64 FX-51 wird im zweiten Quartal 2004 durch den Athlon 64 FX-53 im Sockel 939 und vermutlich 2,4 GHz Realtakt abgelöst werden. Ob der Athlon 64 FX-53 dabei schon auf dem in 90nm gefertigtem „San Diego“-Kern basieren wird, der dann auch AMDs Cool“n Quiet Technologie besitzen wird, ist dabei noch völlig unklar. Wie der FX-51 wird auch der FX-53 mit einem Dual Channel Speicherinterface daher kommen. Ob dann ebenfalls Registered (buffered) Arbeitsspeicher verlangt wird, ist dagegen noch nicht sicher. Wahrscheinlich ist jedoch der Einsatz von Unbuffered Modulen.
Von Anfang an auf lange Sicht geplant war der Athlon 64 für den Sockel 754. Bereits im letzten Quartal 2003 soll sein Lieferanteil mit den Athlon XP Prozessoren mit einem 400 MHz schnellen Frontside-Bus auf einem Niveau liegen. Das liegt nicht zuletzt an der Verstärkung die er im Oktober oder November erhalten wird: zu dem Athlon 64 3200+ mit 2,0 GHz wird sich der Athlon 64 3400+ mit 2,2 GHz hinzugesellen. Der Listenpreis dieses Modells wird bei happigen 637 US-Dollar liegen - das Gegenstück zum Anfang Dezember (laut bisheriger Planung) erscheinenden Pentium 4 3,4 GHz mit Prescott-Kern? Bis zum zweiten Quartal 2004 wird der Athlon 64 3400+ der schnellste Sockel 754 Prozessor bleiben, welcher dann vom Athlon 64 3700+ abgelöst werden wird - auch im Sockel 754.
Der Takt des Athlon 64 3700+ könnte 2,4 GHz oder 2,5 GHz betragen. Hier stellt sich nun die Frage, ob man diesem Takt noch mit in 130nm gefertigtem „Clawhammer“-Kern erreichen kann oder nicht. Ist dem so, sind viele Fragen beantwortet. Erreicht man diesem Takt aber nur mit dem 90nm Kern „San Diego“, werden weitere Fragen aufgeworfen. Laut der uns vorliegenden Roadmap ist dieser Kern nämlich nur für den neuen Sockel 939 vorgesehen, welcher von späteren Versionen des Athlon 64 FX genutzt werden wird und unter anderem für die Dual Channel Anbindung des Speichers Voraussetzung ist.
Auch bei den Sockel 754 Prozessoren muss etwas passieren: Schließlich fährt man die Auslieferung von Athlon XP Prozessoren im zweiten Quartal 2004 deutlich runter! Dies ist schlicht und ergreifend mit einem neuen Athlon XP für den Sockel 754 auf Basis der Hammer-Architektur zu erklären, dem jedoch ein wichtiges Feature dieser Architektur zu fehlen scheint: die 64Bit Erweiterung. Der Prozessor befindet sich derzeit mit dem Codenamen „Paris“ in der Entwicklung und soll, so wie der „Clawhammer“-Kern, im 130nm SOI-Prozess gefertigt werden. Der „Paris“ wird einen 256kB großen L2-Cache besitzen und wird auch die Cool“n'Quiet Technologie beherrschen.
Damit wäre „Paris“ ein Rückzieher. Schließlich wollte AMD die AMD64 Architektur in allen Produktbereichen etablieren.
Ein entscheidendes Kriterium für den Kauf eines neuen Prozessors ist neben der Leistung sicherlich der Preis. Hierbei muss man natürlich zwischen den Großhandelspreisen und den Preisen im Laden um die Ecke unterscheiden. In der Vergangenheit konnten Intels Prozessoren zwar auf der Preisliste für Großkunden mit den Preisen für AMDs Boliden konkurrieren, im Einzelhandel schockte den gewillten Käufer jedoch ein gänzlich anderes Bild. Während Athlon XP Prozessoren zumeist unter Listenpreis unter's Volk geworfen wurden, musste man beim Pentium 4 allein schon für den Namen und seinen Ruf als "teure CPU" deutlich mehr bezahlen. Leider Gottes wird dies beim Athlon 64 und vor allem beim Athlon 64 FX nicht mehr der Fall sein, denn wie folgende Tabelle zeigt, verlang AMD für seine neuen Prozessoren eine ganze Menge Geld.
| Intel Pentium 4 | AMD Athlon XP | AMD Athlon 64/FX | |||||
| Takt | Preis | Modelnr. | Preis | Modelnr. | Preis | ||
| Seit 21.5.03 | Ab 23.6.03 | Seit 13.5.03 | Seit 26.5.03 | Seit 23.9.03 | |||
| Athlon 64 FX 51 | $733 | ||||||
| 3,20 GHz | - | $637 | 3200+ | $464 | $464 | Athlon 64 3200+ | $417 |
| 3,00 GHz | $417 | $417 | 3000+ | $325 | $265 | ||
| 3,06 GHz | $401 | $401 | 2800+ | $225 | $180 | ||
| 2,80C GHz | $278 | $278 | 2700+ | $180 | $137 | ||
| 2,80 GHz | $262 | $262 | 2600+ | $151 | $103 | ||
| 2,66 GHz | $193 | $193 | 2500+ | $124 | $89 | ||
| 2,60C GHz | $218 | $218 | 2400+ | $103 | $84 | ||
| 2,60 GHz | $193 | $193 | 2200+ | $81 | $74 | ||
| 2,53 GHz | $193 | $193 | |||||
| 2,40C GHz | |||||||