Die Athlon 64 FX-Familie bekommt Zuwachs: Nachdem seit dem 23. September 2003 [1] ein 2,2 GHz schneller Athlon 64 FX-51 einsam seine Runden dreht, gesellt sich nun ein 2,4 GHz schnelles Modell mit der Modellnummer „FX-53“ hinzu. Bereits diese Daten zeigen, dass AMD in den letzten Wochen und Monaten dazugelernt hat. Während sich der FX-51 mittels Luftkühlung im Durchschnitt nur auf 2,30 GHz, bestenfalls auf 2,35 GHz bringen lies, meistert der Neue nun mühelos die 2,4 GHz.
Doch nicht nur an der Taktschraube konnte AMD drehen. Auch weitere Verbesserungen sind in den FX-53 eingeflossen, welcher von Anfang an im neuen „CG“-Stepping ausgeliefert wird. Was dies für den täglichen Einsatz bedeutet und wie sich der Athlon 64 FX-53 gegen die starke Konkurrenz behaupten kann, sollen die folgenden Seiten aufzeigen.
Da es möglich ist, dass in diesem Artikel auf bestehendes Wissen aus älteren Prozessortests zurückgegriffen wird, ist es für alle, die etwas "mehr" wissen möchten, keinesfalls verkehrt, auch einen Blick in unsere älteren Berichte (Ausschnitt) zu werfen.
Wer darüber hinaus noch an der Prozessoren-Geschichte von AMD und Intel interessiert ist, wird an den Artikeln „Intels Prozessor History - Der Weg vom Intel 4004 bis zum Pentium 4 [12]“ und „AMD Prozessor History - Ein Überblick vom K5 bis zum Athlon XP [13]“ seine wahre Freude haben. Wer mehr über die AMD Hammer-Architektur erfahren möchte, der ist in unserem 57 Seiten langen Launch-Artikel [14] zum Athlon 64 und Athlon 64 FX richtig.
Auch der neue FX-53 bietet all die Features, die bereits der FX-51 beherbergt. Er besitzt nachwievor eine maximale thermische Verlustleistung von 89 Watt und so muss unsere Übersichtstabelle nur um die „53“ ergänzt werden.
| Merkmale | Pentium 4 | Pentium 4 | Pentium 4 Extreme Edition | Athlon XP | Athlon 64 (FX) |
| Kern | Prescott | Northwood | Northwood 2M | Thoroughbred Barton | Clawhammer Clawhammer-512 |
| Frontside-Bus | 533 MHz QDR 800 MHz QDR | 400 MHz QDR 533 MHz QDR 800 MHz QDR | 800 MHz QDR | 266 MHz DDR 333 MHz DDR 400 MHz DDR | entfällt |
| Fertigung | 0,09µm | 0,13 µm | 0,13 µm | 0,13 µm | 0,13 µm SOI |
| Sockel | Sockel 478 | Sockel 478 | Sockel 478 | Sockel A | Sockel 754 Sockel 940 (FX) |
| Taktrate oder Modellnummer | 533 MHz QDR 2800 MHz A 800 MHz QDR 2800 MHz E HT+ 3000 MHz E HT+ 3200 MHz E HT+ 3400 MHz E HT+ HT+: Verbessertes Hyper-Threading | 400 MHz QDR 1600 MHz A 1800 MHz A 2000 MHz A 2200 MHz 2400 MHz 2500 MHz 2600 MHz 533 MHz QDR 2266 MHz 2400 MHz B 2533 MHz 2666 MHz 2800 MHz 3066 MHz HT 800 MHz QDR 2400 MHz C HT 2600 MHz C HT 2800 MHz C HT 3000 MHz HT 3200 MHz HT 3400 MHz HT HT: Hyper- Threading | 800 MHZ QDR 3200 MHz HT 3400 MHz HT HT: Hyper- Threading | 266 MHz DDR 1800+ 1900+ 2000+ 2100+ 2200+ 2400+ 2600+ 333 MHz DDR 2600+ 2700+ 2800+ 333 MHz DDR 2500+ 2600+ 2800+ 3000+ 400 MHz DDR 3000+ 3200+ | Athlon 64: 3000+ 3200+ 3400+ Athlon 64 FX: 51 53 |
| Transistoren | 125 Mio. | 55 Mio. | 169 Mio. | 37,5 Mio. (Tho.) 54,3 Mio. (Bar.) | 105.9 Mio. |
| DIE-Size | 112 mm² | 146 mm² (nB0) 131 mm² (nC1) 131 mm² (nD1) | 240 mm² (nM0) | 80 mm² ("Tho A") 84 mm² ("Tho B") 101 mm² (Bar.) | 193 mm² |
| L1-Execution-Cache | 12.000 µ-Ops | 12.000 µ-Ops | 12.000 µ-Ops | 64 kB | 64 kB |
| L1-Daten-Cache | 16 kB | 8 kB | 8 kB | 64 kB | 64 kB |
| L1-Takt | CPU-Takt | CPU-Takt | CPU-Takt | CPU-Takt | CPU-Takt |
| L2-Cache | 1024kB | 512kB | 512kB | 256kB (Tho.) 512kB (Bar.) | 512kB (3000+) 1024kB |
| L2-Anbindung | 256 Bit | 256 Bit | 256 Bit | 64 Bit | 128 Bit? |
| L2-Cache-Takt | CPU-Takt | CPU-Takt | CPU-Takt | CPU-Takt | CPU-Takt |
| L2-Modus | L1 inclusive | L1 inclusive | L1 inclusive | L1 exclusive | L1 exclusive |
| L3-Cache | - | - | 2048kB | - | - |
| L3-Cache-Takt | - | CPU-Takt | CPU-Takt | CPU-Takt | CPU-Takt |
| L3-Modus | - | - | L2 inclusive | - | - |
| HW Data Prefetching | Ja | Ja | Ja | Ja | Ja |
| VCore | 1,250V 1,275V 1,300V 1,325V 1,350V 1,375V 1,400V | 1,475V 1,500V 1,525V 1,550V | 1,475V 1,500V 1,525V 1,550V 1,575V 1,600V | 1,50V 1,60V 1,65V | 1,55V |
| Befehlssätze | MMX SSE SSE2 SSE3 | MMX SSE SSE2 | MMX SSE SSE2 | MMX 3DNow! 3DNow!+ SSE | MMX 3DNow! 3DNow!+ SSE SSE2 AMD64 |
| Temperatur Diode | Ja | Ja | Ja | Ja | Ja |
| Multiprozessor-fähig | Nein | Nein | Nein | Nein | Nein |
| CPU-Architektur | 31-stufige Pipeline | 20-stufige Pipeline | 20-stufige Pipeline | 15-stufige (FPU) 10-stufige (ALU) Pipeline | 17-stufige (FPU) 12-stufige (ALU) Pipeline |
Dass es neben der offensichtlichen Takterhöhung dann doch noch ein paar kleine Detail-Verbesserungen geben hat, offenbart das Tool CPU-Z [15]. So kommt der FX-53 mit einem neuen Prozessorstepping daher, welches die Speicherkompatibilität verbessern soll, zum jetzigen Zeitpunkt jedoch eher für Kompatiblitätsprobleme sorgt.
Mit dem neuen Stepping werden wir uns auf der nächsten Seite beschäftigen, zuvor möchten wir die Frage nach den aktuellen Varianten des Athlon 64 und Athlon 64 FX klären, die trotz gleicher Modellnummer mit unterschiedlichen Taktraten daher kommen. So finden sich im AMD Athlon 64 Processor Power and Thermal Data Sheet der Version 3.13 [16] nicht nur erstmals der heute vorgestellt Athlon 64 FX-53, sondern auch zwei neue Athlon 64 Modelle mit 512 kB L2-Cache, die wir in der obigen Tabelle noch nicht mit aufgenommen haben, weil sie offiziell noch nicht angekündigt wurden.
| Name | Takt | L2-Cache | Stepping | Ordering Part |
| AMD Athlon 64 FX | ||||
| FX-51 | 2,2 GHz | 1 MB | C0 | ADAFX51CEP5AK |
| FX-51 | 2,2 GHz | 1 MB | CG | ADAFX51CEP5AT |
| FX-53 | 2,4 GHz | 1 MB | CG | ADAFX53CEP5AT |
| AMD Athlon 64 | ||||
| 2800+ | 1,8 GHz | 512 kB | CG* | ADA2800AEP4AX |
| 3000+ | 2,0 GHz | 512 kB | C0 | ADA3000AEP4AP |
| 3000+ | 2,0 GHz | 512 kB | CG | ADA3000AEP4AR |
| 3000+ | 2,0 GHz | 512 kB | CG* | ADA3000AEP4AX |
| 3200+ | 2,0 GHz | 1 MB | C0 | ADA3200AEP5AP |
| 3200+ | 2,0 GHz | 1 MB | CG | ADA3200AEP5AR |
| 3200+ | 2,2 GHz | 512 kB | CG* | ADA3200AEP4AX |
| 3400+ | 2,2 GHz | 1 MB | C0 | ADA3400AEP5AP |
| 3400+ | 2,2 GHz | 1 MB | CG | ADA3400AEP5AR |
| * Vermutlich neuer "Newcastle" Prozessorkern | ||||
Das Chaos, was beim Athlon XP [17] schon gar nicht mehr Wegzudenken war und ist, holt nun auch den Athlon 64 allmählich ein. Vom Athlon 64 3200+ wird es im Handel also demnächst zwei verschiedene Varianten mit unterschiedlich großem L2-Cache geben. Unsere Tests des Athlon 64 3000+ und Athlon 64 3400+ [18] haben jedoch gezeigt, dass AMDs jüngste Prozessoren durch eine Verkleinerung des Cache ca. zwei Leistungsprozentpunkte verlieren, durch 200 MHz mehr Prozessortakt jedoch 4 Prozent gewinnen. Der "ADA3200AEP4AX" sollte somit dem "ADA3200AEP5AR" oder "ADA3200AEP5AP" performancemäßig trotz weniger Cache im Durchschnitt überlegen sein. Eine weitere Besonderheit dieses Prozessors (trifft auch auf die anderen Modelle zu, die auf "AX" enden): Es scheint sich dabei schon um den neuen Newcastle-Kern [19] zu handeln.
Während also der Athlon 64 3000+ [4] (ADA3000AEP4AP und ADA3000AEP4AR) eigentlich nur ein defekter Clawhammer (normaler Athlon 64) ist, bei dem die Hälfte des L2-Caches deaktiviert wurde, scheint bei den neuen "AX"-Prozessoren mit dem Newcastle ein Prozessor-Kern zum Einsatz zu kommen, der von vornherein nur 512 kB L2 Cache besitzt und dementsprechend weniger Transistoren beherbergt.
Der Athlon 64 (nicht FX) ist recht wählerisch [20], (siehe auch [21]) was den Speicherausbau betrifft. Ursprünglich war geplant, dass der nächste Prozessorkern des Athlon 64, der Newcastle [22], mit diesen Problemen aufräumen soll. Doch schnell wurde klar, dass es vor diesem noch ein neues Athlon 64-Stepping [23] geben soll, welchem die selbe Aufgabe zuteil wird. Der Mythos des "CG"-Steppings wart geboren und ein Dokument von Shuttle [24] schien die Gerüchte zu bestätigen. Es dauerte nicht lange, bis offizielle Details seitens AMD folgten. Demnach sollte das CG-Stepping nicht nur die Speicherkompatibilitätsprobleme lösen, sondern auch für einen geringen Stromverbrauch [25] bei verringerte Betriebsspannung im niedrigsten Cool'n' Quiet-Modus sorgen. Auch beim Stand-By-Modus wollte AMD durch weitere Optimierungen die Leistungsaufnahme von 600 mW auf 160 mW (Athlon 64) beziehungsweise 1,2 W auf 400 mW (Athlon 64 FX) gesenkt haben. Die folgende Tabelle verdeutlicht die Unterschiede zwischen C0- und CG-Stepping anhand des Athlon 64 3400+.
| Typ | ADA3400AEP5AP | ADA3400AEP5AR |
| Modell | 3400+ | 3400+ |
| CPUID | F4Ah | F48h |
| Stepping | C0 | CG |
| Frequenz | 2200 MHz | 2200 MHz |
| Spannung | 1,5 Volt | 1,5 Volt |
| Stromstärke | 57,8 A | 57,8 A |
| Leistungsaufnahme | 89 Watt | 89 Watt |
| Frequenz 1 | 2000 MHz | 2000 MHz |
| Spannung | 1,4 Volt | 1,4 Volt |
| Leistungsaufnahme | 70 Watt | 69 Watt |
| Stromstärke | 48,4 A | 47,7 A |
| Frequenz 2 | - | 1800 MHz |
| Spannung | - | 1,3 Volt |
| Leistungsaufnahme | - | 50 Watt |
| Stromstärke | - | 36,8 A |
| Niedrigste Frequenz | 800 MHz | 1000 MHz |
| Spannung | 1,3 Volt | 1,1 Volt |
| Leistungsaufnahme | 35 Watt | 22 Watt |
| Stromstärke | 25,2 A | 18 A |
| S3 Stand By | ||
| I/O Power | 600mW | 160mW |
Zum Athlon 64 mit CG-Stepping können wir im Rahmen dieses Artikels leider keine Aussagen treffen. Den Kollegen von ZDNet war es jedoch vergönnt, sich den Athlon 64 3400+ mit diesem Prozessorstepping genauer anzusehen [26]. Neben einer effektiv um sieben Watt gesenkten Leistungsaufnahme im Leerlauf (bei aktiviertem Cool'n' Quiet) konnten jedoch keine Verbesserungen beim Speichersupport festgestellt werden. Allerdings fiel auf, dass AMD die L2-Latenzzeiten etwas gelockert hat und das neue Stepping in Folge dessen in einigen Benchmarks langsamer zu Werke schreitet. Soviel dazu.
Über den FX-53 mit CG-Stepping können wir dagegen schon um einiges mehr sagen. Da auch dieser, wie alle Athlon 64 FX-Prozessoren, kein Cool'n' Quiet unterstützt (dies wird wohl erst der Wechsel zum Sockel 939 [27], oder der in 90 nm gefertigte San Diego-Kern mit sich bringen), kommen hier entsprechende Verbesserungen beim CG-Stepping nicht zum Tragen. Da der FX-53 im Sockel 940 auch weiterhin Registered DDR400 verlangt und es hier in der Vergangenheit (bei unseren Tests) nie Probleme gegeben hat, wirkt sich auch diese Verbesserung nicht auf dem Arbeitsalltag mit einem FX-System aus. Ein Betrieb mit scharfen Speichertimings war und ist mit geeigneten Speichermodulen von Corsair, OCZ oder Mushkin nachwievor ohne Probleme möglich. Somit kann sich der FX-53 (und der FX-51 mit CG-Stepping) lediglich über eine gesunkene Leistungsaufnahme im Stand-By freuen.
Messungen mit gängigen Programmen fördern nur wenig Interessantes zu Tage. Die Speicher- und Cache-Latenzen des C0- und CG-Stepping sind bei gleichem Prozessortakt identisch. Deutlich interessanter wird es dagegen bei Operationen im L2-Cache und im Arbeitsspeicher selbst.
| Operation | FX-51 C0 | FX-51* CG | FX-53 CG | P4 3,4 EE |
| L2-Cache-Bandbreite in MB/s | ||||
| REP MOVSD | 3760 | 4197 | 4561 | 20987 |
| Speicherbandbreite in MB/s | ||||
| REP MOVSD | 2456 | 2050 | 2095 | 2514 |
| ALU Reg Copy | 2470 | 2069 | 2139 | 2410 |
| MMX Reg Copy | 2531 | 2189 | 2225 | 2477 |
| MMX Reg 3DNow | 5001 | 4754 | 4787 | - |
| MMX Reg SSE | 5174 | 4943 | 4628 | 4006 |
| SSE PAlign | 4319 | 4030 | 3579 | 3963 |
| SSE PAlign SSE | 5169 | 4970 | 4919 | 4099 |
| SSE2 PAlign | 4323 | 4030 | 3588 | 3955 |
| SSE2 PAlign SSE | 5139 | 4952 | 4923 | 4101 |
| MMX Block 4kb | 5268 | 5229 | 5410 | 3770 |
| MMX Block 16kb | 5568 | 5551 | 5662 | 3845 |
| SSE Block 4kb | 5291 | 5179 | 5235 | 3763 |
| SSE Block 16kb | 5564 | 5535 | 5591 | 3887 |
| * Mittels FX-53, da nach unten unlocked, simuliert | ||||
Was sagt uns die Zahlenflut? Werden im L2-Cache Byte, Word oder DoubleWord Speichblöcke mittels REP MOVSD verschoben, so geht dies beim CG-Stepping bei gleichem Prozessortakt schneller vonstatten als dies noch beim C0-Stepping der Fall war. Wird diese Operation dagegen im Arbeitsspeicher ausgeführt, so lässt sich das CG-Stepping hier mehr Zeit. Generell ist die Bandbreite vieler Arbeitsspeicher-Operationen gesunken, wobei einige mit steigendem Prozessortakt weiter in die Knie gehen - äußert merkwürdig. Leider blieb uns während unserer Tests nicht genügend Zeit, diesem Verhalten auf den Grund zu gehen. Auf die von Science Mark ermittelte Speicherbandbreite hatte dies keinen Einfluss, da diese beim Test "MMX Block 16kb" weiterhin ihr Maximum besitzt; der Pentium 4 Extreme Edition 3,4 GHz ist bei "SSE2 PAlign SSE" am schnellsten.
Zur Kompatibiblität des CG-Steppings lässt sich so viel sagen: Damit ein Prozessor mit diesem Stepping im Sockel erkannt wird, bedarf es bei allen aktuellen Mainboards eines BIOS-Updates. Ist das BIOS zu alt, verweigert der Prozessor jede Zusammenarbeit. Asus hat für seine Platinen bereits entsprechende Updates bereitgestellt, weshalb wir für diesen Test auf ein Asus SK8V mit VIA K8T800 zurückgreifen mussten. Ein BIOS für das MSI K8T Master1 erreichte uns leider zu spät. Möchte man sich also ein entsprechendes System bestehend aus Athlon 64 FX "CG" und einem aktuellen Mainboard zusammenstellen, so sollte man am besten gleich im Laden das aktuellste BIOS aufspielen lassen. Daheim werden alle Versuche scheitern (wenn kein FX-Prozessor mit C0-Stepping zur Hand ist).
Soviel also zum CG-Stepping beim Athlon 64 FX. Bevor wir uns weiteren Leistungsmessungen zuwenden, soll im Folgenden kurz auf das Übertaktungspotential und AMDs Zukunftspläne eingegangen werden.
Der Athlon 64 FX-53 ist schnell genug, um nicht übertaktet werden zu müssen. Dennoch lässt sich hierdurch immer recht gut feststellen, wie viel Potential in einer Architektur steckt und wie leicht es dem Hersteller fallen wird, schnellere Varianten in den Handel zu bringen.
Unser Athlon 64 FX-53 Testmuster (ebenso wie vermutlich jede im Handel erhältliche CPU dieses Typs) ist nach unten unlocked und lässt sich so problemlos mit einem niedrigeren Takt betreiben, ohne dabei andere Komponenten, die am HyperTransport-Bus Anschluss finden, auszubremsen. Übertakten lässt sich der Prozessor also nur durch das Erhöhen der Taktfrequenz vom HyperTransport-Bus. Hier erreichten wir einen Takt von stolzen 2,6 GHz, mit dem der FX-55 wohl daher kommen wird. Mehr als ein Screenshot gelang uns bei dieser Taktfrequenz jedoch nicht; das System lief sehr instabil. Mit etwas Feintuning sollte es den Ingenieuren von AMD jedoch ohne größere Schwierigkeiten möglich sein, ein Modell mit 2,6 GHz Prozessortakt zeitnah anzubieten.
Wann erwartet uns also der FX-55? Die offiziellen AMD-Roadmaps geben hier nicht allzuviele Informationen her. Glücklicherweise sind den Kollegen von Anandtech [28] etwas mehr Informationen in die Hände gefallen. So wird es zwar einen FX-55 geben, dieser soll jedoch ausschließlich für den Sockel 939 erscheinen, für den Sockel 940 scheint es selbst für Enthusiasten keine neuen Prozessoren der FX-Serie mehr zu geben. Mit dem Erscheinen des Sockel 930 soll der „Desktop-Sockel 940“ also nach und nach aussterben und somit wieder AMDs Serverprozessor, dem Opteron, vorbehalten bleiben.
| Modell | Takt | L2-Cache | Vorstellung |
| Athlon 64 3700+ | 2.4 GHz | 1 MB | Q2 '04 |
| Athlon 64 3400+ | 2.4 GHz | 512 KB | Q2 '04 |
| Athlon XP 3000+ | ?? | 256 KB | Q4 '04 |
| Athlon XP 2800+ | ?? | 256 KB | Q3 '04 |
Was erwartet uns beim klassischen Sockel 754? Im zweiten Quartal wird der bereits verfügbare Athlon 3400+ in einer neuen Variante mit mehr Prozessortakt aber halbiertem L2-Cache daher kommen. Ob hierbei der Newcastle-Kern oder ein "defekter" Clawhammer, bei dem nur der halbe L2-Cache aktiv ist, zum Einsatz kommt, geben die Informationen nicht preis. Vermutlich wird es früher oder später beide Varianten geben. Ebenfalls im zweiten Quartal wird der letzte Athlon 64 mit 1 MB Cache vorgestellt werden. Das Modell taktet mit 2,4 GHz so schnell wie der heute vorgestellte Athlon 64 FX-53. Zum Jahresende wird auch der Athlon XP auf den Sockel 754 wechseln. Hier wird der Paris-Kern [29] zum Einsatz kommen, der zwar auf der Hammer-Architektur basiert, aber ohne AMD64-Support daher kommt.
| Modell | Takt | L2-Cache | Vorstellung |
| Athlon 64 FX-55 | 2.6 GHz | 1 MB | Q4 '04 |
| Athlon 64 FX-53 | 2.4 GHz | 1 MB | Q2 '04 |
| Athlon 64 4000+ | 2.6 GHz | 512 KB | Q4 '04 |
| Athlon 64 3700+ | 2.4 GHz | 512 KB | Q4 '04 |
| Athlon 64 3700+ | 2.4 GHz | 512 KB | Q2 '04 |
| Athlon 64 3400+ | 2.2 GHz | 512 KB | Q2 '04 |
Die Tabelle spricht für sich. Hierbei sollen nach aktuellem Kenntnisstand sowohl die Athlon 64- als auch die Athlon 64 FX-Prozessoren ein Dual-Channel-Speicherinterface erhalten. Somit wird sich die FX-Serie auf einer Sockel 939-Plattform nur im unterschiedlich groß ausfallendem L2-Cache unterscheiden. Der Athlon 64 3700+ wird zweimal vorgestellt, weil es sich bei der im vierten Quartal 2004 erscheinenden Variante um das in 90 nm gefertigte Modell handeln wird. Auch der Athlon 64 4000+ und der Athlon FX-55 sollen mit dieser Fertigungstechnologie vorgestellt werden.
Wir haben die Neuvorstellung des Athlon 64 / 64 FX genutzt, um unseren Benchmarkparcours general zu überholen. Dabei haben wir insbesondere auf Anwendungen, die uns Leser auf Anfrage im Forum [33] genannt haben, Wert gelegt. Neben einer Reihe aktueller Spiele liegt der Schwerpunkt nun auf Audio- und Video-Encoding. Aber auch CAD/Render-Anwendungen haben wir nach durchweg positiver Resonanz im Sortiment behalten. Wie und was wir genau gebencht haben, steht im jeweiligen Infokasten über den Ergebnissen.
Sisoft Sandra 2003 MAX - Arithmetic
Angaben in Punkten
|
Sisoft Sandra 2003 MAX - Multimedia
Angaben in Megapixel pro Sekunde (MPix/s)
|
Sisoft Sandra 2003 MAX - Speicher
Angaben in Megabyte pro Sekunde (MB/s)
|
Lame 3.93.1
Angaben in Minuten, Sekunden
|
Ogg Vorbis
Angaben in Minuten, Sekunden
|
Windows Media Encoder 9 - Audio
Angaben in Minuten, Sekunden
|
XMPEG 5.02 Divx 5.1
Angaben in Minuten, Sekunden
|
TMPGEnc 2.520
Angaben in Minuten, Sekunden
|
Windows Media Encoder 9 - Video
Angaben in Minuten, Sekunden
|
Spec Viewperf 7.1 3dsmax-02
Angaben in Bildern pro Sekunde (FPS)
|
Spec Viewperf 7.1 drv-09
Angaben in Bildern pro Sekunde (FPS)
|
Spec Viewperf 7.1 dx-08
|