Ende Juni 2007 hat die JEDEC (Joint Electron Device Engineering Council) offiziell den DDR3-Standard verabschiedet. Allerdings waren sowohl Mainboards als auch Speicherriegel schon einige Wochen zuvor erhältlich. Worin liegen nun die Unterschiede zwischen dem noch aktuellen DDR2-Standard, auf den AMD erst mit dem Sockel AM2 umgestiegen ist, und dem neuen DDR3-Standard?
Die äußeren physikalischen Abmessungen der Speicherriegel blieben unverändert, auch die Anzahl der Kontakte bleibt mit 240 Stück identisch. Um Verwechslungen beim Einbau in Mainboards zu vermeiden, wanderte die Kerbe bei DDR3-Riegeln weiter nach außen. Viele Änderungen gab es allerdings unter der Haube. So verringert sich bei DDR3 die Betriebsspannung, VMem, auf 1,5 Volt. Bei DDR2 lag sie noch bei 1,8 Volt. Das Pin-Layout der Speicherchips wurde verändert, so dass bei DDR3 in der Standardkonfiguration nun 78 Pins (eigentlich Balls) zum Einsatz kommen, was auch einer höheren mechanischen Stabilität zu Gute kommen soll. Bei den BGA-Chips von DDR2 wurden nur 72 der vom Package bereitgestellten Kontakte angeschlossen.
Während der Chiptakt selbst bei DDR-400, DDR2-800 und DDR3-1600 stets derselbe ist, nämlich 200 MHz, erhöht sich der Takt der I/O-Buffer und der Übertraktungsstrecke von 200 über 400 auf 800 MHz bei DDR3. Am Ende ergeben sich zusammen mit Double Data Rate, dem Schreiben der Daten bei steigender und fallender Taktflanke, die effektiven Speichertaktraten von 400, 800 und 1.600 MHz (DDR, DDR2, DDR3). Bezogen auf den realen Takt der Speicherchips spricht man deshalb von 2-fach (DDR), 4-fach (DDR2) oder 8-fach (DDR3) Prefetch. Die Datenpakete gelangen vom Speichercontroller (der Northbridge) auf einer, verglichen mit den Speicherchips, acht mal so schnellen einspurigen Autobahn zu den I/O-Buffern, die sie in acht verschiedene Startpositionen (Register) verteilen. Mit dem achten Bit beginnt die speicherchipinterne Verarbeitung auf einer acht mal so breiten, aber dafür nur noch einfach getakteten Datenautobahn.
Bei DDR2 ist laut JEDEC allerdings bei DDR2-800 das Ende der Fahnenstange erreicht. Dies hat die Speicherhersteller jedoch nicht davon abgehalten, auch DDR2-1066 und noch höher getaktete Module auf den Markt zu bringen. Auch wir haben für unseren Test DDR2-1066-Module von Aeneon [1] verwendet, die sich als Besonderheit bei vollem Takt noch mit der offiziellen Speicherspannung für DDR2 von 1,8 Volt begnügen. DDR3 ist zur Zeit bis DDR3-1600 und CL10 spezifiziert.
Nach den Vorgaben der JEDEC dürfen bei DDR3-Chips mit einer Kapazität zwischen 512 MBit und acht GBit verbaut werden. Eine weitere Änderung ist die Erhöhung der gleichzeitig ansprechbaren logischen Speicherbänke von vier auf acht. Wegen der höheren Taktraten und einer besseren Datenübertragung wird bei DDR3 jeder Chip mit einer kleinen Verzögerung jeweils einzeln per DQS (Data Queue Strobe) angesprochen. Dies wird „Fly-by“-Architektur genannt, denn bei DDR2 wurden noch alle Chips gleichzeitig angesprochen.
Durch die „on-Die-Terminierung“ auf den jeweiligen Speichermodulen entfallen auch die Abschlusswiderstände auf den Mainboards, die sich sonst aufgereiht neben den Speicher-Slots befanden. Die Terminierung befindet sich jetzt auf dem Speicherriegel und ist unter anderem nötig um Reflexionen auf der Signalleitung zu vermeiden. Sogar eine Temperaturüberwachung können DDR3-Module aufweisen, die je nach Temperatur die Abschlusswiderstände kalibriert und so für eine sichere Funktion sorgen soll. Aber auch die Timings können automatisch angepasst werden.
Sich im Laufe der Zeit angesammelte Artikel, die mit diesem Artikel in Zusammenhang stehen, wollen wir nachfolgend noch einmal in Erinnerung rufen. Da es mitunter vorkommt, dass im heutigen Artikel auf bestehendes Wissen aus älteren Tests und Technikerläuterungen zurückgegriffen wird, ist es für alle, die etwas „mehr“ wissen möchten, keinesfalls verkehrt, auch einen Blick in unsere älteren Berichte zu werfen.
In der roten Ecke startet DDR2, vertreten durch zwei jeweils ein Gigabyte große Overclocking-Module der XTune-Reihe von Aeneon, die im matt-schwarzen Heatspreader-Outfit antreten. Die offizielle Taktung liegt bei DDR2-1066, die Timings bei 5-5-5-12. Als Versorgungsspannung sind JEDEC-konforme 1,8 Volt nötig, allerdings entspricht die 1066er-Taktung schon nicht mehr der DDR2-Spezifikation.
In der blauen Ecke des Herausforderers sind im passend blauen Gewand zwei jeweils ein Gigabyte große Module der HyperX-Reihe aus dem Hause Kingston aufgelaufen. Sie sind bis DDR3-11000, sprich DDR3-1375 frei gegeben und weisen Timings von 7-7-7-20 bei einer Betriebsspannung von 1,7 Volt auf.
Das Thema Timings wollen wir hier noch einmal genauer beleuchten. Zwar hören sich bei DDR2-800 Timings von 4-4-4-12 gegenüber DDR3-1600 mit 9-9-9-21 erheblich besser an, rechnet man aber die tatsächliche Zeit aus, die vergeht bevor Daten (theoretisch) gelesen werden können, relativiert sich dieser Umstand. Während bei dem genannten DDR2 nur 10,0 ns vergehen, braucht obiger DDR3 immerhin 11,25 ns. Bei möglichen Timings von 7-7-7-18 sinkt die Zeit allerdings auf 8,75 ns. Wie bereits beim Umstieg von DDR auf DDR2 ist es nur eine Frage der Zeit, bis „Low Latency“-Module, also Speicher mit geringen Latenzen, auf den Markt kommt. So hat Super Talent bereits DDR3-1600 mit Timings von 7-7-7-18 angekündigt (PDF) [8], Kingston folgte mit DDR3-1375 (DDR3-11000) und CL5-Timings [9].
Alle Benchmarks werden in einer Bildschirmauflösung von 1280x1024 mit 32 Bit Farbtiefe durchgeführt.
PCMark05 - Gesamt
Angaben in Punkten
|
PCMark05 - Festplatte
Angaben in Punkten
|
PCMark05 - Grafikkarte
Angaben in Punkten
|
PCMark05 - Prozessor
Angaben in Punkten
|
PCMark05 - Speicher
Angaben in Punkten
|
Sandra XI – Multimedia
Angaben in Instruktionen pro Sekunde (it/s)
|
Sandra XI – Memory
Angaben in Megabyte pro Sekunde (MB/s)
|
Sciencemark 2.0 - Speicherlatenz
Angaben in Taktzyklen
|
Cache & Memory Benchmark DDR2
Cache & Memory Benchmark DDR3
Bei SYSmark 2007 Preview handelt es sich um eine Benchmark-Suite, die aus diversen Einzelanwendungen besteht. Insgesamt 14 Programme werden in vier verschiedenen Kategorien zur Leistungsbewertung herangezogen.
E-Learning (EL)
Video Creation (VC)
Office Productivity (PR)
3D Modeling (3D)
SYSmark 2007 – Gesamt
Angaben in Punkten
|
SYSmark 2007 – EL
Angaben in Punkten
|
SYSmark 2007 – VC
Angaben in Punkten
|
SYSmark 2007 – PR
Angaben in Punkten
|
SYSmark 2007 – 3D
Angaben in Punkten
|
Der WorldBench 6 Beta 2 [14] ist eine Sammlung aus zur Zeit neun Anwendungen, die per Script automatisch ablaufen. Die dabei benötigte Zeit wird automatisch gemessen und bildet neben den Einzelwertungen dann einen Gesamtwert für das getestete System.
WorldBench – Gesamt
Angaben in Punkten
|
WorldBench – Adobe Photoshop CS2
Angaben in Sekunden
|
WorldBench – 3ds max (DirectX)
Angaben in Sekunden
|
WorldBench – 3ds max (OpenGL)
Angaben in Sekunden
|
WorldBench – Firefox 2.0
Angaben in Sekunden
|
WorldBench – Office 2003 SP1
Angaben in Sekunden
|
WorldBench – MS Media Encoder
Angaben in Sekunden
|
WorldBench – Nero 7 Ultra Edition
Angaben in Sekunden
|
WorldBench – Roxio Movie Creator
Angaben in Sekunden
|
WorldBench – WinZip
Angaben in Sekunden
|
Doom 3 bekommt Konkurrenz – und was für Eine! Die Programmierer des Gruselshooters F.E.A.R. scheinen sich Doom 3 als großes Vorbild ausgesucht zu haben, wobei man allerdings fast alles besser zu machen scheint. Unter anderem wird die sehr beklemmende Atmosphäre durch eine Grafikqualität erreicht, die ihres Gleichen sucht. Shadereffekte in Massen, wunderschönes Bump-Mapping, sehr spektakuläre Schattenwürfe, detaillierte Texturen sowie hübsch aussehende Partikeleffekte und noch vieles mehr bekommt der Spieler zu Gesicht, weswegen F.E.A.R. bereits Pflicht für einen guten Benchmark-Parcours geworden ist. Wir verwenden mittlerweile für diese Zwecke die Vollversion, die über eine integrierte Benchmarkfunktion verfügt. Jene zeigt ein Gefecht sowie eine größere Explosion, die durch eine sich frei bewegende Kamera aufgenommen worden sind.
F.E.A.R.
Angaben in Bildern pro Sekunde (FPS)
|
Half-Life 2 ist wohl zweifellos aufgrund seines legendären Vorgängers eines der meist erwarteten Spiele aller Zeiten gewesen. Den Erwartungen wurde das Spiel oftmals gerecht und begeistert nicht nur in spielerischer Hinsicht, sondern auch durch seine Grafik, die unter anderem durch massiven „Shader Model 2.0“-Einsatz ermöglicht wird. Einige Monate nach der Erscheinung brachte Valve die kostenlose Technologiedemo „Lost Coast“ auf den Markt, die als Besonderheit High-Dynamic-Range-Rendering unterstützt und somit nicht nur einen deutlich höheren Lichtumfang sowie Lichtdynamik bietet, sondern auch die Hardware stärker fordert.
Half-Life 2 - Lost Coast
Angaben in Bildern pro Sekunde (FPS)
|
Bereits der Vorgänger „Morrorwind“ hat bei vielen Spielefans eine richtige Begeisterung hervorgerufen und bei dem Nachfolger „Oblivion“ scheint dies nicht anders zu sein. Zu kaum einem Spiel findet man derzeit mehr Diskussionen im Internet. Aber nicht nur spielerisch, auch grafisch kann Oblivion überzeugen und fährt, um dieses Ziel zu erreichen, schwere Geschütze auf. Noch niemals zuvor wurde HDRR mit dynamischem Tone-Mapping derartig realistisch eingesetzt. Darüber hinaus kann das Spiel mit schönen Schatteneffekten sowie stellenweise hoch auflösenden Texturen und Partikeleffekte glänzen. Dementsprechend ist Oblivion geradezu prädestiniert für einen guten Benchmarkparcours. Die verwendete Szene zeigt nicht nur eine aufwendige Beleuchtung, auch mehrere Sträucher und Bäume sind zu sehen, die vor allem die GPU extrem stark belasten.
Oblivion
Angaben in Bildern pro Sekunde (FPS)
|
Die bekannte Quake-Reihe von ID-Software ist jedes mal ein Highlight für einen „First Person Shooter“-Fan, da die Spiele nicht nur einen hohen Unterhaltungswert bieten, sondern auch mit einer Grafikpracht daherkommen, die häufig die Messlatte ein gutes Stück höher legt. Die aktuelle Version, Quake 4, wurde allerdings von Raven Software programmiert und nutzt eine leicht weiterentwickelte Doom-3-Engine. Somit liegt die Grafik auf einem hohen Niveau, kann aber keine neue Maßstäbe setzen. Nichtsdestotrotz bietet das Spiel mit aufwändigen Charaktertexturen und vielen Schattenspielen einiges fürs Auge. Die ausgesuchte Timedemo zeigt mehrere Feuergefechte sowie spektakuläre Schatten- und Farbspiele. Nach dem Patchen des Spiels auf die Version 1.2 ist auch der Bug verschwunden, dass weder die Spielerschatten noch die Waffeneffekte dargestellt werden. Somit entsprechen die ermittelten Ergebnisse nun dem „wahren“ Spielverlauf.
Quake 4
Angaben in Bildern pro Sekunde (FPS)
|
Wie bei den Mainboard-Tests haben wir auch eingeschränkte Versuche zum Übertakten unternommen. Wir möchten hierbei keine Rekorde aufstellen, sondern einfach die OC-Möglichkeiten von DDR3 zeigen und mit Screenshots von CPU-Z dokumentieren.
Wir erhöhen den FSB erst in 10-MHz-Schritten, bis die Grenzen des Speichers erreicht sind. Danach wird in 1-MHz-Schritten der höchste Wert ermittelt. Überprüft wird die System-Stabilität mit Orthos (Prime95), das recht empfindlich auf zu hoch getaktete Systeme reagiert.
Auf unserem Testsystem mit dem Asus P5K3 Deluxe konnten wir eine Steigerung auf 714 MHz, effektiv DDR3-1428 oder auch DDR3-11424 erreichen.
Kommen wir zur Zusammenfassung der bisherigen Ergebnisse in den einzelnen Kategorien. Wir geben ein Ranking der getesteten Mainboards in den Bereichen „Synthetische Benchmarks“, „Anwendungen“ und „Spiele“.
Performance-Rating: Synthetisch
Angaben in Prozent
|
Performance-Rating: Anwendungen
Angaben in Prozent
|
Performance-Rating: Spiele
Angaben in Prozent
|
Wie so häufig bei der Einführung neuer Technologien fällt es auch bei der DDR3-Technik schwer, auf Anhieb einen Nutzen gegenüber DDR2 zu erkennen. Betrachtet man die Messwerte, zeigt sich trotz höherer Bandbreite kaum ein Vorsprung für DDR3. Werfen wir noch einen Blick auf die theoretisch möglichen Bandbreiten bei DDR2 und DDR3.
| Speichertyp | Bustakt | Bandbreite theoretisch Single Channel | Bandbreite theoretisch Dual Channel |
| DDR2-533 | 266 MHz | 4,2 GB/s | 8,4 GB/s |
| DDR2-667 | 333 MHz | 5,3 GB/s | 10,6 GB/s |
| DDR2-800 | 400 MHz | 6,4 GB/s | 12,8 GB/s |
| DDR2-1066 | 533 MHz | 8,5 GB/s | 17,0 GB/s |
| DDR3-1066 | 533 MHz | 8,5 GB/s | 17,0 GB/s |
| DDR3-1333 | 666 MHz | 10,6 GB/s | 21,2 GB/s |
| DDR3-1600 | 800 MHz | 12,8 GB/s | 25,6 GB/s |
Betrachtet man jetzt zusätzlich die Bandbreite der aktuellen Intel-Prozessoren mit FSB 1333, die bei rund 10,6 GB/s liegt, erkennt man, das bereits kostengünstiges DDR2-667 genügend theoretische Bandbreite zur Verfügung stellt. In der Praxis werden natürlich nicht die theoretischen Werte erreicht, daher ist der Griff zu DDR2-800 durchaus gerechtfertigt. Bei DDR3 mit seiner hohen theoretischen Bandbreite bleibt dieser Grund allerdings auf der Strecke. Hier versucht eine neue Speichertechnologie aus einer veralteten und stark Bandbreiten-limitierten FSB-Technik mehr Leistung heraus zu kitzeln. Ein ziemlich sinnloses Vorhaben.
Erst ab Ende 2008, wenn Intel mit seinen Nehalem-CPUs [15] auf den Markt kommen, wird der Einsatz von DDR3 wirklich Sinn ergeben. Diese werden über einen integrierten Speichercontroller verfügen und damit dem FSB-Flaschenhals ein Ende bereiten. AMD wird DDR3 vermutlich erst 2009 mit den Desktop-Plattformen Python (Highend) und Copperhead (Mainstream) auf diesen Zug aufspringen. Allerdings gibt es doch den ein oder anderen Grund, einen Wechsel der Speicher-Plattform bereits jetzt zu vollziehen. Gerade für Overclocker bietet der hohe Takt von DDR3 einigen Spielraum nach oben. Auch die Latenzen sind bereits auf dem Weg nach unten – in Kürze werden DDR3-Module mit CL5 verfügbar sein [8].
Ein weiterer Aspekt ist die geringere Versorgungsspannung der Speichermodule. Durch die Absenkung auf 1,5 Volt kann durchaus weniger Energie verbraucht werden. Wirklich interessant ist dies aber wohl hauptsächlich für den mobilen Einsatz. Hier plant Intel mit der Montevina-Plattform für das erste Halbjahr 2008 [16] den Umstieg auf DDR3. Auch bei Chipsätzen mit integrierter Grafik mag die hohe Bandbreite von DDR3 für einen kleinen Performance-Schub sorgen. Dies wird sich schon in naher Zukunft an den bald verfügbaren Mainboards mit Intels neuem G33-Chipsatz [17] messen lassen.
Zu guter Letzt gerät bei DDR3 der bisher recht wichtige Einsatz von zwei Speichermodulen im Dual-Channel-Modus in Bedrängnis. Bei DDR3-1600 reicht bereits ein Modul mit seiner Bandbreite von etwa 12 GB/s theoretisch völlig aus, um den Prozessor mit Daten zu versorgen. Die kostspielige Anschaffung von zwei Modulen ist somit also, theoretisch, nur noch von der gewünschten Speichermenge abhängig, nicht mehr von der erhöhten Bandbreite.
Für so genannte „Early Adopter“, Personen also, die immer die neueste Technik ihr Eigen nennen wollen, führt bereits jetzt kein Weg an DDR3 vorbei. Einen technischen Nutzen gibt es zur Zeit kaum, schon gar keinen Leistungsschub, wie ihn sich viele sicherlich von der neuen Speichertechnik erhofft haben. Zwischen ein und zwei Prozent mehr Leistung bietet DDR3 zur Zeit, wie unser Ranking zeigt, das liegt fast noch im Bereich der Messtoleranzen. Vor allem bei den Taktraten und den Timings wird sich aber wohl noch einiges verändern. Wünschenswert wären zunächst jedoch DDR3-1600-Module mit JEDEC-konformen 1,5 Volt Betriebsspannung.