Einleitung
Geht es um den Erfolg auf dem Chipsatzmarkt für AMDs Athlon 64- und Athlon 64 FX-Prozessoren, braucht nVidia, ursprünglich hauptberuflicher Grafikkartenproduzent, mit Erfolgsmeldungen derzeit nicht zu geizen. Nach einer eher schwachen Vorstellung der verschiedensten nForce 3-Derivate hat der am 19. Oktober 2004 [1] offiziell vorgestellte nForce 4 mit seiner Ausrichtung auf den High-End-Markt allem Anschein nach nicht nur uns überzeugen können. Und so stieg der sich seit der Vorstellung des „Ur-nForce“ Ende 2001 tendenziell im Aufwind befindliche Marktanteil zum 4. Quartal 2004 auf stolze 46 Prozent. Vor wenigen Wochen vermeldete man darüber hinaus die Auslieferung des 350.000. nForce 4 SLI-Chipsatzes.
Am 19. November 2004, also genau einen Monat nach der Präsentation des nForce 4 (Ultra/SLI) für AMD-CPUs, folgte mit der Bekanntgabe [2] eines Patent Cross Licence Agreement zwischen Intel und nVidia nicht nur die Bestätigung aller diesbezüglich um den Globus wabernden Gerüchte. Auch die Markteinführung eines nVidia-Chipsatzes für Pentium-Prozessoren schien auf einen Schlag aus weiter Ferne in greifbare Nähe gerückt zu sein.
Und nach dem sich die Meldungen um einen so genannten „nForce 5“ verdichten, wir den Namen gegen Ende Februar auf nForce 4 (Intel Edition) konkretisieren konnten [3] und nVidia auf dem IDF in Eigenregie und Hersteller auf der CeBIT 2005 gegen Anfang 2005 lauffähige Platinen präsentierten, erfolgt heute, nicht ganz ein halbes Jahr nach Einführung des nForce 4 für AMD, die Präsentation des nForce 4 SLI (Intel Edition).
nForce 4 SLI (Intel Edition)
Features
Grundsätzlich beruht die Intel Edition auf dem nForce 4 für AMD-Prozessoren, allerdings musste nVidia eine neue Northbridge entwickeln, da die Intel-Prozessoren nicht über einen eigenen Memory-Controller verfügen. Die Integration in den MCP (Media and Communication Processors) wäre zu aufwändig und zu teuer geworden. Vorerst wird es übrigens nur eine Version des Chipsatzes, den nForce 4 SLI (Intel Edition), geben. nVidia sieht sich mit der Top-Version im absoluten High-End- und Enthusiasten-Segment als Ergänzung zu Intels Produktpalette positioniert. Ob das zwischen Intel und nVidia geschlossene Patent Cross Licence Agreement [1] auch Chipsätze im unteren Preissegment vorgesehen hat, ist derzeit zwar ungewiss. Wir gehen allerdings davon aus.
Welche Besonderheiten zeichnen den nForce 4 Intel Edition nun aus? Sicherlich muss hier die SLI-Fähigkeit an erster Stelle genannt werden. nVidia stellt damit für beide Prozessoren-Hersteller Chipsätze zur Verfügung, die den gleichzeitigen 3D-Betrieb zweier Grafikkarten gestatten. Ein Feature, auf das Intel-Enthusiasten schon länger gewartet haben, um endlich auch in ungeahnte Frameraten-Höhen zu gelangen. Natürlich muss für solch ein potentes Grafikkarten-Gespann auch ein entsprechend leistungsfähiger Prozessor eingesetzt werden.
Die RAID-Funktionalität des nForce wurde gegenüber der AMD-Version weiter ausgebaut. Neben den RAID-Modi 0, 1, 0+1 und JBOD steht jetzt auch der Modus 5 zur Verfügung. Dieser benötigt mindestens drei Laufwerke, die zur erhöhten Datensicherheit erforderlichen Paritätsinformationen werden dabei auf allen Laufwerken verteilt. Fällt eine Festplatte aus, sind alle Daten wiederherstellbar. Damit nicht genug, denn der nForce 4 ist mit nativem SATA II und dem nVidia-eigenen „Cross-RAID“ ausgestattet. Somit stehen also bis zu 3 GBit/s auf der Haben-Seite, zusätzlich lassen sich RAID-Verbände über SATA- und bis zu vier PATA-Festplatten mischen.


Die MCP-Southbridge stellt fünf PCI-Ports, 7.1-AC97-Sound, zehn USB 2.0-Ports und natives GBit-LAN mit Hardware-basierender Firewall (Active Armor) [4] zur Verfügung. Die Northbridge, von nVidia seit jeher auf SPP (System Platform Processors) getauft, ist per Hypertransport mit der Southbridge verbunden. Insgesamt stehen 20 PCIe-Lanes zur Verfügung, die Aufteilung hängt davon ab, ob SLI genutzt wird oder nicht. Die sonst 16 Lanes des ersten Grafikkarten-Slots und die eine Lane des zweiten Slots werden im SLI-Betrieb zu zweimal acht Lanes auf beide Grafikkarten-Slots aufgeteilt. Die restlichen drei Lanes werden von nVidia jeweils als PCIe x1 herausgeführt.
Der 128-Bit-Memory-Controller im SPP weist ebenfalls einige Besonderheit auf, auf die wir auf der kommenden Seite noch genauer eingehen werden. Insgesamt können bis zu 16 GB DDR2-RAM adressiert werden. Die Bandbreite erreicht dabei bis zu 10,6 GB/s. Beim FSB beherrscht der nForce 4 natürlich einen Takt von 1066 MHz für die aktuellen (und zukünftigen?) EE-Prozessoren – nVidia selbst wirbt mit über 1200 MHz per Overclocking. Nachfolgend einige Chipsatz-Impressionen sowie der direkte, tabellarische Vergleich mit der aktuellen und zukünftigen Intel-Konkurrenz.



| Features | i955X | i925XE | nForce 4 SLI (Intel Edition) |
|
|---|---|---|---|---|
| Northbridge Features | ||||
| Northbridge | NG82955X | NG82925XE | Crush19 | |
| Package | - | 1210 FCBGA3 | - | |
| Frontside-Bus | ||||
| 400 MHz | Nein | Nein | Ja | |
| 533 MHz | Nein | Nein | Ja | |
| 800 MHz | Ja | |||
| 1066 MHz | Ja | |||
| Hyper-Threading | Ja | |||
| „Perf.-Accel.-Tech.“ (PAT) | Nein | Ja | Nein | |
| „Mem.-Pipe.-Tech.“ (MPT) | Ja | Nein | DASP 3.0 | |
| „Com.-Strea.-Archi.“(CSA) | Nein | |||
| Integrierte Grafik | Nein | |||
| Speichertakt/typ | ||||
| 100 MHz/DDR1-200 | Nein | |||
| 133 MHz/DDR1-266 | Nein | |||
| 166 MHz/DDR1-333 | Nein | |||
| 200 MHz/DDR1-400 | Nein | |||
| 200 MHz/DDR2-400 | Ja | |||
| 266 MHz/DDR2-533 | Ja | |||
| 333 MHz/DDR2-667 | Ja | Ja*² | Ja | |
| * Nur bei FSB533 möglich. *² Inoffiziell in einigen Bios-Versionen verfügbar |
||||
| Asynchroner Speichertakt | Ja | |||
| Speicherbestückung | ||||
| Speicherkanäle | 2 | |||
| DIMMs pro Kanal | 2 | |||
| DIMMs insgesamt | 4 | |||
| ECC | Ja | Nein | Nein | |
| Max. Speicher | 8 GB | 8 GB | 16 GB | |
| AGP Support | Nein | |||
| PCI Express Support | ||||
| x1 | Ja (4-6 Ports) | Ja (4 Ports) | Ja (3-4 Ports) | |
| x4 | Nein | |||
| x16 | Ja | Ja | Ja (zwei x8 bei SLI) |
|
| Southbridge Features | ||||
| Southbridge | FW82801GB/R ICH7/R |
FW82801FB/R ICH6/R |
MCP 04 Ultra | |
| Package | - | 609 PBGA | - | |
| Festplattencontroller | ||||
| P-ATA 100 | Ja/1 Ch. | Ja/1 Ch. | Ja/2 Ch. | |
| P-ATA 133 | Nein | Nein | Ja | |
| S-ATA 150 | Ja/4 Ports | |||
| S-ATA II 300 | Ja/4 Ports. | Nein | Ja/4 Ports. | |
| RAID | 0/1/5/10 | 0/1 | 0/1/5/10 | |
| PCI-Slots (max) | 6 | 6 | 5 | |
| USB-Unterstützung | ||||
| USB Ports | 8 | 8 | 10 | |
| USB 2.0 | Ja | |||
| Firewire | Nein | |||
| Audio | HD Audio 24 Bit 192 kHz AC'97 2.3 Audio |
7.1 Audio 24 Bit 96 kHz AC'97 2.3 Audio |
||
| Sonstiges | ||||
| I/O-Link | Direct Media Interface (2,0 GB/s) |
Hyper Transport (800 MHz) |
||
Geschwindigkeit
Features sind die eine Seite der Medaille, die Geschwindigkeit bildet die andere. Um sich nicht nur in Sachen Ausstattung im High-End-Segment positionieren, sondern auch gegen Intels generell sehr schnell ausgelegte Chipsätze bestehen zu können, hat nVidia dem vollkommen neu und erstmals für Intel-CPUs ausgelegten Speichercontroller besondere Beachtung geschenkt. Neben der ausschließlichen Unterstützung von DDR2 bis in Taktregionen von 333 MHz (DDR2-667) sind es vorallem drei technologische Aspekte, die den nForce 4 SLI (Intel Edition) von seinen Konkurrenten abheben sollen:
- Efficient Bus Utilization
- Dynamic Adaptive Speculative Preprocessor (DASP) 3.0
- QuickSync Technology
Unter „Efficient Bus Utilization“ versteht nVidia ein gegenüber Intel-Chipsätzen aggressiver ausgelegtes Speichermanagment, wobei hier sicherlich jeder Hersteller sein eigenes Verfahren als im Vorteil sieht. So greift der nForce 4 SLI (Intel Edition) mit einer Burst Length von vier und 1T-Adressierung auf den Arbeitsspeicher zu. Dies bedeutet, dass beispielsweise für den Read-Befehl nur ein Takt in Anspruch genommen wird und anschließend vier Takte lang die Daten aus dem Speicher gelesen werden. Bei einem 64-Bit-Speicherbus werden somit in einem Lesevorgang maximal 32 Byte Daten übertragen ( 64 Bit * 4 Takte / (8 Bit) = 32 Byte). Intel hingegen verwendet als Standard einen Speicherzugriff mit einer Burst Length von acht und 2T. An der Datenübertragung ändert sich zwar nichts. Allerdings kann der nForce 4 SLI (Intel Edition) theoretisch zwei weitere Speicherzugriffe (Activate/Precharge/Refresh) in derselben Zeit tätigen - vorausgesetzt, sie geschehen schnell genug.
Der „Dynamic Adaptive Speculativ Preprocessor (DASP) 3.0“ stellt die dritte Generation eines erstmals im nForce 1 eingeführten „Vor-Prozessors“ zur Sprungvorhersage dar. Um dessen Funktionsweise und Aufgabe zu verstehen, wollen wir kurz einen Abstecher zur Arbeitsweise der CPUs wagen.
Um Berechnungen durchzuführen, benötigt jeder Prozessor Daten und je schneller er rechnet, desto zügiger sollten ihm die benötigten Bits und Bytes zur Verfügung gestellt werden. Doch schneller Speicher ist schwer zu fertigen und somit teuer - sehr teuer. Aus diesem Grund rufen Prozessoren ihre Daten seit Generationen aus einer Speicher-Hierarchie ab, an deren Anfang der (heutzutage) mit dem Prozessortakt laufende Level-1-Cache (L1) und an dessen Ende der Arbeitsspeicher (oder im schlimmsten Fall die Festplatte) steht. Auch Software-Entwickler versuchen, durch die wiederholte Nutzung (temporal locality) des identischen Codes oder die Ablage dringend benötigter Daten in den höchsten Stufen der Cache-Hierarchie (spatial locality), der CPU den Zugriff auf die Daten so schnell wie nur geht zu ermöglichen.
Doch bedingt durch den immer noch nur wenige Kilobyte großen L1-Cache, einen nur unwesentlich größeren L2-Cache und den im Vergleich archiaisch anmutenden Arbeitsspeicher, würde es zwangsläufig zu unzähligen cache misses (die Daten, die die CPU benötigt, liegen nicht vor) und langen Wartepausen kommen, hätte man dem Prozessor nicht schon vor Ewigkeiten eine so genannte prefetch unit (pre = vor, to fetch = holen; frei übersetzt in „Vorhersageeinheit“) spendiert, die versucht, die Datenanforderungen der CPU zu antizipieren und somit Daten zu laden, bevor sie benötigt werden. Laut nVidia resultieren dann auch ca. 90 % der Speicherzugriffe der CPU über den Chipsatz aus genau diesen prefetch requests. Was im Umkehrschluss jedoch bedeutet, dass rund 10 % der Daten eben nicht rechtzeitig von der CPU angefordert (da vorhergesagt) wurden oder die Vorhersage falsch war und nun neue Informationen aus dem Hauptspeicher heran geschafft werden müssen.
nVidias DASP 3.0 versucht nun, die Vorhersage der CPU-internen Vorhersageeinheit vorherzusagen. Klingt unglaublich, funktioniert aber genau so. Zu diesem Zweck wurden gleich eine Reihe an Pre-Prozessoren durch aufwendige (statistische) Verfahren auf die Funktionsweise der aktuellsten Prozessoren geeicht und mit möglichst effizienten Algorithmen zur Sprungvorhersage versehen. Die Pre-Prozessoren, die alle an einen so genannten „Arbiter“ angeschlossen sind, sollen in der Lage sein, jeden Thread auf jedem CPU-Core (hier nimmt nVidia die Unterstützung Intels kommender Dual-Core-CPUs also erstmals direkt in den Mund) zu analysieren, den bestmöglichen Algorithmus zur Auswahl der Daten anzuwenden und diesen über eine gewisse Lernfähigkeit, wird der Thread dann letztendlich ausgeführt, noch optimieren zu können.
Der Arbiter koordiniert die verschiedenen Pre-Prozessoren und sorgt darüber hinaus dafür, dass der GPU und den restlichen Systemkomponenten der Speicherzugriff nicht verwährt wird. Neben der Anpassung der Vorhersagealgorithmen in Hard- und Software haben insbesondere Intels Hyper-Threading-Technology und Multi-Core-CPUs die Entwicklung einer solchen Einheit erschwert. Die Größte Herausforderung dürfte somit die erfolgreiche Vorhersage der Vorhersage der Vorhersageeinheit der kommenden Extreme Editions mit zwei CPU-Kernen und HT-Technology gewesen sein. ;-)
Unter der Bezeichnung „QuickSync Technology“ versteht nVidia die Optimierung der Chipsatz-Logik, die für die Synchronisation bzw. die Datenüberführung zwischen Frontside-Bus und Speicher-Bus verantwortlich ist. Neben unterschiedlichen Protokollen erschweren insbesondere voneinander abweichende Taktraten auf beiden Datenbahnen die Anpassung - ein Grund, warum auch wir in der Vergangenheit bei einer Vielzahl an Chipsätzen oftmals von einem asynchronen Betrieb, d.h. unterschiedlichen Taktraten auf FSB und Speicher, abgeraten haben.
Doch neben der Nutzung von DDR2-533/DDR2-667 auf einer FSB800-CPU (200 MHz FSB) hat nVidia auch das Übertakten als Einsatzgebiet für QuickSync im Visier. Durch die dynamische Beschleunigung des internen Datenpfades beim Übertakten von FSB und/oder Speichertakt soll sich der nForce 4 SLI (Intel Edition) auch in höheren Taktregionen nicht verschlucken und die Überführung der Datenpakete immer in der schnellstmöglichen Zeit vollführen. Das Phänomen, dass der Speichertransfer beim stetigen Übertakten urplötzlich einbricht (und das wir in nachfolgender Grafik noch einmal veranschaulicht dargestellt haben), will nVidia so aus der Welt geschaffen haben.
Darüber hinaus unterstützt der nForce 4 SLI (Intel Edition) den von nVidia mit dem nForce 1 ins Leben gerufenen Dual-Channel-Modus und dies auch bei einer Bestückung mit unterschiedlich großen Modulen. Die höchste Performance zeigt sich allerdings beim Einsatz gleich großer Module (finer-grain interleaving). Als letzten, komparativen Wettbewerbsvorteil gegenüber der Konkurrenz preist nVidia die Einführung eines „dedicated address bus“ an. Für die Adress-Kommunikation zwischen DIMMs und Chipsatz stehen beim nForce 4 (Intel Edition) jedem DIMM ein eigener Bus zur Verfügung, während in herkömmlichen Systemen alle Riegel über einen Bus kommunizieren. Selbst bei hohen Taktraten soll der Chipsatz auf diese Weise mit 1T-Adressierung arbeiten können.
Nach zwei Seiten Theorie wenden wir uns nun der Praxis zu.
nVidia-System
Als Testsystem erreichte und am Wochenende ein komplett konfektioniertes System von Arlt.de [5]. Neben dem mit einem Intel Pentium 4 660-Prozessor bestückten nForce 4 SLI (Intel Edition)-Mainboard und einem Gigabyte DDR2-Speicher aus dem Hause Corsair, stachen insbesondere die zwei Gainward GeForce 6800 Ultra-Karten im SLI-Betrieb und vier Western Digital Raptor-Platten im Raid-5-Verbund hervor.





Das im System verbaute Referenz-Board kann seinen Vorseriencharakter nicht von sich weisen. Neben unzähligen Beschriftungen fallen insbesondere eine Reihe an Lötbrücken auf, die um den CPU-Sockel herum und auf der Rückseite zwischen MCP und DIMM-Slots vorgenommen wurden. Die SPP trägt die Revision A2.1, die MCP die Revision A3.







Die bereits auf der CeBIT 2005 gezeigten Platinen [6] zeigten übrigens (bis auf ABIT) eine passive Kühlung, das Modell von MSI kam sogar ohne die SLI-Steckkarte daher.
Das BIOS bietet in alter nVidia-Manier eine Fülle von Einstellungsmöglichkeiten. Der Multiplikator der Intel Pentium 4-CPUs darf manuell auf 14 herunter geregelt werden. Die VID-Spannung ist mit Werten zwischen 0,8375 und 1,6000 Volt ebenso konservativ einstellbar, wie die DIMM-Spannung mit bis zu 2,1 Volt - Werte, die auf den Retail-Platinen der Board-Partner mit Sicherheit aggressiver ausfallen. Bei bis zu 150 MHz PCI-Express-Frequenz, 350 MHz FSB-Takt und 450 MHz Speichertakt ermöglicht das Referenzboard jedoch eine Menge.







Als besonderes Feature gestaltet sich der bereits in der Theorie mit dem QuickSync-Feature angesprochene Betrieb von FSB und Speicherbus. Der nForce 4 SLI (Intel Edition) erlaubt hier im „Expert“-Modus die vollkommen Teiler-freie Einstellung der beiden Bus-Takte. Voneinander unabhängig können FSB und Speicherbus bis auf ein halbes MHz genau gewählt werden.
Testsystem
- Prozessor
- Pentium 4, HyperThreading, Sockel 775, FSB1066, Dual Channel DDR2-533 4-4-4-12
- 3,73 GHz Extreme Edition (90 nm Prescott 2M)
- Pentium 4, HyperThreading, Sockel 775, FSB1066, Dual Channel DDR2-533 4-4-4-12
- Motherboard
- Pentium 4 Sockel 775 Plattform:
nVidia nForce 4 SLI (Intel Edition) Referenzplatine
Intel D925XECV2 (i925XE Express)
Intel D955XBK (i955XE Express, Pre-Production)
- Pentium 4 Sockel 775 Plattform:
- Arbeitsspeicher
- 2x512MB DDR2-667 Corsair Module (CL3-2-2-5)
- 2x512MB DDR2-667 Micron Module (CL5-5-5-15)
- 2x512MB DDR2-533 Micron Module (CL4-4-4-12)
- Grafikkarte
- Gainward GeForce 6800 Ultra (PCI Express)
- Peripherie
- Speer LDW411S [7]
- Hitachi HDS722516VLSA80 (Intel)
- 4x RAID5 Western Digital Raptor WD740GD (nVidia)
- Netzteil
- BeQuiet P4-400W-S1,3
- Enermax EG-701AX (nVidia)
- Treiberversionen
- nVidia Detonator 71.84
- Intel Inf-Treiber 6.01.1002
- nVidia ForceWare 7.02
- Software
- Microsoft Windows XP Professional SP2
- Microsoft DirectX 9.0c
Benchmarks
Speicherperformance
Widmen wir uns zu Anfang gleich der Speicherperformance unter den unterschiedlichen Bedingungen, die uns diese Plattform ermöglicht. Hier sollte sich zeigen, wie viel denn wirklich hinter nVidias Anpreisungen bezüglich des Speicherkontrollers steckt. Praktischerweise können quasi alle Änderungen mit Hilfe nVidias Tuning-Tool nTune unter Windows vorgenommen werden. Lediglich den FSB1066 mochte oder kannte das Programm noch nicht - der Regler ging schlichtweg nicht weit genug.


SiSoft Sandra
Widmen wir uns zuerst dem Vergleich der drei heute miteinander konkurrierenden Chipsätze.
Sandra 2005 SR1 - Speicherdurchsatz
Angaben in Megabyte pro Sekunde (MB/s)
|
Unter Einsatz von DDR2-667 mit einer Cache Latency von nur drei Taktzyklen lässt der nForce 4 SLI (Inte Edition) die gesamte Konkurrenz hinter sich. Während der i955X mit ansonsten eher weniger berauschenden Timings noch zu einem CL3 in Sandra überredet werden konnte (in allen anderen Anwendungen hagelte es Bluescreens), verweigerte der i925XE die Zusammenarbeit komplett. Auch unter den gleichen Speichertimings bei CL5 kann der nVidia-Chip einen klaren Vorteil gegenüber dem i955X herausarbeiten.
Sciencemark
ScienceMark v2 - Speicherdurchsatz
Angaben in Megabyte pro Sekunde (MB/s)
|
Ein etwas anderes Bild präsentiert sich uns im Sciencemark, denn dieser sieht in Sachen Speicherbandbreite plötzlich den i955X bei CL5 vor dem nForce 4 SLI (Intel Edition).
ScienceMark v2 - Speicherlatenz
Angaben in Nanosekunden
|
Glasklar scheint hingegen die Überlegenheit des nForce 4 SLI (Intel Edition) bei den Speicherlatenzen zu sein. Dank seiner problemlosen Zusammenarbeit bei CL3 erreicht der Chipsatz Verzögerungszeiten, von denen die Konkurrenten nur träumen kann. Weder i925XE noch i955X konnten in dieser Disziplin zu CL3 überredet werden.
Im weiteren Verlauf der Benchmarks haben wir uns dazu entschieden, bei den Intel-Plattformen auf die von Intel spezifizierten Timings zu setzen. Aus diesem Grund haben wir beim noch ausstehenden i955X auf CL4 verzichtet. CL3 war auf beiden Intel-Chipsätzen - wie bereits erwähnt - nicht möglich.
Die nachfolgenden Vergleiche sollen insbesondere dem von nVidia beworbenen Memorycontroller mit seinem QuickSync-Feature auf den Zahn fühlen.
nForce 4 SLI (IE) Speicherperformance
Angaben in Megabyte pro Sekunde (MB/s)
|
Bestückt mit einer FSB1066-CPU (266 MHz QDR) kann der Crush19 durchaus von einem Betrieb mit asynchron bei 333 MHz taktenden DDR2 profitieren. DDR2-667 mit schlechten Timings liegt vor DDR2-533 mit guten Timings.
nForce 4 SLI (IE) Speicherperformance
Angaben in Megabyte pro Sekunde (MB/s)
|
Auch der Betrieb bei FSB800 sieht die Konfigurationen mit DDR2-667 geschlossen vor den Varianten mit DDR2-533. Das Schlusslicht bildet DDR2-400. Der asynchrone Betrieb scheint dem nForce 4 SLI (Intel Edition) tatsächlich nichts auszumachen. Gut zu beobachten ist in diesem Diagramm darüber hinaus die Auswirkung des BIOS-Schalters „FSB Turbo“ - zumindest in Sachen Speicherbandbreite gibt es kaum eine. Bei einem FSB von 266 MHz ist der Schalter im BIOS nicht mehr verfügbar.
nForce 4 SLI (IE) Speicherlatenzen
Angaben in Nanosekunden
|
Das letzte Diagramm verdeutlicht, dass bei den Speicherlatenzen sowohl FSB- als auch Speichertakt und Timings eine Rolle spielen. Die Reihenfolge entspricht in etwa den Erwartungen.
PCI Express-Performance
PCI Express Backchannel Bandbreite
Angaben in Megabyte pro Sekunde (MB/s)
|
Die Geschwindigkeit des Rückkanals des PCIe x16-Steckplatzes kann sich auf dem nForce 4 SLI (Intel Edition) klar von der Konkurrenz absetzen.
Office/System
7-Zip 3.13 "Ultra"
7-Zip 3.13 "Ultra"
Angaben in Minuten, Sekunden
|
Abbyy FineReader
Abbyy FineReader 7.0 Professional
Angaben in Minuten, Sekunden
|
Seti@home
Seti@Home 3.03
Angaben in Stunden, Minuten
|
Audio-/Videoencoding
Lame
Lame 3.97a (Alpha) - Intel Compiler
Angaben in Minuten, Sekunden
|
Lame 3.97a (Alpha) - Microsoft Compiler
Angaben in Minuten, Sekunden
|
iTunes
Apple iTunes 4.7.1 (AAC)
Angaben in Minuten, Sekunden
|
Apple iTunes 4.7.1 (MP3)
Angaben in Minuten, Sekunden
|
Windows Media Encoder
Microsoft Windows Media Encoder 9.0
Angaben in Minuten, Sekunden
|
Windows Movie Maker
Microsoft Windows Movie Maker 2.1
Angaben in Minuten, Sekunden
|
TMPGEnc
TMPGEnc 3.0 Express (NTSC DVD)
Angaben in Minuten, Sekunden
|
Adobe Premiere
Adobe Premiere Pro 1.5
Angaben in Minuten, Sekunden
|
Adobe After Effects
Adobe After Effects 6.5
Angaben in Minuten, Sekunden
|
CAD/Raytracing
Spec Viewperf 8.01
Spec Viewperf 8.01
Angaben in Bildern pro Sekunde (FPS)
|
Cinema4D
Cinema 4D XL R9
Angaben in Minuten, Sekunden
|
Lightwave
Lightwave 8.01
Angaben in Minuten, Sekunden
|
Spiele
3DMark03
3DMark03
Angaben in Punkten
|
3DMark03 (CPU)
Angaben in Punkten
|
3DMark05
3DMark05
Angaben in Punkten
|
3DMark05 (CPU)
Angaben in Punkten
|
Far Cry 1.3
FarCry 1.3
Angaben in Bildern pro Sekunde (FPS)
|
Doom 3
Doom 3
Angaben in Bildern pro Sekunde (FPS)
|
Half-Life 2
Half-Life 2
Angaben in Bildern pro Sekunde (FPS)
|
UT2004
Unreal Tournament 2004
Angaben in Bildern pro Sekunde (FPS)
|
Sonstiges
SLI
Der Hauptvermarktungsgrund des nForce 4 SLI (Intel Edition) wird vorerst ganz klar das SLI-Feature bleiben und im Netz halten sich hartnäckig Gerüchte, wonach die Vereinbarung zwischen Intel und nVidia letztendlich von Intel nur initiiert wurde, um das für Enthusiasten und im Marketing so wichtige Feature an Land zu ziehen. Schließlich geht es nicht nur um potentiell verlorene Kunden an AMD, sondern auch um die zahlreichen Benchmarkrekorde, die immer unter Zuhilfenahme einer AMD-CPU zustande gekommen sind, da bis heute eben nur SLI geboten wurde.
3DMark05 - SLI
Angaben in Punkten
|
3DMark03 - SLI
Angaben in Punkten
|
Umso erstaunlicher zeigt uns der 3DMark05 ein Ergebnis, das wir so nicht erwartet hatten. Ausgestattet mit einer Pentium 4 Extreme Edition 3,73 GHz-CPU und einem ForceWare-Treiber der 70er-Serie (71.84) sollte der nForce 4 SLI (Intel Edition) beim Einsatz einer 2. Karte einen mindestens ebenso starken Performanceanstieg vorweisen können, wie dies ein schwächerer Athlon 64 3500+ mit einem ForceWare-Treiber der 60er-Generation in unserem großen SLI-Vergleich getan hat - oder nicht? Doch mit 48,8 % im 3DMark05 liegt der heutige Testkandidat deutlich hinter dem Zuwachs des AMD-Pendants (74,4 %) zurück. Im 3DMark03 gleichen sich die Ergebnisse mit 59,8 % (Intel) respektive 61,7 % (AMD) hingegen schon eher.
Half Life 2 - SLI
Angaben in Bildern pro Sekunde (FPS)
|
Doom 3 - SLI
Angaben in Bildern pro Sekunde (FPS)
|
Farcry 1.3 - SLI
Angaben in Punkten
|
Doom 3 und Half-Life 2 zeigen hingegen auch wieder ein „normales Verhalten“, das hier und da auch unsere AMD-Werte überflügelt.
RAID 5
Mit gerade einmal 2 % CPU-Auslastung, 233 MB/s beim Lesen aus dem Festplatten-Cache und einer durchschnittlichen Leserate von 157,9 MB/s weiß der nForce 4 SLI (Intel Edition) die vier Western Digital-Platten gehörig in Szene zu setzen.
SiSoft Sandra 2005 attestiert dem nForce 4 SLI (Intel Edition) eine durchschnittliche Leserate von 131 MB/s und reiht das System so zwischen einem RAID-0-Verbund aus zwei bzw. vier WD-Raptor-Platten unter Windows XP ein.
SiSoft Sandra (Raid)
Angaben in Megabyte pro Sekunde (MB/s)
|
Der RAID-5-Verbund auf dem nVidia-Chip muss gegenüber dem herkömmlichen Striping nach RAID 0 in Sachen Geschwindigkeit nur knapp zurück stecken, bietet jedoch den Vorteil der redundanten Datenspeicherung und kann den Ausfall einer Platte somit ohne Datenverlust verkraften.
Overclocking
Der nForce 4 SLI (Intel Edition) bietet, wie im Abschnitt nVidia-System angesprochen, manigfaltige Übertaktungsoptionen im Bios an und nVidia selber wirbt offen mit einem FSB von 300 MHz (FSB1200). Uns war es allerdings nicht vergönnt, den FSB trotz reduziertem CPU-Multiplikator und Speichertakt auf einen höheren Takt als 272 MHz zu treiben.
Aufgrund der vielen, manuellen Modifikationen, die auf der Platine vorzufinden waren, sehen wir das Resultat allerdings nicht als Gesetz für die Serie und sind auf Übertaktungsresultate mit Retail-Platinen gespannt.


Fazit
Ohne Frage, nVidias nForce 4 SLI (Intel Edition)-Chipsatz bietet Features und Performance satt. Insbesondere beim Einsatz schneller DDR2-667-Module im asynchronen Modus mit einer FSB1066-CPU und den Timings 3-2-2-5-8-1 (die übrigens nicht nur auf den Corsair- sondern auch auf den nur mit 5-5-5-12-20-1 spezifizierten Micron-Riegeln liefen) stellt der erste Intel-Abkömmling des Grafikkartenspezialisten die Konkurrenz des Prozessorgiganten teilweise deutlich in den Schatten. Weder auf Intels i925XE noch auf dem i955X* konnten wir annähernd schnelle Timings stabil betreiben. Neben einer brachialen Speicherbandbreite, die sich im Sciencemark allerdings knapp dem i955X geschlagen geben muss, sind es vorallem die Speicherlatenzen, die dem nForce 4 SLI (Intel Edition) auf die Sprünge helfen. So erfolgt der Zugriff auf den Hauptspeicher bis zu acht Prozent schneller als beim i955X* mit denselben Speichertimings. Allem Anschein nach scheinen hinter nVidias vollmundigen Versprechungen in Sachen Memorycontroller tatsächlich mehr als hohle Floskeln zu stecken (siehe auch: nForce 4 SLI (Intel Edition), Geschwindigkeit [8]). Als besonders interessantes Feature für Übertakter könnte sich die Eigenschaft des Chipsatzes heraus stellen, FSB- und Speichertakt komplett unabhängig, Teiler-frei und auf das MHz genau einstellen zu können.
Performancerating
Angaben in Punkten
|
(Pentium 4 Extreme Edition 3,73 GHz, FSB1066)
Gemittelt über den ganzen Benchmarkparcours holt der nForce 4 SLI (Intel Edition) gut drei Prozent gegenüber dem i925X heraus. Betrachtet man den i955X im direkten Vergleich bei CL5, springen immer noch 1,3 Prozent für den nVidia-Chip heraus. Gerade in Spielen (bis neun Prozent) und der Spec View Perf 8.1 fallen die Unterschiede jedoch teilweise deutlich klarer aus, wohingegen die Office-, Enconding- und Rendering-Anwendungen nur geringfügig oder gar nicht vom nForce 4 SLI (Intel Edition) profitieren. Hier kann allen voran die Leistung des i955X* bei CL5 das eine oder andere Mal überzeugen.
Neben dem hohen Speicherzugriff dürfte die Spec View Perf insbesondere von der Geschwindigkeit des PCI Express-Bus profitieren, denn diese liegt (abermals gemessen bei identischen Timings) im Falle des Rückkanals 15 Prozent über dem Wert des i955X*, wobei hier zweierlei Aspekte nicht außer Acht gelassen werden sollten. Erstens handelt es sich beim i955X* noch nicht um das finale Produkt und zweitens hat schon die Vergangenheit bewiesen, dass insbesondere der Grafikkartentreiber einen nicht zu vernachlässigenden Einfluss auf die Performance des Grafikkarten-Bus-Systems für sich in Anspruch nimmt...
Ausstattungstechnisch zeigt sich der nForce 4 SLI (Intel Edition), der in unserem Fall mit der MCP04 Ultra bestückt war, von der besten Seite. Gegenüber dem AMD-Pendant hat der Chipsatz in Sachen RAID 5 nachgelegt und kann den in unserem Testsystem verbauten Western Digital Raptor-Platten ordentlich einheizen, Gigabit-Ehternet samt FireWall, zehn USB-Ports und SATA II gehören weiterhin zum Repertoir. Interessant ist die Möglichkeit, SATA- und PATA-Laufwerke beliebig in einem RAID-Verbund mischen zu können.
Auch die bei nVidia neuerdings übliche Softwarebeigabe in Form von nTune, sowie der FireWall- und Raid-Verwaltungsanwendungen kann sich abermals sehen lassen und wertet den Nutzen der gesamten Plattform für den Windows-Anwender spürbar auf.
Nicht verstecken konnte unsere Referenzplatine ihren Vorseriencharakter, und hier trugen nicht nur die vielen, manuell verlegten Lötbrücken ihren Teil zu bei. So hatten wir mit gelegentlichen Systemhängern und Problemen bei den unteren USB-Ports auf der ATX-Blende und beim Übertakten zu kämpfen. Entgegen der von nVidia umworbenen 300 MHz auf dem FSB (FSB1200) war bei unserem System bei FSB1090 Schluss. Hier werden finale Produkte der Board-Partner zeigen müssen, was in ihnen steckt.
Den seltsamen SLI-Wert im Futuremark-Benchmark vermögen wir derzeit noch nicht richtig einzuordnen. Gut möglich, dass unausgereifte Chipsatztreiber für den unterproportionalen Performancezuwachs im 3DMark05 verantwortlich sind.
Bekommen nVidia bzw. die Board-Partner die von uns aufgezeigten Probleme in den Griff, scheint nVidia die Zielsetzung, den nForce 4 SLI (Intel Edition) im absoluten High-End-Segment auf dem Intel-Sektor zu positionieren, erreicht zu haben. Die Ausstattung ist - bis auf High-Definition-Audio - üppig und die Performance in Verbindung mit sehr schnellem DDR2-667-RAM erstklassig. Einstieg nach Maß? Jawohl! Und genau dort, wo Intel den neuen Partner haben wollte.
* Der Intel-Chipsatz i955X ist noch nicht offiziell vorgestellt worden, die Ergebnisse sind somit mit Vorsicht zu betrachten.










