Leserartikel Quad SLI Erfahrungsbericht

ap0k.

Lt. Commander
Registriert
Nov. 2007
Beiträge
1.342
Ich moechte hier ein kleinen Erfahrungsbericht posten, der sich nicht immer ausschließlich auf die "rohen" Benchmarks bezieht, sondern der sich insbesondere den Mikrorucklern und den anderen SLI Problemchen widmet.

Außerdem werde ich mich mit dem Leistungseinbruechen bei hohen Aufloesungen auseinander setzen und meine damit verbundenen Erfahrungen aussprechen.
Auch der Aspekt der Usebility wird naeher beleuchtet, da solch ein Systemaufbau nicht unbedingt alltaeglich ist.


Zu allererst mein Testsystem:
Intel Xeon w3520 @ 4.2Ghz HK3.0 LC
EVGA x58 SLI ENZOTECH evx-58
6GB Mushkin enhanced OC-Edition CL7 1600Mhz

Gekuehlt wird das ganze von 4 Aquacomputer Airplex 420 Radiatoren mit NB Blacksilend 140mm Lueftern, die mit etwa 550rpm drehen. Die Wassertemperatur gleicht meist etwa 28°.



Jetzt zu den Karten:
Ich benutze zwei GTX 295 die mit einem EK FC 295gtx gekuehlt werden.
Beide sind 16 fach angebunden. Forceware 259.31 und 270.61 wurde verwendet, da diese am besten funktionierten.

Die Taktraten:
Core Clock: 756Mhz
Shader Clock: 1630Mhz
Memory Clock: 1200Mhz
VCore: 1.174V

Damit ist ein Leistungsschub guten 30% drin (im Vergleich zu den Standardtaktraten), allerdings nur unter Vorbehalt. Aber dazu spaeter mehr.



Benchmarks in 5760x1080 Pixeln:

F1 2010 (Max Sets, AF 8x, AA 2x) = 51 fps (min fps: 45,5)

Dirt 2 (Max Sets, AF 8x, AA 2x) = 60 fps (min fps 49,5)

BF Bad Company 2 (DX9! sonst alles Max, AF 8x, AA 2x) = 62 fps (Multiplayerdurchschnitt)

Crysis 2 (Max Sets, 8x AF, AA 2x) = 38 fps (min fps: 17!)

TF2 (Max Sets, 8x AF, AA 2x) = 90 fps (Hier ist der Bildratenunterschied enorm groß, jedoch nie unter 60 Frames. 60-135, die Spielbarkeit leidet hierunter mMn nicht, da die FPS noch ausreichend sind.)

Spiele mit der Unreal Engine 3 habe ich nicht mit einbezogen, da die Frames sehr denen der Source Engine aehneln. Außerdem geraet die Bildrate nie in den roten Bereich, sodass eine genauere Untersuchung eher unwichtig ist. Egal ob in 1920x1080 oder in 5760x1080.



Vergleich zu konventionellen Aufloesung (1920x1200) am Beispiel F1 2010:

F1 2010 habe ich deshalb als Beispiel genommen, da es recht Vram lastig ist und ich mir dachte, dass es interessant sein koennte das Verhalten der im "Forum-verschriehenen Vramkrueppel" zu untersuchen.
Außerdem hat die Ego Engine in vielen Spielen Verwendung gefunden, sodass die Ergebnisse teils uebertragbar sind. Die Sets sind bei allen Test gleich; Max, AF 8, AA 2)

F1 2010 1920x1200 = 65 fps Mit Werkstaktraten (576Mhz...)

F1 2010 1920x1200 = 74 fps Mit den oben erwaehnten Taktungen (756Mhz...)

F1 2010 5760x1080 = 38 fps Mit Werkstaktraten (576Mhz...)

F1 2010 5760x1080 = 51 fps Mit den oben erwaehnten Taktungen (756Mhz...)

Hier sieht man schoen, dass die hoeheren Taktraten erst bei wirklich hohen Aufloesung ein im Verhaeltnis besseres Ergebnis liefern.


Besonderheiten/Auffaelligkeiten: Die FPS in 1920x1200 sind meist nahezu identisch bei 3x SLI und bei 4x SLI (Unterschiede im Zehntelbereich). Allerdings ist 3x sli hier vorzuziehen, da durch die nun staerker bemerkbaren Mikroruckler (bei 4x SLI) Anwendungen unspielbar werden.

In 5760x1080 zeigt sich ein deutliches Leistungsplus bei der Verwendung von 4 GPU's, wodurch der geringe Unterschied von 74 zu 51 fps zu erklaeren ist.

Erstaunlich ist außerdem, dass die Min FPS nicht besonders niedrig sind, obwohl der Speicher etwas unterdimensioniert ist.


Ebenso ist bemerkenswert, dass die 4 GPU's ueberraschend gut skalieren! Viel besser als in 1920x1200. Die dazukommenden hohen Taktraten fuehren dazu, dass die Karten wirklich schnell werden.

Hier der Vergleich von zwei gtx 580 bei nahezu gleichen Einstellungen.

2x GTX 580 --> F1 2010 = 55 FPS

4x GTX 26(5) --> F1 2010 = 51 FPS


SLI Probleme:
Hierzu wurden 1 GTX 260, 2 GTX 260, 3 GTX 260 und 4 GTX 260 getestet.

Mikroruckler treten ab 2er SLI auf (logisch). Jedoch sind diese ab 30 fps eher dezent und wirklich kaum auffaellig. Allerdings gibt es vereinzelnd den ein oder anderen heftigen Ruckler (der sich allerdings nur schlecht messen laesst, da die Aktuallisierungsrate vom Afterburner zu niedrig ist, sodass keine Kellerframes angezeigt werden).

3er SLI verhaelt sich mitlerweile nahezu gleich wie ein 2er SLI System.

Bei 4 GPU's wird dann alles anders; jedenfalls bei Singlemonitorbetrieb.
Denn auch ueber 100 Frames erscheinen die Spiele nicht richtig fluessig. Daher ist Quad SLI voellig unbrauchbar. Gerade auch deswegen, weil sich meist KEIN Leistungsplus einstellt, auch wenn Nvidia was anderes verspricht (CB hat einen Quad SLI Test der GTX 295 (Quad 260 in 55nm) veroeffentlicht, der ein Leistungsplus von Quad zeigt. Das jedoch nur wenn man es mit dem 2er SLI Modus vergleicht. Meist zeigen 3er SLI Kombos gleiche Leistungen wie die Quadsysteme).

Sollte man jedoch ein Quad SLI System und ein Multimonitorsystem benutzten wird Quad sli wieder interessanter. Denn durch NV's Surroundtechnologie steuert (bei meinem System) GPU 4 Monitor 3 an. Dadurch treten die typischen Quad SLI Probleme NICHT auf.
Erst ab der magischen Grenze von 30 Frames wirds kritisch und die typischen Probleme treten ein.


Generell begleitende SLI Probleme: Schattenflimmern, schlechtes FPS-zu-Energiebedarfsverhaeltnis, Treibersupport bei neuen Engines.


"Plug-in and Play" oder "... ich hol' schomal den Bleistift raus zum Voltagetweak."?
Die Verwaltung der 4 GPU's ist nicht zu vergleichen mit einem konventionellen 2er SLI System und man muss schon ziemlich leidensfaehig sein damit man irgendwann dann auch beim Spielen Spaß hat. FOV Mods (usw.) sind darin dann noch nicht erhalten.

Es gibt einfach noch große Probleme mit dem Treibersupport. So koennen die GTX 260 bis zur Treiberfamilie 260.xx kaum mehr als 2x AA in 5760x1080 dastellen, obwohl eigentlich mehr Leistung vorhanden ist. ( Bsp.: TF2 2AA = 90FPS; TF2 4AA 25 FPS --> Absturz in den 2d Modus mit den entsprechenden Taktraten)

Außerdem ist auffaellig, dass solch ein System ohne Wakue kaum zu kuehlen ist, da die 4 GPU's in 5760x1080 erstaunlich gut skalieren, sodass natuerlich auch die Hitzeentwicklung stark zunimmt. Gerade dann noch bei knappen 1.2V und bei zunehmender Verdreckung des Lu-kuehlers wirds dann sehr schnell eng und die 105° werden schnell erreicht.

Bringt man dann doch irgendwann alles richtig zum Laufen, steht dem Spielespaß nichts mehr im Wege.
Daher wuerde ich's jeder Zeit wieder machen, da das System außerdem sehr guenstig war.

Konsten
2 GTX 295 mit EK Wasserkuehler wurden vor etwa 2 Monaten gekauft, fuer 240.-
(via HWLUXX Forum und ebay)



Vor- und Nachteile:

Vorteile:

+Die 4 GPU's skalieren im Surroundsetup wirklich gut

+Sehr dezente Mikroruckler bei NV Surround

+Vram (der mit 896 knapp bemessen ist) offenbart trotz der hohen Aufloesung bis 2 AA kaum Engpaesse

+Große Anschlussmoeglichkeiten bei 4 GPU's

+4 CUDA GPU's

+Letztendlich sehr gute Leistungen (Wenn man bei AA Abstriche machen kann blaest man so ziemlich
alles weg was man beim Großhaendler bekommen kann)

Nachteile:


-Viel Bastelarbeit/schlechter Treibersupport

-Katastrophale Energieeffizienz

-Mehr oder weniger Wakuepflicht

-Mikroruckler, die bei 4x SLI zur Unspielbarkeit fuehren, sofern alle GPUs einen Monitor ansteuern

-Mehr als 8xAA in 5670x1080 sollte nicht benutzt werden

-Fuer Singlemonitorsysteme eher unsinnig, da alle Spiele in 1920x1200 auch schon mit guenstigen Karten fluessig spielbar sind.



Fazit:
Es gibt eine ganze Menge Erkenntnisse, die ich bei meinen Tests gewonnen habe.
(Zwar wurde hier alles anhand der etwas eingestaubten g200b Chips in 55nm getestet, jedoch denke ich, dass die Ergebnisse auf aktuellere GK-Generationen uebertragbar sind und sich dort aehnliche Ergebnisse zeigen werden.)

Zum einen faellt auf, dass die hohen Aufloesungen zwar eine gewisse Groeße des Vrams voraussetzen, jedoch keines Falls mehr als 2GB oder aehnliches voraussetzen.
Zum anderen ist interessant, dass die Skalierung der Karten in hohen Aufloesungen wirklich gut ist und dadurch nicht mit uebermassigen FPS Einbruechen gerechnet werden muss.

Trotzdem kann ich eine Empfehlung fuer solch ein System beim besten Willen nicht aussprechen, da der Stromverbrauch und die erbrachte Leistung in keinem gesunden Verhaeltnis stehen und die Bastelfreude beim User schon enorm groß sein muss.
(Behalten werde ich mein System vorerst trotzdem ;))



Abschließende Worte

Ich hoffe mein Bericht hat euch gefallen und sollten noch Fragen, Anregungen oder Verbesserungsvorschlaege euch einfallen, schreibts mir. Ueber Feedback wuerde ich mich sehr freuen.
(Es ist jetzt halb 4 in der Nacht und ich bin komplett muede; sollten also Rechtschreibfehler oder grammatikalische Faux-Pas' im Text enthalten sein, so entschuldigt es bitte.)

Edit.: Hier noch ein paar Bilder vom System, dem Monitorsetup und der Benchsession.





Nachtrag: Auslastungsverteilung anhand der GPU usage.

TF2

GPU1=45%
GPU2=46%
GPU3=50%
GPU4=51%
FPS= 111


GPU1=42%
GPU2=41%
GPU3=50%
GPU=50%
FPS: 120

Dirt2

GPU1=53%
GPU2=52%
GPU3=62%
GPU4=61%
FPS: 59


GPU1=53%
GPU2=53%
GPU3=61%
GPU4=62%
FPS: 64


GPU1=53%
GPU2=54%
GPU3=63%
GPU4=62%
Fps: 63

Auffaelligkeiten/Analyse: Die Verteilung der Last ist recht gut geloest, da sich eigentlich alle Auslastungdifferenzen im Bereich von unter 18% bewegen.
Was mich jedoch wundert, ist die eigentlich sehr geringe Auslastung der GPUs. Denn die gelieferte Leistung duerfte eigentlich bei solch geringen Auslastungen nicht erbracht werden koennen.

Daher spekuliere ich, dass das Auslastungsoptimum nicht bei 100% liegt, sondern weit darunter. Die Annhame, dass der Afterburner nicht absolut ist, ist bei dem recht unkonventionellen Setup sicherlich nicht ganz abwegig.
Die Lastenverteilung ist also ueberraschend gut (fuer Quad), daher sind auch Bildrateneinbrueche selten.


EDIT:
Neues Brett ist endlich da!


Die Testerei kann also weiter gehen.
 
Zuletzt bearbeitet:
interessante sache, wie gesagt wegen den micro rucklern hol ich mir kein sli system, reizen würde es mich schon wie damals die 2x voodoo karten im sli, damit konnte man ut mit 1024x768 auflösung daddeln.....
 
interessanter bericht!!

hat meine neugier geweckt und werde ihn weiterhin im auge behalten.

weiter so!
 
Sehr interessanter Lesestoff zur späten Stunde :daumen:
 
Schöner Test, hätte mir aber gerne noch ein paat Bilder vom System, sowie Screenshoots gewünscht. Kannst du auch Crysis 1/Warhead testen?

Bin selber seit zweieinhalb Jahren SLI User und hatte bisher keine Probleme^^
 
Schön, dass Nvidias Eyefinitiy-Gegenstück 3D Vision Surround auch auf den alten Karten läuft. Hab mich schon gewundert, wie du auf die Auflösung kommst.:)
 
Respekt, du hast dir richtig Arbeit gemacht. Danke für den ausführlichen Bericht.
 
Bilder wurden gerade eben hinzugefuegt ;)

@Crossfire Sebi:

Ich wollte anfangs Crysis Warhead auch direkt in den Test mit einbringen, doch dann ist mir beim benchen aufgefallen, dass ich noch die Mastrconfig aktiviert habe. Da sich bisher immer Probleme bei der Deinstallation herausgestellt haben, haette ich Crysis nochmal neu installieren muessen, um wirklich exakte Vergleichswerte zu erlangen.

Crysis (1) lief jedoch im Dunkeln bei Enthuisiat-settings mit 25 Frames. Bei Weitblick und Sonnenaufgang rechne ich mit 18-22. Very High sollte dann eigentlich schon wieder an die 33-35 fps ragen, sodass im zweiten Benchmarkrun sicherlich 35 Frames ohne AA realistisch sind.


Interessant finde ich nebenbei bemerkt, dass eigentlich alle Spiele die aktuell erscheinen auf aufgebohrten Engines basieren. Dadurch zieht die PC Leistung den Konsolen davon und es etablieren sich aufeinmal Features wie Surroundgaming, da man kein unerschwingliches Setup mehr dafuer benoetigt.


EDIT: Mensch, bei so ein paar Saetzen war ich auch nicht mehr ganz wach... Aber jetzt sind die Rechtschreibfehler ueberwiegend korrigiert
 
Zuletzt bearbeitet:
GENIAL ... 24 Stunden wach und noch was gefunden was mich interessiert und gut geschrieben ist - Danke

Ich hatte früher ebenfalls eine 295 und kann es nur bestätigen ab 30-40 fps hab ich nichts gemerkt aber dadrunter wurde es auffällig ruckeliger als mit einer anderne KArte unter 40fps. (ich empfinde in shootern alles unter 50 als komisch..)
aber 2x295 hätte ich nie gewagt und die Treiber und Profile.. man braucht echt für jedes Spiel ein Profil und musst auch gut rumtesten.... cuda 1a .. zocken .. najaa :)
 
Zuletzt bearbeitet:
bitte immer dran denken, dass man diese ergebnisse nur bedingt auf andere konfigs beziehen kann. karten der gt400 und gt500-serie verhalten sich unter umständen ganz anders, als die hier beobachteten gt200-exemplare.

welches board hattest du denn genau von evga? 3x sli 762 oder ein 4x?
alle x16-fach angebunfen über 2/3 nf200 ist nicht das selbe wie echte x16 bei ein oder 2 karten bei lga1366.
 
Finde ich cool, dass du dir sowas zusammen gebastelt hast und dann noch dokumentiert hast! :)

Ich finde aber es lohnt sich nicht wirklich, da selbst eine HD6970 und GTX580 fast 60fps bei 2560x1600 @ AAx8 haben.
Aktuell lohnt es sich Quad-SLI/Quad-Crossfire System nur bei Auflösung mehr als 5760x1080 @ DX11 zu haben.
 
In DX9 können doch 4 Karten gar nicht arbeiten (3 Frames Pre-Render), deshalb kein Unterschied zwischen 3 und 4 Karten. Oder wurde das inzwischen geändert?
 
Well done, super Erfahrungsbericht.

Würd mich noch interessieren welches NT du verbaut hast und wieviel dieses aus der Leitung zieht.
 
welches board hattest du denn genau von evga? 3x sli 762 oder ein 4x?
alle x16-fach angebunfen über 2/3 nf200 ist nicht das selbe wie echte x16 bei ein oder 2 karten bei lga1366

EVGA x58 sli. Da es nur 2 Karten sind, die 4 GPU's zusammenfassen, brauche ich auch nur 2 16x Lanes.
Diese stellt mein Board bereit. Anders als auf en Bildern zu sehen wurde in Slot 1 und 2 gebencht. Nachher wurde es nur wieder umgestellt, da ich sonst nicht an den USB Anschluss des Mainboards gelange.

In DX9 können doch 4 Karten gar nicht arbeiten (3 Frames Pre-Render), deshalb kein Unterschied zwischen 3 und 4 Karten. Oder wurde das inzwischen geändert?

Jap, das ist mir auch aufgefallen ("....Denn auch ueber 100 Frames erscheinen die Spiele nicht richtig fluessig. Daher ist Quad SLI voellig unbrauchbar. Gerade auch deswegen, weil sich meist KEIN Leistungsplus einstellt, auch wenn Nvidia was anderes versprich"). Jedoch scheint es so, als wuerde NV Surround anders arbeiten.
Denn GPU 1 und 2 (also die erste gtx 295) scheinen Monitor 1 und 2 anzusteuern. GPU 3 und 4 steuern Monitor 3 an. Eine Synchronisation der der beiden Bilder wird anscheinend kaum durchgefuehrt, was bei Frames ueber 30 nicht negativ auffaellig ist.
Als Beleg fuer meine Vermutung habe ich TF2 getestet und die Taktraten der zweiten GPU massiv in den Keller gesetzt.
Das Ergebnis belegt meine Vermutung. Die FPS von Monitor 1 und 2 (die die von GPU 1 und 2 angesteuert werden) sind konstant hoch. Die Bildrate auf Monitor 3 ist deutlich niedriger und man erhaelt eine stockende Bildwiedergabe (Monitor 3).
So laesst sich mMn auch die deutlich bessere Skalierung erklaeren.
(nebenbei bemerkt gehts bei NV schon bis 8 Bilder vorgerendert)

Hier wuerde ich allerdings mit der Uebertragbarkeit sehr vorsichtig sein, gerade wenns um Eyefinity geht, das nach einem anderen Prinzip Surroundgaming arbeitet.

Würd mich noch interessieren welches NT du verbaut hast und wieviel dieses aus der Leitung zieh

CoolerMaster Realpower m1000w. Lieder habe ich kein Messgeraet, aber sollte ich in der naechsten Woche eins bekommen, werde ich die Ergebnisse natuerlich nachreichen.
 
Zuletzt bearbeitet:
Ich denke es ist mit einem Ergebnis von etwas ueber 800W zu rechnen.
 
WOW!
Beeindruckendes System,vor allem die Wakü!
Was für ne Pumpe verwendest du?
 
Zurück
Oben