• Mitspieler gesucht? Du willst dich locker mit der Community austauschen? Schau gerne auf unserem ComputerBase Discord vorbei!

The Witcher [Review] The Witcher 2 - CPU Benchmarks

Baal Netbeck

Fleet Admiral
Registriert
Apr. 2008
Beiträge
11.936
Dies ist ein ausgelagertes Thema aus diesem Hauptthread:
https://www.computerbase.de/forum/t...kussion-zu-spieletests.1728575/#post-20678303

Intro:

The Witcher 2 war ein großer Sprung gegenüber dem ersten Teil was die Grafik angeht und kann mich auch heute noch begeistern.
Man kann mit Über-Sampling auch neuste Grafikkarten in die Knie zwingen, will man stabile und hohe FPS endet man allerdings schnell CPU limitiert. Die Spielengine scheint bis zu vier CPU Kerne nutzen zu können und wie sich das auf die Performance auswirkt sehen wir hier im Test.

Die Testkandidaten sind mein Ryzen 1800X in verschiedenen Konfigurationen gegen einen i5 3570K.
Beide mit meiner Vega64 LC(undervolted) gepaart.

In diesem Review zeige ich diverse Aspekte wie:
Einflüsse von 4 vs 8 Kernen, SMT an/aus, Skalierung mit Ramgeschwindigkeit, verschiedene CCX Konfigurationen für Ryzen. IPC Vergleiche, Einfluss des HBCC, Einfluss von CPU und RAM Optimierungen, und eine Betrachtung der Infinity Fabric Skalierung.

Fangen wir mit der Testszene an.

https://www.youtube.com/watch?v=Wi-_nw0UD2k&list=PLP9fskJGwUOT5CByAJMJrXaggyMuUgsFt&index=12&t=0s

Meine Testszene zeigt einen größeren Rundgang durch Flotsam im ersten frei begehbaren Gebiet des Spiels. Es sind eine Menge NPCs unterwegs. Für die CPU war dies eine der anspruchsvolleren Szenen und wir sind die ganze Zeit CPU limitiert.

Ich hatte erst eine kleinere Runde genutzt aber dann festgestellt, dass ich die Testdauer verlängern musste um die Ergebnisse reproduzierbarer zu machen.

Wer die Szene selbst testen möchte findet hier das benutzte savegame:
https://drive.google.com/drive/folders/1Hahuj2q234W1LTFi5WLAZOo_uR4tF-qu?usp=sharing

Alle wichtigen Optionen sind dem Video zu entnehmen.

Frametimegraphen:
Hier der Vergleich meines Ryzen 1800X@3,8GHz und des Ivy Bridge i5 mit 4,4GHz
w2 graph i5 zen.png

Beide CPUs zeigen gute Frametimes mit moderaten Schwankungen.
Mal liegt der Ryzen ein bischen besser mal der i5.
Beide haben ab und zu kleinere Ausreißer, die aber nur selten an der 16,66ms(60FPS) Marke kratzen.

Über die Szene hinweg schwankt die Leistung nur gering. Es fühlt sich flüssig und reaktionsschnell an,
es gibt jedoch bei längeren Wegen Nachladeruckler oder Speicherpunkte, die auf jeder Hardware ruckeln.
Diese waren schlecht reproduzierbar weshalb ich sie nicht in der Testszene verwedet habe.

Um diesem Auf und Ab eine quantitative Entsprechung zu geben benutze ich eine Reihe statistischer Werte die ich aus der Auswertung von jeweils fünf Messungen gewinne.
Die gezeigten Frametimeverläufe waren jeweils die zweit besten was die 0.1% low Werte angeht.

Vergleichen wir also die Systeme quantitativ:

i5 vs. Ryzen

w2 i5 zen.png

Zur Erklärung des Diagramms:
Aufgetragen auf der y- Achse sind die "inversen Frametimes". Das sind im Grunde die FPS aber halt nicht durch "Zählen von Frames über einen Zeitraum" bestimmt, sondern über den Kehrwert der Frametimes gebildet.
Wenn ihr hier bei einem Wert links(avg FPS) 44 in 1/s seht, dann würde euch Fraps auch 44 FPS anzeigen.

Aus dem Frametimeverlauf bestimme ich einen effektiven Frametimeverlauf. Diesen habe ich ausführlich im Hauptthread unter "Nomenklatur" diskutiert.
"avg eff FPS" ist der Kehrwert des Durchschnitts dieses effektiven Frametimeverlaufs.
Um so stärker dieser Wert gegenüber den avg FPS abfällt um so stärker sind die relativen Schwankungen der Frametimes ....eine Art "Mikroschwankungsindikator".

Es folgen die Xth percentile und X% low Werte, die sich Stück für Stück immer weiter den schlechten Frametime Werten zuwenden und daher für das Spielgefühl besonders wichtig sind.

5%low und 99th percentile sind dabei noch eher auf den allgemeinen Spielfluss konzentriert und bekommen wenig bis nichts von einzelnen Frametimepeaks(Rucklern) mit.

Die letzten drei Werte werden je nach Spiel mehr oder weniger von diesen Frametimepeaks dominiert und sind meiner Meinung nach oft das beste Mittel um zu beschreiben ob und wie "Ruckelig" sich das Spiel anfühlt.
Leider basieren sie nur auf einem kleinen Teil der Frametimes und daher unterliegen sie größeren Ungenauigkeiten.
Auch wenn ich die 0,1% low Werte sehr schätze, bieten sie oft zu schlechte Reproduzierbarkeiten und daher bin ich ein großer Fan der 1% low Werte.
Diese sind in der Regel noch gut zu reproduzieren und entsprechen sinnvoll dem Spielgefühl.

Die Linien zwischen den Symbolen sind extra gestrichelt, da sie nur zur besseren Lesbarkeit beitragen sollen und keine Punkte dazwischen suggerieren sollen.

In der Legende sieht man die Symbolformen und Farben der verscheidenen Testkandidaten.

Die Wertepunkte selbst sind Durchschnittswerte aus den drei besten Werten von fünf Messungen und haben zusätzlich Fehlerbalken, die sich aus der empirischen Standardabweichung dieser drei besten Werte ergeben.

Der Eindruck aus den Frametimegraphen bestätigt sich hier.
Die Unterschiede des i5 und der Ryzen sind sehr gering.
Auf der linken und rechten Seite liegen die Unterschiede im Bereich der Messungenauigkeit, im mittleren Bereich gewinnt der i5 mit Übertaktung leicht.

Mit Basis Taktraten und freigegebenem Ram, ist der i5 3570K dann deutlich abgeschlagen und fällt öfter unter die 60 FPS(0.1% low)

Ryzen CCX Konfiguration und SMT

W2 ccx smt clock a.png

Die 4+0 Konfiguration mit nur 2,8GHz muss sich deutlich geschlagen geben und fällt unter 50 FPS.
Mit 3,8GHz ist es jedoch egal ob 4+0 oder alle 8 Kerne aktiv sind.
Auch SMT aus macht keinen Unterschied.

Das eine GHz mehr Takt von 2,8 auf 3,8GHz entspricht 36% mehr Takt und bringt 33,7% mehr avg FPS und 33,2% mehr 1% low....eine fast perfekte Steigerung!

W2 ccx smt clock b.png

Vergleichen wir jetzt 4 Kerne in 2+2 Konfiguration mit dem vorherigen Ergebnis, fällt auf, dass dies etwas schlechter läuft.
Die häufigere Kommunikation über den Infinity Fabric führt zu leicht schlechteren Ergebnissen und das hinzufügen von SMT scheint im mittleren Bereich ebenfalls leicht von Nachteil zu sein.

Gerade im rechten Bereich werden die Fehlerbalken jedoch deutlich größer und ich würde auf die gezeigen Unterschiede nicht allzuviel geben.

Die wieder gezeigten 2,8GHz dienen nur als bessere Vergleichbarkeit zum ersten Diagramm.

Leistungsaufspaltung beim i5

w2 i5 clockram.png

Keine großen Überraschungen hier.
Nur 2,8 GHz machen sich trotz schnellem Ram nicht gut, die stock Taktraten mit 1600er Ram(Intel Freigabe) liegen etwas hinter mit 4,4GHz mit 1333er Ram.

Der Wechsel von 1333 auf 1866 macht aus dem 40% schnelleren Ram 14,7% mehr avg FPS aus und 14% mehr 1% low.
Von 2,8 zu 4,4GHz sind es 57% mehr Takt. Dies führt zu einer Steigerung der avg FPS von ganzen 49% und 54,8% bei den 1% low.

Ein ordentlicher Gewinn durch schnelleren Ram aber ein starker Gewinn durch mehr Takt, der auch hier fast 1 zu 1 in Performance umgesetzt wird!

IPC Vergleich
w2 ipc.png

Drei mal vier Kerne, ohne HT/SMT, bei 2,8GHz im Vergleich.

Wenig verwunderlich gewinnt der Ryzen, mit nur 2133er DDR4 kommt der i5 aber nah ran.
Der Ryzen aus der 1000er Serie zeigt also eine deutlich bessere IPC, solange guter Ram verwendet wird.

DDR4 Ram Skalierung

W2 ddr4.png

Das Diagramm ist etwas unübersichtlich, das sehe ich ein. ;)
Für die Zusammenhänge die ich zeigen möchte sollte es aber reichen.
Die drei helleren Farben sind 3200 CL14er Ram und die drei dunkleren sind 2133 Cl14.

4+4 und 4+0 lassen sich dabei praktisch nicht unterscheiden, 2+2 liegt minimal darunter.

Ich habe die jeweils drei Werte für 3200 und für 2133 gemittelt um eine Skallierung zu zeigen.

Der Wechsel von 2133 auf 3200 MHz macht aus dem 50% schnelleren Ram 13,2% mehr avg FPS aus und 12% mehr 1% low.

Damit fallen die Verbesserungen durch das Ram OC weniger stark aus als bei DDR3. Sind aber trotzdem ein netter Boost.

HBCC settings
W2 hbcc.png

Alle Werte liegen innerhalb der Messungenauigkeit....Das Spiel reagiert gar nicht auf die Veränderung.

Ryzen optimieren und übertakten
W2 optimiz.png

Obwohl meine Optimierung immerhin 100MHz mehr allcore Takt liefert und auch der Ram durch die Subtimings 9,6% mehr Leserate hat, lassen sich keine Unterschiede zu Stock Taktraten mit docp Profil messen.

Die heftigen Verluste mit Bios defaults(25% bei den avg FPS) müssen also durch langsamen Ram und den "ausbalanciert" Energiesparplan von Windows zustande kommen.

Da sich vorher nur 13% durch den Wechsel von 2133 auf 3200 gezeigt hatten, ist hier der Energiesparplan scheinbar unglaublich wichtig.

Einfuss von Ramtakt auf den Infinity Fabric
Hintergrund:
Wer sich mit Ryzen beschäftigt hat, der wird öfter gehört haben, dass Ryzen schnellen Ram braucht, weil sonst die Kommunikation zwischen den CCX durch einen lansamen IF behindert wird.

Aber ist dem auch so? Ich habe noch keinen brauchbaren Test gesehen, der das untersucht hat und habe mir was eigenes überlegt.

Theoretisch ist da schonmal was dran. Gerade in neueren PC Spielen wird die Arbeit auf mehrere Kerne aufgeteilt und es findet viel Kommunikation statt um alles synchron zu halten und die Ergebnisse zusammenzuführen.

Der IF ist an den Takt des Ram gekoppelt und es gibt Veröffentlichungen, die zeigen das sich die Latenzen von einem CCX zum anderen mit schnellerem Ram verbessern.

Die Frage ist, ob dies rein theoretisch ist oder wirklich so signifikant, dass es sich auch in der Spieleperformance niederschlägt.

Leider steigt mit schnellerem Ram auch die Spieleperformance und es wird schwer zu sehen, was davon die IF Verbesserung war und was einfach der schnelle Ram.

Die IF Unterschiede von 2+2 zu 4+0 werden durch den doppelten L3 Cache bei 2+2 verschleiert.

Vorgehen
Bei den Ryzen 8 Kernern hat man die Möglichkeit über das Bios Kerne zu deaktivieren und dies habe ich einmal als 2+2 und einmal als 4+0 Konfiguration gemacht. SMT war deaktiviert.
Dann habe ich beides einmal mit 2133 und einmal mit 3200er Ram getestet.
Dann habe ich den prozentualen Performance Gewinn(2133 zu 3200) einmal für 2+2 und für 4+0 ermittelt und die Differenz gebildet.

Unter der Annahme, das der Gewinn durch den schnelleren Ram gleich sein sollte, zeigt die Differenz also den reinen Einfluss durch den beschleunigten IF.
Die Ergebnisse beruhen allerdings auf je vier fehlerbehafteten Größen und wenn man mit Gaußscher Fehlerfortpflanzung die Fortpflanzung dieser Fehler in das Endergebnis berechnet, zeigen sich leider große Unsicherheiten.
W2 IF.png

Ganz wichtig sind hier die Fehlerbalken!
Keiner der Werte hat eine Aussagekraft und der Test bleibt daher ergebnislos!

Wenn man sich jedoch die Messungen zu 2+2 und 4+0 anguckt, sieht man, dass 4+0 insgesammt besser ist und der Infinity Fabric hier etwas Leistung kostet.
Wobei 4+4 genauso gut sind wie 4+0.... hier scheinen die größere Auswahl an CPU Kernen und der doppelter L3 Cache, die Nachteile gegenüber 4+0 auszugleichen.


Fazit:

The Witcher 2 zeigt sich stark CPU Takt abhängig. Schnellerer DDR3 oder DDR4 Ram bringt ebenfalls ordentliche Steigerungen, wobei diese für DDR3 etwas effizienter in mehr FPS umgesetzt werden.

Mehr als 4 Kerne werden nicht gebraucht, von 2+2 zu 4+4 kann es aber leichte Vorteile geben, vermutlich durch die größere Auswahl an freien CPU Kernen.

SMT scheint bei 8 Kernen keine Nachteile zu bringen, dafür jedoch bei 4 Kernen minimal schlechter zu laufen.

Ryzen zeigt eine bessere IPC, der i5 macht es aber durch eine höhere Übertaktbarkeit wett.


Das Spiel sieht gut aus, verströmt eine tolle Atmosphäre und läuft eigentlich auf allen getesteten CPUs ganz gut.
Wenn man allerdings zu weit mit dem Takt runter geht, werden die ab und zu auftretenden Frametime Peaks stärker und spürbarer.
Einige lassen sich auch gar nicht vermeiden, gerade kurz nach dem ersten hineinladen sieht man noch vermehrt Nachladeruckler.

Wie läuft das Spiel bei euch?
Habt iht Spielszenen, die eine stärkere CPU Auslastung zeigen? Mir sind meine späteren Savegames abhanden gekommen und ich weiß daher nicht wie es in späteren Gebieten läuft.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: pc_newb
Schön ausführlich! war auf dem AMD sys hpet an oder aus? (auch in windows disabled)
 
HPET war aus.

Als ich im März 2017 das System gebaut und Windows 10 installiert hatte, musste ich es noch manuell ausschalten.

Mit dem Creators update wurde es dann wieder automatisch aktiviert und ich habe lange gebraucht bis ich herausgefunden habe warum prötzlich einige Spiele 2% langsamer liefen.
Mit einer erneuten Windows Installation im Februar 2018 war HPET dann nicht mehr automatisch installiert....dementsprechend auch nicht für diese Reihe an Benchmarks.

Ich könnte mal gucken ob es sich mit dem Spring Creators update wieder aktiviert hat ;).

Edit: ....Hmm:mad:
"C:\WINDOWS\system32>bcdedit /set useplatformclock false
Der Vorgang wurde erfolgreich beendet
."
heißt dass es hat sich mit dem Spring Creators Update wieder aktiviert? Oder kommt die Meldung immer?

Edit2:
falscher Befehl...bcdedit /deletevalue useplatformclock wäre es gewesen....
HPET war scheinbar wieder aktiv....denn es wurde beendet und nach einem Neustart sagt es jetzt:
"C:\WINDOWS\system32>bcdedit /deletevalue useplatformclock
Fehler beim Löschen des angegebenen Datenelements.
Element nicht gefunden
."

So ein Mist von Windows 10, dass die einem das immer wieder unterschieben!

Naja die Daten zu den Benchmarks hier habe ich im Februar und Anfang März erstellt.
Davor hatte ich geprüft, dass HPET aus ist....leider scheint man es nicht direkt im Bios ausschalten zu können sondern ist immer auf Windows angewiesen.
 
Zuletzt bearbeitet:
Für mich sieht The Witcher 2 fast besser aus als der 3 Teil:freak:
 
@Whammy
Ich weiß was du meinst;)....es sieht teilweise echt hinreißend aus. :)

Allerdings gewinnt The Witcher 3 den Grafikvergleich trotzdem.
Es gibt so viele Kleinigkeiten, die den dritten Teil besser machen...Animationen von NPCs(deutlich verbesserungswürdig aber besser als in 2), dann die sich bewegende Vegetation, wenn Sturm aufkommt und man die Geräuschkulisse mit den sich windenden Bäumen usw. sieht...da hat sich schon einiges getan.

Dann ist Witcher 3 open world und damit ohne ladezeiten, was zwar nicht die Optik verbessert aber den Spielfluss aufrecht erhält.

Aber der zweite Teil sieht trotzdem besser aus als so manches was man heute geboten bekommt.

Sogar der erste Teil sieht gar nicht so übel aus...auch wenn er schon damals nichts besonderes war, so ist es doch noch gut spielbar.
 
Hab es auch grad wieder ausgepackt und in WQHD mit Über-Sampling und meiner GTX1080 ist es für mich nicht flüssig...:(

Aber da gibts einige Oldschool Kandidaten, so auch Stalker Clear Sky, das selbst mit 1080 nur um die 40 fps schafft...
 
Meist laufen alte Spiele aber dadurch so langsam, dass bei der Entwicklung nicht auf eine gute Multicore Ausnutzung geachtet wurde und da die single core Leistung sich zwar verbessert, aber nicht vervielfacht hat, laufen die halt immer noch schlecht.

WQHD mit Über-Sampling ist halt einfach viel zu viel Arbeit für die Grafikkarte. Da muss man noch ein paar Generationen warten bis die GPUs schnell genug dafür sind.

Finde ich aber tendenziell gut, dass es solche Einstellungen gibt, die man erst ein paar Jahre später nutzen kann.
 
Zurück
Oben