Leserartikel Cinebench und Ram Geschwindigkeit meiner Systeme

Baal Netbeck

Fleet Admiral
Registriert
Apr. 2008
Beiträge
11.936
Dies ist ein ausgelagertes Thema aus diesem Hauptthread:
https://www.computerbase.de/forum/t...kussion-zu-spieletests.1728575/#post-20678303

Intro:
Um die Spieleperformance meiner verschiedenen CPU und Ram Konfigurationen besser einordnen zu können, möchte ich hier synthetische Performance Daten zu meinen Systemen zusammen tragen.

Als Indikator für die Rohleistung der CPUs nutze ich hier Cinebench R15.
Der Benchmark ist nicht super reproduzierbar, aber er nutzt alle Kerne und Threads voll aus, ohne sich sonderlich um die Ram Geschwindigkeit zu kümmern.

Um die Ram Geschwindigkeit zu testen, nutze ich den Cache & Memory Benchmark von Aida64. Ich habe mich auf die Read Werte konzentriert, da ich denke, dass diese für Frametimeverläufe in Spielen am wichtigsten sind.

Ergebnisse:
Fangen wir mit dem Cinebench score an.
Alle Systeme sind gegen Meltdown gesichert aber noch nicht gegen spectre.
cb15 sorted.png

Von unten angefangen liegen drei mal vier Kerne bei 2,8GHz auf den letzten Plätzen sowohl bei single aus auch multi core score.
Ein wenig überaschendes Ergebnis. Man sieht gut die IPC Verbesserungen dank gleichem Takt.
Der C2Q 9550 schlägt sich gar nicht so schlecht, wenn man das alter in Betracht zieht.

Es folgen weitere 7 vier Kern Ergebnisse.
Der i5 3570K mit stock Taktraten muss sich dem Laptop i7 geschlagen geben. Obwohl dessen Taktraten im MC Test auf 2,5GHz fallen, reißt Hyper-threading einiges heraus.

Der i5@ 4,4GHz konkurriert den 4 Kernen@3,8GHz ohne SMT des Ryzen.
Die Unterschiede sind im Bereich der Messungenauigkeit, Es war jedoch reproduzierbar, dass der i5 unter Windows 7 etwas bessere Ergebnisse liefert, vor allem im SC Test.

Das hinzuschalten von SMT und das wechseln auf 8 Kerne ohne SMT, bildet im MC Test die Zwischenstufen zu 8 Kernen mit SMT.

Die letzten vier Ergebnisse beziehen sich auf die vollen Kerne mit aktiviertem SMT.
Das Schlusslicht dieser Gruppe bildet der stock Ryzen 1800X mit geladenen Bios Defaults.
Auch wurde hier mit dem standard Windows-Energiesparplan "Ausbalanciert" getestet.
Das nächst bessere Ergebnis wurde duch minimale Anpassungen erreicht.
Im Bios wurde das docp/XMP Profil des Ram geladen und unter Windows in den "Höchstleistung" Energiesparplan gewechselt.
Fast an der Spitze sitzen dann mein gemäßigtes PState OC auf 3,8GHz@1,264V(Last) und manuellen Subtimings, was meinen täglich genutzten Einstellungen entspricht.
Und ganz an der Spitze dann feste 4GHz mit unangenehmen 1,404V(Last).
Warum der SC Wert so stark gestiegen ist, kann ich nicht genau sagen, eventuell eine Nebenwirkung des Wechsel von PState zu festem Multiplikator.

Hier noch eine Auftragung bei verschiedenen Ram Übertaktungen für den i5 und den 8C16T Ryzen.
CB15 mem scale.png
Wie man sieht sind die Gewinne durch 50% mehr Ram Takt bei DDR4 und 175% mehr Ram Takt bei DDR3, kaum nennenswert. Die größten Unterschiede zeigen sich beim Wechsel von den Basis Taktraten 2133 und 1066MHz zur nächsten Stufe.

Kommen wir nun zur Ram Geschwindigkeit:
aida64 balken.png

Trotz niedriger Timings liegt der DDR2 Ram deutlich abgeschlagen am Ende der Liste.

Sowohl DDR3 als auch DDR4 zeigen eine perfekte Skalierung bei gleichen Einstellungen.
Der einzelne Riegel aus meinem Notebook muss sich wegen dem fehlenden dual channel fast mit der Hälfte der Leserate begnügen.

Bei DDR4 habe ich zusätzlich den Basiswert nach einem Bios reset von 2133 CL15 sowie die Ergebnisse des hinterlegten Ram Profils für 3200 CL14 getestet.
Die vom Board gewöhlten Auto Timings im Bereich von CL15 sind gar nicht schlecht gewählt.
Der Leistungsverlust zu meinen manuellen CL14er Timings ist nur gering.

Die Subtimings des docp/XMP Profils sind brauchbar aber es ergibt sich schon ein deutlicher Unterschied zu manuellen Timings, mit denen ich die gleiche Leistung schon bei 2933MHz erreiche.
Dies sieht zwar erstmal nicht gut aus, allerdings war die Situation Mitte 2017 noch viel schlechter und das laden des Profils war damals sowohl instabil als auch mit so schlechten Subtimings verbunden, dass 3200 CL14 langsamer war als 2400 mit CL15er Auto Timings.....vor diesem Hintergrund also ein tolles Ergebnis für docp ;).

Takt Skalierung
Dann habe ich mich gefragt ob die Übertragungsraten auch linear mit dem Ram Takt scalieren, solange ich die Timings fest halte und habe es für DDR3 und DDR4 aufgetragen.
aida ddr3 scale.png

Wie man sieht, sehen wir einen perfekt linearen Zusammenhang für DDR3 Ram, wobei jedes MHz effektiver Ram Takt mehr, uns 14,88MB/s mehr Leserate bringt.

aida ddr4 scale.png

Auch der DDR4 Ram zeigt das gleiche Verhalten. Hier gewinnen wir für jedes MHz effektiven Taktes 15,8 MB/s hinzu.
Die Werte für 2133 CL15 und das 3200 er docp Profil habe ich mit eingetragen, sie fließen aber nicht in den linearen Fit ein.

Exemplarische Screenshots der Aida64 Benchmarks:
Der Aida64 Test hat sofort größere Schwankungen, sobald ein Pups an Hintergrundaktivität stattfindet.
Ich habe daher jede Konfiguration fünf mal gemessen und für die Auswertung jeweils die besten drei daraus gemittelt.

Hier zeige ich für jede Konfiguration nur einen Screenshot, der für die 12-16 getesteten Werten möglichst typische Werte ohne Ausreißer zeigt.
cachememc2q28 80e.png cachemem4418c.png
cachememi72516c.png cachemem44 on 38 32c.png
cachemem bios default e.png cachemem bios default+docp std c.png

Fazit:

Die Cinebench Ergebnisse sind nicht sonderlich überraschend ;).
-Die CPUs werden über die Jahre bei gleichem Takt immer schneller.
-Mehr Takt bringt mehr Leistung.
-Mehr Kerne bringen mehr Leistung.
-HT und SMT quetschen mehr Rohleistung aus den CPUs.
-Cinebench reagiert nur gering auf Ram OC.

Etwas interessant hierbei sind die single core Ergebnisse für Ryzen.
So zeigt sich, dass das normale Boost Verhalten des 1800X von 3,7GHz allcore zu 4,1GHz bei 1-2 benutzten Kernen, zwar eine leichte SC Steigerung gegenüber festen 3,8GHz bietet.
Jedoch deutlich hinter festen 4GHz zurückbleibt.
Hier zeigt sich die nachteilige Lastverteilung über alle Kerne. Obwohl alle Bedingungen erfüllt sind, taktet die CPU mehr als die Hälfte der Zeit nur mit dem allcore Takt.
Vermutlich, weil die Arbeit nichtmal ein paar Sekunden auf einem Kern verweilt, sondern pausenlos weitergeschoben wird. Der Turbo ist dann oft zu träge um zu reagieren.

Ich möchte hier jedoch darauf hinweisen, dass die Ergebnisse des SC Test bei Cinebench gerne mal systematischen Fehlern unterliegen. So entscheidet sich der Windows Scheduler von Zeit zu Zeit die Last doch länger auf den Kernen verweilen zu lassen, was dann eine messbare Leistungssteigerung bringt.
Das ist jedoch die Ausnahme und ich konnte nicht reproduzieren wann es auftritt. Ich traue den Ergebnissen also nicht unbedingt immer und ich würde zumindest eine Unsicherheit von 4 Punkten mehr oder weniger annehmen, was die Aussagekraft der oben genannten Beobachtungen in Frage stellt;).....ich glaube zwar durchaus an die Tendenzen, nicht jedoch an die genauen Werte.


Die Ram-read-Werte zeigen eine schöne lineare Skalierung, und verdeutlichen auch die Wichtigkeit von Subtimings.

Das bietet eine gute Grundlage für Ramskalierungs Tests in PC Spielen, weil bei festen Timings sichergestellt ist, dass der höhere Ram Takt 1 zu 1 mehr Ram Geschwindigkeit entspricht und man beobachten kann, wie viel davon in eine Verbesserung der Performance im Spiel einfließt.

kleiner Rant:
Gerade das Beispiel mit dem docp Profil zeigt, wie stark die Subtimings diese Vergleichbarkeit zerstören.
Als Negativbeispiel wie man es nicht macht hier mal ein test zur "Speicherskalierung" von Computerbase selbst:
https://www.computerbase.de/2018-02...d-raven-ridge/2/#abschnitt_speicherskalierung
Mit einem undurchsichtigen Wechsel der Timings, der z.B. beim 2400G in SW Battlefront und Overwatch 3200MHz vor 3600MHz schiebt und für den i3 2400MHz vor 4000MHz....

Die Zeit für dieses verwirrende Etwas hätte man sich sparen können oder hätte es zumindest mit einer Angabe der resultierenden read Werte des Ram ergänzen sollen.

Auch wenn die Aussage, das hoher Ram Takt durch schlechte Timings heruntergezogen wird, natürlich wichtig ist, hätte ich mir hier eine hier eine Aussage gewünscht, die beantwortet, wie viel Leistung durch schnelleren Ram gewonnen wird und nicht wie sie durch undurchsichtige Kombinationen aus Takt und 30 unbekanten Timings beeinflusst wird.

wie auch immer....
Wer nochmal genauer die Komponeneten der benutzten Systeme sehen möchte, klickt bitte auf den Link ganz oben und öffnet den Spoiler bei "Meine zur Verfügung stehenden Systeme:".

Glückwunsch wer es bis hierher geschafft hat! :)
 
Zuletzt bearbeitet:
Schöner Artikel, gerade im Hinblick auf die Subtimings sehr interessant, hatte nicht gedacht, das da so gravierende Unterschiede zu Tage kommen.
 
Sehr schöner Artikel. Hab inn gerade erst nur mal kurz überflogen, werde ihn aber heute abend nochmal genau durchlesen.
 
Danke! Ich hoffe ich bekomme im Laufe des Tages das review zur CPU und RAM Performance in einer cities Skyline Testszene fertig.
Sowas dauert leider immer länger als man denkt und ich habe wenig redaktionelle Fähigkeiten;).
 
Sehr Schön Baal! Vielen Dank! Wirklich lesenswert! ... und danke für den Glückwunsch ;-) Ich hätte auch noch weiter gelesen.
 
Zuletzt bearbeitet von einem Moderator:
Zurück
Oben