Ryzen vs. i7: Performance bei interkommunizierenden Threads?

Nochmals Danke! Dann werde ich die Beta später mal ausprobieren....
Also sind die Peaks in deinem Devision Video von ca 20 auf 38 ms...ich hätte gedacht, dass man sowas schon teils sehen könnte...muss aber nicht... Ich habe es bei mir nochmal laufen lassen....erst hatte ich ganz komische Grafikprobleme....dann habe ich festgestellt, dass sich das Spiel mir dem Patch auf DX12 umgestellt hat(oder ich bin geschlafwandelt)....also zurück auf DX11 und nochmal getestet...der Ruckler am Anfang der Testsequenz ist nicht mehr spürbar...er ist noch in den Frametimes aber geht nur noch auf ca. 26 ms hoch und vorher waren es eher 33-36ms. Wenn ich später Zeit habe, plotte ich mal die Graphen....fürs erste läuft es aber jetzt auch im Benchmark frei von sichbaren Rucklern....bis später :)
 
@ Holt: Richtig, war die falsche Nomenklatur :) Infinity Fabric statt CCX.
@ Nai: Klingt logisch, ich habe damit wie gesagt keine Erfahrung abgesehen von der praktischen Anwendung. Du bist doch vom Fach, wie sähe denn ein anspruchsvolles Programm, das sich nicht nur auf den Rand beschränkt, aus?

@ Baal, welchen Ryzen hast du und kannst du auch mal 20 Runs machen? Oder Runs mit unterschiedlichem RAM-Takt?
btw, meine Euler3d-Ergebnisse mit 20 Runs:
Code:
32GB DDR4 quadchannel, mainboard: MSI X99A Raider
i7 6800k 3.4GHz, RAM 2666MHz CL 15 17 17 35 CR2 52.58s total, 7.608Hz
4.0GHz RAM 3000MHz CL 18 20 20 40 CR2; 50.68s total, 7.893Hz
4.2GHz RAM 2993MHz CL 17 19 19 39 CR2; 48.20s total, 8.299Hz

16GB DDR3 dualchannel, mainboard: Asrock Z68 Pro3
i7 2600k 4.2GHz RAM 1600MHz CL 9 9 9 24 CR2 80.xx total, etwa 5-6Hz? Damals vergessen aufuzschreiben

16GB DDR3 dualchannel, chipset: ID8C49
i7 4702MQ 2.2GHz RAM 1333MHz CL 9 9 9 24 CR 1T 86.72s total, 4.6Hz
 
Zuletzt bearbeitet:
Baal Netbeck schrieb:
Nochmals Danke! Dann werde ich die Beta später mal ausprobieren....
Also sind die Peaks in deinem Devision Video von ca 20 auf 38 ms...ich hätte gedacht, dass man sowas schon teils sehen könnte...muss aber nicht...

Ja eben. Daher ist diese ganze Frametimes Diskussion bei der Ryzen ja angeblich so viel besser sei für mich eine sinnfreie Diskussion. Wenn man bei diesen Spielen auf 2 Threads runterschaltet, dann spielen die Frametimes verrückt und das merke ich dann auch. Aber mit 8 Threads überhaupt kein Problem und ich kann das ganze Theater da wirklich nicht nachvollziehen.
 
@Müs Lee
Euler3D
7700K@5GHz/4,5GHz Cache/DDR4 4200MHz Cl17-17-17-36-CR1
Euler3d.JPG

Was sagt das nun genau aus?

Grüße
Zero
 
Zuletzt bearbeitet:
i7 7700K Stock DDR4-3000 CL15-17-17-35 1T

Code:
CaseLab
          Euler3D BENCHMARK
             Version 2.2

     Usage: e3dbm #steps #threads

 >>> Reading 3D geometry file...

 >>> Calling 3D FEM solver...
  >> istp =       1
   > Progress: ******************** (     2.25 seconds )
   > est. time remaining =       9.00 sec
  >> istp =       2
   > Progress: ******************** (     2.28 seconds )
   > est. time remaining =       6.80 sec
  >> istp =       3
   > Progress: ******************** (     2.27 seconds )
   > est. time remaining =       4.53 sec
  >> istp =       4
   > Progress: ******************** (     2.27 seconds )
   > est. time remaining =       2.27 sec
  >> istp =       5
   > Progress: ******************** (     2.25 seconds )
   > est. time remaining =       0.00 sec


 Elapsed solution time :      11.31 seconds


 Please email results and comments to caselab@gmail.com


 Threads :   8
 Benchmark Score :      8.839 Hz

 Benchmark Finished.
Ergänzung ()

@ZeroZerp

Obwohl du nur 13% mehr Takt hast bei der CPU hast du 23% besseres Ergebnis. Da reist der RAM wohl auch wieder einiges raus. :hammer_alt: Ich brauch auch so schnellen RAM. ^^ :D
 
Da kann man auch wie bei einen alten Petium Prozzesor sich ein DLC kaufen und ein wenig Leistung frei kaufen.

Das heißt der Prozessor läuft vorher mit 3 Ghz und kann dan sagen wir mal mit so 4 Ghz laufen.

Da baut Intel einen Chip als Chiphersteller und man kann sich das Overclocking schenken da Intel schon an diese Leute gedacht hat.
 
@IchoTolot
Ja- Im Normalfall legt der schnelle RAM tatsächlich eine CPU Generation drauf (obwohl imernoch viele Leute davon überzeugt sind, dass schneller RAM nichts bringt).

In manchen Dingen wie Drawcall- Tests explodiert das Ding dann geradezu nach oben raus und ist teilweise um 100% schneller als ein Stock getakteter 7700er mit auch schon beachtlichem 3000er RAM.

Sah man auch gut an der Framzahlexplosion zum Ende Deines Cities Skyline Benchmarks auf meiner Maschine. Oder beim Superposition Benchmark oder beim Drawcall Overhead API Test.

Die RAMs und die Caches sind inzwischen richtige Bremsen. Deswegen bin ich sehr gespannt auf die vervierfachung des L2 Caches beim I9 und dessen Speicheranbindung und wie sich das Ganze dann auf die gesamtlatenz und Leistung niederschlägt.

Grüße
Zero
 
Zuletzt bearbeitet:
Mann Kann Intelsagen das sie dieCPU Verlöten aber sie werden es nicht machen und ich kann euch auch sagen wieso.

Sie haben angst das ihre CPUs so lange leben und keine neuen verkaufen können das sie versuchen eine künstliche veralterung der cpus herzustellen aufgrund hoher temperatur.

Dan nach 5 Jahren ist die CPU Kaputt und die leute kaufen sich eine neue Intel cpu.

Das liegt daran das sie nicht mehr viel leistung herausbringen könnnen.

Sie sind mittleweile bei 7nm Fertigung angelangt !!!!!!!!!!!!!!!!!!!!!!!!!!!!!! Hallo ? 1 NM dan ist schluß

Dan können sie ihre ganze produktions stätte abreißen und sehen wo sie bleiben.
 
Quark. Dann werden andere Wege gefunden. Und man kann auch nicht alles parallelisieren, siehe Amdahls Law.

https://de.wikipedia.org/wiki/Amdahlsches_Gesetz
Ergänzung ()

Ich werde denke ich so in 2 Jahren aufrüsten, wenn der 7700er dann nicht mehr reichen sollte, was ich nicht glaube. Denke das wird eher so in die Richtung 4 Jahre gehen oder länger. Coffee Lake interessiert mich aber.
 
Nun kommt er mit Amdahlschem Gesetz. :lol:

Du solltest den Wiki-Artikel auch komplett lesen. Vor allem den Punkt "Kritik".

Eines der ersten Dinge im Informatik-Studium wenn es um Parallelisierbarkeit war vor allem der Punkt das Ahmdahl größten teils unrecht hatte, da zuviele Faktoren ignoriert wurden von ihm. Dahingehend kannst du dir gerne Gustafsons-Gesetz anschauen.

Die Wahrheit zeigt, dass je nach Aufwand bisher sehr gut parallelisiert werden kann mit dem gewissen Programmieraufwand vor allem wenn es um Echtzeit-Berechnungen geht. Dazu gehören auch Spiele-Engines.
 
sooo.....das hat etwas länger gedauert^^.
Hier meine Ergebnisse gemittlet über drei Durchläufe a 20 steps+ Gesammtverbrauch dabei und im Idle+ Ergebnis aus Cinebench15:
R7 1800X mit Ram 2x16gb DR 2670 CL14 und GTX680, Win10, 2 Monitore, zwei SSDs+ eine HDD+Wasserkühlung CPU/GPU
CL14=14 14 14 34 63 1T
CL18=18 19 19 39 63 1T
Da der 1800X ein mieses PL-Verhältnis hat, ist für mich die Bewertungsbasis fixe 3807 MHz....das sollte man auch mit einem 1700er schaffen.

R7 3807 mit 2670 CL14 43,97s 9100Hz 177W idle 89W CB15 1672
R7 3807 ohne SMT 46,64s 8675Hz 172W idle 89W CB15 1196
1800X Stock 44,75s 8940Hz 165W idle 87W CB15 1631
max OC 4102 2799 CL14 41,00s 9757Hz 222W idle 96W CB15 1811
R7 2805 mit 2670 CL14 51,29s 7800Hz 115W idle 82W CB15 1254
R7 2805 aber ohne SMT 56,26s 7110Hz 111W idle 82W CB15 892
R7 3807 mit 2136CL14 49,60s 8065Hz 177W
R7 3807 2670 aber CL18 45,96s 8702Hz 180W
 
Zuletzt bearbeitet:
Super, vielen Dank :daumen: Das sieht doch schon anders aus als im CB-Test, es scheint sich mittlerweile ganz schön was getan zu haben. Im CB-Test wurden 10 Runs gemacht, deine Performance würde im Bestfall 41/2 = 20.5 Sekunden bedeuten und damit zwischen dem 5960x und 6900k liegen. Stock wären es immer noch 22.375s, eine mehr als beachtliche Verbesserung zum Test.

Das ist schon mal ein Hinweis, dass sich entweder via Updates schon viel verbessert hat oder dass meine These auf wackligen Beinen steht und der Infinity Fabric in der realen Welt gar nicht so sehr zum Tragen kommt.
 
Ich denke der springende Punkt ist der Speicher und eventuell das Energieprofil....CB hat mit Single Ranked Speicher getestet und wenn sie ihrem Moto treu geblieben sind, mit dem vom Hersteller versprochenem Ram Takt....wobei nicht klar ist welche Timings verwendet wurden.
Das wären bei zwei Ram Riegeln also 2667er SR mit unbekannten Timings. Bei mir ist es DR mit CL14 und wenn man anderen Tests im Internet glaubt, ist bei Ryzen 2667 DR in etwa so gut wie 3000er SR....Da Euler 3D meinem Test nach sowohl bei wechsel auf 2133 als auch auf schlechtere timings deutlich an Leistung verliert, ist hier schonmal ein Unterschied zu CB(solange auch dieser Test von DR profitiert).

Und dann bleibt eventuell noch die Frage nach dem Energieprofil....CB schreibt zwar im Test, dass man "Höchstleistung" verwenden soll....Volker hat aber nachträglich zugegeben, dass die Spiele wohl nur mit "Ausbalanciert" getestet wurden. Wobei es bei so einem Benchmark wie Euler eh nicht zu Coreparking kommen sollte....dürfte also in diesem Fall keinen Unterschied machen.

Was man aber bei mir ebenfalls sieht, ist die schlechte verwendung von SMT....Unter 5-10% Leistungssteigerung durch SMT im Euler 3D Test stehen 40% Steigerung bei Cinebench15 gegenüber....Laut CB scheint es bei Intels HT ca 10-12% zu bringen wenn man i5 7600 mit i7 7700 vergleicht.

Ist alles schwer zu bewerten wie ich finde.....Ryzen ist ein großer Wurf für AMD und ein Segen für den Konkurrenzkampf. Ich bin froh mich für einen entschieden zu haben...vor allem jedoch weil PCs mein Hobby sind...ich bastel gerne an der Kühlung rum(ohne dass es notwendig wäre), übertakte zum Spaß, entdecke die Eingenheiten der Architektur usw. Und Ryzen hat mir bis jetzt viel Spaß bereitet.

Ich sehe aber auch die Defizite von Ryzen.... es ist unglaublich schwer Ram zu empfehlen...
Ohne guten Ram verliert man durchaus Leistung(was ich allerdings auch bei meinem alten i5 3570K entdeckt habe).....
Bis mal das Bios geladen ist dauert es ewig....
Dank 20° Offset ist die niedrigste Lüfterkurve, die ich für meinen CPU-Lüfter einstellen kann schon etwas zu hoch und dreht zu früh auf(Asus Problem)....
Die angeblich besseren Frametimes kann ich so generell nicht bestätigen und dass nur im Vergleich zu einem in die jahre gekommenen i5 3570K auf 4,4GHz.......Die Schwankungen sind entweder in Bereichen, die man eh nie sieht weil selbst die Aussreißer zu gut sind und die daher irrelevant sind, oder einfach von der Form her gleich....je nach Spiel gibt es für beide CPUs kleine Vor und Nachteile, eventuell würde man größere Unterschiede sehen, wenn ich eine bessere Grafikkarte hätte....Vernünftigerweise würde ich jetzt eine 1080 oder 1080 Ti kaufen aber aus Entdeckerdrang heraus warte ich doch noch auf Vega^^.....
Übertakten über 3,8GHz benötigt deutlich höhere Spannungen und über 4GHz geht der Verbrauch daher überproportional in die Höhe.

Tests mit Aida64 zeigen durchaus verbesserungswürdige Reaktionszeiten beim Ram und ich habe noch keine Bestätigung gelesen, dass das neue Agesa 1.0.0.6 mir mit meinen 16 gb Modulen hilft....ich weiß auch nicht ob gefühlt 30 neue Subtimings für mich ein Segen oder ein Fluch sind;). Ich hab mir zwar ein Agesa 1.0.0.6 Beta-Bios besorgt, traue mich aber noch nicht es aufzuspielen, weil Asus schon zwei der Bios Updates versaut hatte...da will ich nicht der erste sein, der feststellt, dass seine 16gb Module nicht mehr booten oder sowas^^.....
Auch hatte ich mir mehr erhofft bei den Codierzeiten von Camtasia 8....Wenn ich 4 Kerne deaktiviere ist es wie zu erwarten, aber mit 8c16t liegt die Auslastung ohne GPU-beschleunigung nur bei 42-48% und mit GPU bei 60-64%(in einem meiner Projekte).....es geht natürlich trotzdem 60%(mit GPU)/100%(reine CPU) schneller gegenüber dem i5 4c4t@4,4GHz....aber wenn man die Auslastung anguckt, merkt man wie viel Potential verschenkt wird, wenn der i5 zu 99% ausgelastet ist....

Was für mich für Ryzen spricht sind z.B....
Rohleistung haben und noch nicht gut nutzen können ist besser als irgendwann zu wenig.....
Es liefen auch so alle Spiele, die ich getestet habe und wenn es spürbare Unterschiede gab, dann z.B. in Witcher 3 trotz GPU Limit...
Stabilität ist super.....Der Ram bootet nicht mit höherem Ram Teiler als 2667, aber dann macht er Null Probleme...die 3,8GHz sind trotz undervolting seit Wochen super stabil. Auch 4GHz habe ich Prime/Spiele/usw. stabil gehabt, nur 4,1GHz sind ein Problem....normale Benchmarks und Spiele scheinen zu gehen, aber Prime ist nicht auf dauer stabil...mehr Spannung als 1,41V(Last) könnten es vermutlich retten, aber dann komme ich über 300W Verbrauch nur durch CPU-Belastung....das muss nicht sein^^....
Multitasking profitiert von den vielen Kernen....Zwischendurch was Spielen, ohne diverse Programme, die man vorher auf hatte zu schließen...z.B. diverse Programme+Dirt Rally mit Lenkrad, Telemetry_Mod und OBS Aufnahme macht auf dem i5 ab und zu Ruckler und läuft jetzt besser...ist natürlich sehr speziell, schwer zu reproduzieren und zu quantifizieren....entspricht aber meinem Alltagsszenario.
Zumindest bis 3,8Ghz ist die Energieeffizienz ordentlich und gut zu kühlen....mit 1GHz weniger sogar richtig gut.


Puh...ob das überhaupt jemand liest?
 
Zuletzt bearbeitet:
Baal Netbeck schrieb:
Die angeblich besseren Frametimes kann ich so generell nicht bestätigen und dass nur im Vergleich zu einem in die jahre gekommenen i5 3570K auf 4,4GHz.......Die Schwankungen sind entweder in Bereichen, die man eh nie sieht weil selbst die Aussreißer zu gut sind und die daher irrelevant sind, oder einfach von der Form her gleich....je nach Spiel gibt es für beide CPUs kleine Vor und Nachteile

So sehe ich das auch. Diese angeblich besseren Frametimes die immer gelobt werden hab ich auch noch nicht in eklatanter Form gesehen und die bewegen sich ohnehin in Bereichen bei beiden CPUs i7 und Ryzen, dass man keine Unterschiede bemerkt. Ich hab absolut vernünftige Frametimes in Division und Watch Dogs 2 und geringe CPU Auslastung bei für mich akzeptablen FPS und die GPU wird ausgelastet. Und dabei sind das doch Spiele die immer gerne herangezogen werden, dass da Ryzen so viel besser sei bei den Frametimes. Für mich nur Hokuspokus.

Puh...ob das überhaupt jemand liest?

Ich habs gelesen. ;) :)

Und da wir bei Frametimes sind und der Performance in Titeln die viele Threads nutzen. Ich hab eben mal 6 Km Fahrt durch den Dschungel und Regen mit Ghost Recon Wildlands geloggt weil ich mal wissen wollte wie sich der Worst Case darstellt. Also so in etwa das Benchmarkszenario was auch PCGH dafür genommen hat. Ist so das fordernste in dem Spiel. Dschungel, Regen und dann mit einem Lambo schnell durch die Gegend.

Ghost Recon Wildlands Ultra 1080p 6km Fast Drive in Jungle and Rain.png

Mich würden hier mal die Frametimes mit einem Ryzen interessieren mit ungefähr gleichem System. Fallen Ghosts DLC dreht die Grafik jedenfalls noch etwas auf, auch wenn die Lichteffekte teils echt übertrieben sind.
 
VistaMizerFan35 schrieb:
Sie sind mittleweile bei 7nm Fertigung angelangt !!!!!!!!!!!!!!!!!!!!!!!!!!!!!! Hallo ? 1 NM dan ist schluß
Die 7 Nanomarketing vielleicht, von den reallen 7 Nanometern ist man noch sehr weit weg.
 
@ Baal Netbeck
Was man aber bei mir ebenfalls sieht, ist die schlechte verwendung von SMT....Unter 5-10% Leistungssteigerung durch SMT im Euler 3D Test stehen 40% Steigerung bei Cinebench15 gegenüber....Laut CB scheint es bei Intels HT ca 10-12% zu bringen wenn man i5 7600 mit i7 7700 vergleicht.

Ich würde hier mit den Schlussfolgerungen der "schlechten Verwendung" etwas aufpassen, da es m.E. hier eher an einem "geringen Nutzen" liegt. Denn die beobachteten Unterschiede zwischen SMT an/aus beim Raytracing und beim Euler-Benchmark sind auf AMD Systemen leicht zu erklären: Beim Raytracing greift die Strahlenverfolgung in der Regel sehr chaotisch und unvorhersehbar auf den Speicher zu, wodurch ein Raytracer in der Regel Probleme bekommt die Latenzen der Speicherzugriffe überbrücken und die Auslastung der Recheneinheiten gering ist. Eben hier setzt SMT an: Mehr Threads pro Kern erhöhen die Wahrscheinlichkeit, dass mindestens ein Thread etwas berechnen kann, während die anderen Threads gerade auf Speicherzugriffe warten. Fluid Simulationen haben in der Regel sehr regelmäßige und vorhersehbare Speicherzugriffe. Dadurch kann auch meist ein einzelner Thread die Recheneinheiten eines Kernes gut auslasten, wodurch SMT hier weniger Erfolg bringt. Alternativ sind sie auch oft Speicherbandbreiten limitiert, wodurch hier die zusätzlichen SMT threads auch keinen Nutzen bringen. (Welches von beiden bei Euler3D gilt weiß ich gerade nicht).

Auch finde ich in dieser Hinsicht die Aussage von Computerbase, dass AMDs SMT besser als Intels SMT sei, da es mehr Speedup bringt, bedenklich. Denn eine SMT-Implementierung kann umso mehr Performance bringen umso schlechter die Auslastung des Prozessors ohne SMT ist.

@Müs Lee
Uff gute Frage, so ein Problem hatte ich noch nie ;). Ich würde hier einfach einmal auf Datenbanken oder allgemeine Applikationslogik setzen. Zumindest die meisten physikalischen Probleme besitzen die durchaus positive Eigenschaft, dass man sie leicht in viele kleine Teilprobleme, die jeweils voneinander unabhängig sind, aufteilen kann, wodurch sich dort die benötigte Kommunikation zwischen den Prozessoren auch in Grenzen hält.
 
Ich bin damals auch voll in dieses Topic eingestiegen. Das klang sehr schlüssig. Allerdings bin ich jetzt nach einigen Wochen Hands on nicht mehr davon überzeugt, dass Inter CCX Kommunikation via IF eine signifikante Größe im Performance Abbild von Ryzen ist. Ich hab mir mit Process Lasso einen abgebencht mit allen möglichen Anwendungen und Games und das Ergebnis war immer das selbe. Es macht keinen Unterschied.

Die Probleme von einigen Benches kamen anfangs eher von seite der Benches wie man ja an einigen Patches erkennen kann. EULER3D ist eines dieser Beispiele auch wenns bislang keinen Patch gab aber die haben auch besseres zu tun. Das andere große Hindernis war CoreParking und Windows. Die vierte Komponente ist die Speicherperformance.

Während alle Anfangs bei ARMA3 von IF und CCX geredet haben, redet da heute keiner mehr von. Ich hab selber mittlererweile >20% Performancezuwachs in ARMA3 seit ich die Kiste zusammengebaut hab. Kein durch Biosupdates, dem lösen der CoreParking Thematik etc.

Ich glaub ehrlich nicht mehr drann, dass das ein Prob ist. Und wenn ich jetzt höre das Intel ein Mesh statt einem Ring plant.... ein Mesh klingt sehr nach Fabric....
 
Zuletzt bearbeitet:
Wegen ArmA3: Hast du da nochmal ein Result vom Benchmark oder so? Also wo sich soviel getan hat?
 
IchoTolot schrieb:
Wegen ArmA3: Hast du da nochmal ein Result vom Benchmark oder so? Also wo sich soviel getan hat?

Ich hab dir vorhin einen gezeigt IchoTolot. Willst du ihn nochmal sehen?
 
Ja zeig mal. Hab ArmA momentan gar nicht installiert, aber will dann nochmal schauen. ^^
 
Zurück
Oben