Quicktest SMT on/off cinebench&frybench

octacore

Lieutenant
Registriert
Jan. 2008
Beiträge
824
Durch Diskussionen im Clarkdale mit 3,06 GHz: Theoretisch verdammt schnell Thread habe ich mir Cinebench und Frybench geschnappt und jeweils mit und ohne Hyperthreading gebencht (was sonst).

OS = Vista 64bit SP1
System: ASRock X58 Extreme // Intel Xeon W3520@4,2GHz Mugen2 // Crucial 3x2GB DDR3-1333 CL9 // OCZ-Vertex 120GB // ATI X1550 // Modu 525W

SMT OFF

Cinebench64: Singel 6K / Multi 21K


Frybench64: 7m29s


SMT ON

Cinebench64: Singel 5,9K / Multi 23,8K


Frybench64: 5m16s
 
vielleicht hättest du dazu noch was schreiben können.. das ist kein Quicktest sondern nur ein Quickie..

aber man erkennt ja, dass bei SMT On die Leistung des einzelnen Kerns zurückgeht, zugunsten der virtuellen Kerne. Dafür spielt dann SMT bei multithread Software (wahrscheinlich nur die, die über 2/4 Kerne nutzt, je nachdem ob dual- oder quad-core) dann ihre stärken aus und ist dann schneller als ohne SMT.
 
Die beiden Programme eignen sich sehr gut zu zeigen das Multithreadsoftware nicht unbedingt optimal noch läuft mit Mehr-Kernen&SMT. Den probiert mal wer mit einen X3 Phenom vs X2/X4 rum, man merkt das der dritte Kern nie richtig optimal "benutzt" wird und das liegt an Cinebench selber. Den schiebts meist an einer sehr unoptimalen Postion ein bzw. verbrät mehr Zeit dann mit dem Kern herumschupsen wie das er rechnet.

Hingegen der Fryrender macht keinen Unterschied auch bei "ungerader" Anzahl von Kernen.
 
das ist bei cinebench aber auch bei 4 kernen so -.-*

teilweiser dauert das 10sek länger bis der letzte kern rechnet und wenn einer fertig ist, dann dauert das bis zu 5sek bis er wieder weitermacht und dann auch an einer blöden stelle
 
Da hast du zwei Theoretische Tests genutzt, die beide von mehr als 4 Kernen profitieren, wie unrealistisch ist das denn? Ich hab z.B. GTA4 mit 40% Sichtweite und Rest @ Maximum getestet und erreichte ohne SMT 62 FPS - Mit waren es noch 56...
 
DC + SMT Werte

[Core i7-920 @ 2,67 GHz (Cores im BIOS deaktiviert) / GTX 280 @ 186.18 (HQ)]
[Race Driver Grid in 800x600 mit max. Details; Start des San Francisco Kurses; Kamera in der zweiten Außenperspektive]


• Ausgehend von einem SC bringt SMT im Cinebench (3 Runs gemittelt) +19%, Race Driver Grid legt um +14% zu
• Ausgehend von einem DC bringt SMT im Cinebench (3 Runs gemittelt) +18%, Race Driver Grid legt um +8% zu
• Der QC ist +53%/+11% schneller als der DC+SMT
• Der DC ist +65%/+14% schneller als der SC+SMT

Je weniger Kerne, desto mehr bringt SMT - rocken tuts aber nicht.

smt-ftwhude.png
 
Na-ja, rocken kann es auch nicht. Ohne SMT hat ein Thread pro Core-Kern 4 parallele Pipelines zur Verfügung, kann also die vierfach superskalare Architkektur nutzen. Mit SMT hat jeder Thread pro Core-Kern durchschnittlich/im Mittel 2 parallele Pipelines zur Verfügung, kann also nur die zweifachsuperskalare Architektur nutzen.

Es werden ja nicht mehr Verarbeitungseinheiten, sondern die bestehenenden werden besser ausgelastet.

BTW, der K10 ist nur 3-Fach-superskalar, da würde SMT noch weniger bringen ;)

Intel Dual-Core vs. AMD Tricore-Vergleich:

Intels Dual-Core mit SMT kann bei einer schwachthreaded Anwendung, also angenommen durschnittlich drei Threads: einen Thread auf 4 ALUs laufen lassen und zwei Threads würden sich die anderen 4 teilen

Phenom X3 kann drei Threads auf je 3 Alus verteilt laufen lassen,

Sind nur zwei Threads da, dann Idlet ein ganzes Phenom-Kern, während bei Intel mit SMT nur ein paar ALUS weniger zu tun haben bzw. versuchen die beiden Threads mit allen verfügbaren Einheiten zu rechnen.
 
Zuletzt bearbeitet:
Ich habe gerade einen interessanten Test bei PCGH gefunden, der den i5-750, i7-860, i7-920 bis hin zum i7-965 @ 4GHz testet - auch die Konkurrenz in Form des Phenom II und der "alten" LGA775 Quads sind mit von der Partie, ebenso DualCores. Es geht jetzt "nur" um Anno 1404, dieses ist aber bekanntlich auf Multicore ausgerichtet und verdeutlicht mal ganz gut wohin die Reise geht (gehen kann), auch im Hinblick auf SMT on/off - 10% Mehrleistung sind drin.
 
eXEC-XTX schrieb:
Da hast du zwei Theoretis
,...es ging um das leidige Thema Cinebench und SMT on/off in dem Thread auf dem ich bezog. Frybench übrigens setzt auf eine Renderengine auf, die nicht nur zum Benchen da ist. Das Frybench neuer ist als der Cinebench von der Engine darunter nahm ich es dazu.

Weiteres falls jemand einen Phenomn 940BE/955BE hat und den mal mit 4,2GHz betreiben könnte für eine Runde frybench run wäre spannend, den ohne SMT des i7 würde ihm der Phenom arg auf den Pelz rücken ;)

@ y33H
SMT ist auch nur ein Mittel zur Lastverteilung wenn viele "kleine" Programme gleichzeitig ausgeführt werden müssen. Daher skaliert es normal in Windows eher besser mit wenigen Kernen+SMT, weil dort selten wirklich viel gleichzeitig ausgeführt wird bzw. eher "schwergewichtige" Einzelprogramme benutzt werden ohne modularen Aufbau. Sind dann schon 4 echte Kerne bereits vorhanden wirds halt mau für das plus durch SMT unter typischen Windowsdesktop.

@Pyroplan
Das meinte ich nicht ,sondern zu welchen Punkten er einen freigewordenen Kern einsetzt der ist bei einen Dreikern wie 720BE nicht wirklich optimalst. Nur das liegt eben nicht an Windows, nicht am Prozessor sondern an der Anwendung.
 
Zurück
Oben