News 15 „Haswell“-Prozessoren für Notebooks benannt

Krautmaster schrieb:
Unterm Strich kann man heute ohne groß zu philosophieren sagen dass SMT besser ist als Module (CMT) da dem Markt entsprechender. Das kann sich ändern - wird man sehen.
nein, genau das kann man nicht sagen.

das problem bei AMD sind die decoder, nicht die modulbauweise.
auch SMT würde nicht viel bringen wenn der decoder die bremse ist.

und echte kerne brauchen eben nicht so viel mehr platz, sieht man ja bei der modulbauweise, es sind ja echte kerne, auch wenn manche leute das gegenteil behaupten wollen und dafür bis heute nie argumente hatten...
 
es ist vollkommen Juck was es ist. Heute ist es wie es ist, ob das der Decoder ist oder der L3 oder sonstwas.

CMT ist sicher sehr gut für parallele Abarbeitung, auch gut von AMD dahingehend zu entwickeln, aber im Consumer Markt heute noch nicht auf wirklich effektivem Niveau. Nicht besser wie K10 zB.

Edit:

Naja ich denke wir müssen nicht darüber diskutieren ob SMT oder CMT mehr Platz braucht. Die absolute "Leistungs/Performance-dichte" mag bei CMT höher sein, aber die schöpfe ich schwerer ab da nur bei Auslastung über alle Threads.

Und dann wären wir auch wieder beim Thema "echte Kerne"
 
Zuletzt bearbeitet:
nein, es ist eben nicht egal.

die probleme bei AMD liegen eben nicht an der modulbauweise, es wird auch nicht wahr wenn es hier noch hundert mal erzählt wird.
 
@Krautmaster:

Die IPC hat doch überhaupt nichts mit SMT oder CMT zu tun! Du schließt aus einer schlechten IPC bei AMD, dass CMT ineffizienter wäre. Das hat doch überhaupt nichts miteinander zu tun! :rolleyes:
 
Krautmaster schrieb:
CMT ist sicher sehr gut für parallele Abarbeitung, auch gut von AMD dahingehend zu entwickeln, aber im Consumer Markt heute noch nicht auf wirklich effektivem Niveau. Nicht besser wie K10 zB.
und genau solche aussagen sind eben unsinn.

laut erklärung trifft auch für SMT zu, immerhin ist es der software egal ob es ein SMT kern ist oder ein echter wie bei CMT.
mit einem zusätzlichem decoder steigt die IPC um 20-30% pro kern.

CMT bringt bei software die auf wenigen kernen läuft keine nachteile, die IPC pro kern wäre auch ohne der modulbauweise kaum höher.
 
Elkinator schrieb:
nein, es ist eben nicht egal.

die probleme bei AMD liegen eben nicht an der modulbauweise, es wird auch nicht wahr wenn es hier noch hundert mal erzählt wird.

Was sind bei dir "Probleme bei AMD" ?

Wenn sich die auf Parallelität getrimmte AMD Architektur (Module) nicht bei Multithread absetzen kann dann läuft sie eben nicht so wie man das gerne hätte, noch nicht.

CMT / Module sind sicher ne feine Sache, sollte man annehmen, vor allem aber dann wenn die CPU komplett ausgelastet wird. Ziel von CMT ist es ja möglicht viel Performance bei kompaktem Design herauszuziehen. Und hier sollte CMT auch überlegen sein wie ich bereits schrieb.
Die IPC von CMT über alle Threads auf der CPU ist also höher als bei einer SMT CPU über alle Threads (selbst dieser Vorteil ist Stand heute eher verhalten und oft nicht existent) - wie oen erwähnt ging es aber um die IPC die auf einen Thread fallen kann, die natürlich bei SMT höher ist als bei CMT und genau diese ist im Consumer Markt noch relevanter - im Server Markt siehts etwas anders aus - aber nochmal, selbst da tun sich die Module bisher schwer.

Das mag sich nach Eliminierung der krassesten Flaschenhälse in der Architektur ändern, hier hat AMD sicher mehr Optimierungspotential als Intel da die Architektur noch grün hinter den Ohren ist. Die Zukunft wirds zeigen.
 
Krautmaster schrieb:
Wenn sich die auf Parallelität getrimmte AMD Architektur (Module) nicht bei Multithread absetzen kann dann läuft sie eben nicht so wie man das gerne hätte, noch nicht.
und genau das stimmt eben nicht.
 
Elkinator schrieb:
CMT bringt bei software die auf wenigen kernen läuft keine nachteile, die IPC pro kern wäre auch ohne der modulbauweise kaum höher.

so. Da sagen Tests aber was anderes. Im Optimalfall trifft das sicher zu, so sollte man meinen. In Realität siehts aber noch etwas schwammig aus. Und woher nimmst du die 20-30% durch den Dekoder?

Was AMD hier macht ist eher wieder etwas zurückrudern, da man zusätzliche "Komponenten" wieder redundant auslegt da man gemerkt hat dass sich ein Flaschenhals (zB beim Decoder) auftut.
 
Krautmaster schrieb:
wie oen erwähnt ging es aber um die IPC die auf einen Thread fallen kann, die natürlich bei SMT höher ist als bei CMT
und auch das ist unsinn.

du urteilst jetzt nur auffgrund dessen das bei AMD der decoder gerade gewaltig IPC kostet...
Ergänzung ()

es wurde schon vor monaten analysiert wo beim bulldozerkonzept die probleme zu finden sind, die kerne sind es nicht.
 
Krautmaster schrieb:
wie oben erwähnt ging es aber um die IPC die auf einen Thread fallen kann, die natürlich bei SMT höher ist als bei CMT

Oh mein Gott, jetzt wird's echt total falsch. Ich fühle mich wie in der Computerbild...

Guck Dir die Analysen in der ct an. Da kommt ganz klar die Stärke von CMT gegenüber SMT raus. CMT skaliert mit der Anzahl der Threads viel besser als SMT. AMD hat momentan ganz andere Probleme, die mit dem Modulkonzept überhaupt gar nichts zu tun haben.
 
Zuletzt bearbeitet:
Elkinator schrieb:
und auch das ist unsinn.

du urteilst jetzt nur auffgrund dessen das bei AMD der decoder gerade gewaltig IPC kostet...
Ergänzung ()

es wurde schon vor monaten analysiert wo beim bulldozerkonzept die probleme zu finden sind, die kerne sind es nicht.

und du stützt dich auf Sachen die keinerlei Bedeutung für die CPU stand heute hat. Meinst du es ist so einfach? Decoder hin und gut? Bulldozer wurde von 2005 an entwickelt, wieso hat Trinity nur einen Decoder wenn der FX hier 30% "versemmelt"?

Als nächstes sagt man dann noch dass ein zweiter Floating Kern auch noch 30% bringen würde, dann sind wir wieder bei einem klassischen Dualcore ;)

Nochmal, Modulbauweise ist sehr effizient richtig umgesetzt - vor allem aber bei Last auf allen Kernen. Dann holt man mehr Performance / Transistor heraus als bei klassischer Bauweise.
Ergänzung ()

DinciVinci schrieb:
Oh mein Gott, jetzt wird's echt total falsch. Ich fühle mich wie in der Computerbild...

Guck Dir die Analysen in der ct an. Da kommt ganz klar die Stärke von CMT gegenüber SMT raus.

Nein ich werd mir jetzt keine CT holen. Um du willst jetzt sagen das in der ct bei SingelThread CMT gegen "SMT" punktet? Wohl eher bei MultiThread. Wie ich schrieb.

Wie wärs denn direkt die Quelle anzugeben? Wo punktet CMT bei IPC? Link? Und bei IPC / Thread bitte.
 
Zuletzt bearbeitet:
mir ist dein link aber egal, der sagt genau nichts aus und belegt auch keine aussage von dir.

die probleme mit der niedrigen IPC liegen zum großteil beim decoder und beim langsamem cache.

mit einem decoder pro kern, wie es bei steamroller geplant ist wird die IPC pro kern stark ansteigen.
das ist mit SMT nicht möglich.
Ergänzung ()

du solltest dich vielleicht erst mal mit dem thema beschäftigen bevor du hier auf wichtig machst, dein unsinn tut ja beim lesen weh!


du glaubst echt das AMD einfach so schnell mal einen zusätzlichen decoder einbauen kann?
das ist ein etwas größerer eingriff, das geht nicht von heute auf morgen einfach mal so nebenbeai...
 
Zuletzt bearbeitet:
Die IPC hat überhaupt NULL mit SMT / CMT zu tun. Du hast überhaupt kein Grundlagenverständnis für Mikroprozessoren. Eine weitere Diskussion ist total sinnlos. Mir stellen sich hier als E-Techniker echt die Nackenhaare auf. :rolleyes:
 
klar ist das nicht möglich, die IPC ist ja schon deutlich höher da bei klassischer Bauweise jeder Kern seinen eigenen Decoder hat ^^
Modulbauweise macht ja nichts anderes als "Redundanzen" aufzulösen indem man versucht "Kosten/Nutzen" jeder Einheit zu analysieren. Bisher dachte man ein Decoder erfüllt seinen Job ausreichend um 2 Kerne parallel bedienen zu können. Salopp gesagt.

Man kürzt also aus einem klassischen Dualcore Zeuchs weg, optimiert, mit dem Ziel für gängiges Workload nachher zb 90% der theoretischen Dualcore Leistung zu bringen bei nur 25% mehr Transistoren & Fläche. Der Ansatz ist auch gut. Stand heute scheint aber diese Optimierung auch die Leistung bei nur einem Thread auf dem Modul etwas zu mindern. Und das hat nichts mit dem Decoder zu tun denn bei einem Thread kann der eigentlich voll arbeiten. Ein zweiter bringt ebenfalls (nur) bei Multithread was.

@DinciVinci

natürlich hat IPC nichts mit SMT / CMT zu tun, aber mit der Architektur. SMT ist ja keine Architektur sondern nur ein Feature dieser Architektur, genauso CMT. Die Frage ist welchen EInfluss diese "Features" / Techniken auf diese IPC haben.

CMT Architekturen bietet generell hohe IPC über die gesamte CPU (ausgelastet bei Multithread), klassische Architekturen (nicht Module, egal ob mit oder ohne SMT) bieten aber - wie man sieht, auf den einzelnen Thread mehr Leistung. CMT geht sozusagen in die Breite, klassisch in die Höhe.
Vllt sollte man nicht SMT / CMT verwenden, sondern von klassische Kerne gegen Modulbauweise stellen.

Anstatt hier zu stinkern vielleicht eher mal Musterbeispiele / Cherrypicking betreiben und Graphen liefern.

@Elkinator

naja, vllt solltest du dann dein Geschwätz mit "Intel sollte eher CMT statt SMT einsetzen" untermauern, und nicht einfach über die Annahme dass das mal eben besser sein soll, sondern mit Werten / Ergebnissen. Genauso deine "Decoder bringt mal eben 30% Aussage..."

Ich behaupte deine Aussage dahingehend ist eben Quatsch.

Was meinen Link angeht. Der zeigt wie eine Modulbasierte Architektur (CMT) selbst bei Paradedisziplin Multithread über alle Kerne keinen Benefit aus - mit deinen Worten "4 echten Kernen" schlägt, in geringer Vorsprung mag über den Mehrtakt entstehen. Ich liefere die Quelle, du nur leere Worte.

Ist jetzt auch nicht so dass Trinity oder Vishera extrem kleine DIE / CPU Parts hätten welche die Platzeinsparungen durch CMT bei hoher Leistung rechtfertigen würde.

Wie gesagt, der Ansatz CMT / Module ist sicher gut, vor allem mit Hinblick auf Parallelisierung.
Ergänzung ()

Was meine Aussage zu K10 angeht.

https://www.computerbase.de/2012-10/test-trinity-vs-ivy-bridge-im-cpu-test/33/

Trinity vs Llano. Der Vorsprung wird rein durch Takt erkauft. Wie verhält sichs bezüglich IPC? Welcher CPU Part hat mehr IPC, Llano oder Trinity?

Schau ich mir den Takt an so steht K10 alles andere als schlecht da gegen die neuen CPU - die dank Prozessoptimierung weniger brauchen, sicher, aber der Takt ist deutlich höher - die IPC von Trinity aber deutlich geringer als bei Llano.

Man müsste jetzt den Einsparfaktor bei Fläche auf CPU Seite von Trinity gegenüber Llano gegenrechnen. Denn CMT / Module haben ja das Ziel eben hier mehr Leistung auf kleinerer Fläche unterzubringen.

In der Theorie (nach AMD) sollte dank Modulen die Fläche von CPU Part Trinity zb bei etwa 60% von Llano betragen - bei aber nur etwas geringerer IPC. (AMD spricht meines Wissens von etwa 180% der Leistung eines fiktiven Dualcores durch CMT)
 
Zuletzt bearbeitet:
Ich geb's auf, das hat hier einfach keinen Sinn mehr...

ct 23/11, S.136 - 142

Man sieht im Linpack-Benchmark eindeutig, dass SMT bei mehr als 4 Threads am Ende ist und CMT fast genauso gut zulegt wie bei dedizierten Kernen. Wenn man die IPC von AMD und Intel gedanklich mal normiert, sieht man eindeutig, wie schwach Intels SMT gegenüber CMT ist. Die Schwächen von AMD liegen an ganz anderer Stelle.
 
Zuletzt bearbeitet:
achwas? Echt? Natürlich, wie ich 50mal schrieb ist CMT ja gerade bei Multithread SMT überlegen.

Zulegen muss es nach AMD Zahlen etwa bei 90% zu dedizierten Kernen- weit mehr als SMT, klar.

Edit:

ist es deswegen aber besser? Was ist der Grund dass kleinere niedrig taktendere Intel CPU in klassischer Bauweise auch in selber 32nm Fertigung bei SingleThread Performance deutlichst überlegen sind und selbst bei Multithread kaum hinter sich gelassen werden können? Und was ist "besser" auf typisches Workload im Consumermarkt?

Es ging um die Pauschalisierung CMT besser SMT. So einfach ist das nicht.

P.S.:

;) mach nen Bild. Ich hab keine ct hier.
 
Zuletzt bearbeitet:
DinciVinci schrieb:
Ich geb's auf, das hat hier einfach keinen Sinn mehr...

ct 23/11, S.136 - 142

Man sieht im Linpack-Benchmark eindeutig, dass SMT bei mehr als 4 Threads am Ende ist und CMT fast genauso gut zulegt wie bei dedizierten Kernen. Wenn man die IPC von AMD und Intel gedanklich mal normiert, sieht man eindeutig, wie schwach Intels SMT gegenüber CMT ist. Die Schwächen von AMD liegen an ganz anderer Stelle.

Ein realer extra Kern richtet mehr aus als eine Auslagerung von hoher ProKernLeistung auf 2 Threads ne sag bloß, echt jetzt? :lol: Das damit aber auch der DIE größer wird das ist hier der Punkt.
 
Krautmaster schrieb:
Was ist der Grund dass kleinere niedrig taktendere Intel CPU in klassischer Bauweise auch in selber 32nm Fertigung bei SingleThread Performance deutlichst überlegen sind und selbst bei Multithread kaum hinter sich gelassen werden können?

Vor allem die Branch Misprediction Penalty und die Instruction Cache Hit Rate bei Bulldozer.

Mr. Kaijudo schrieb:
Auslagerung von hoher ProKernLeistung auf 2 Threads

Bitte mach Dich mit den Grundlagen der verschiedenen Mikroprozessorarchitekturen vertraut!
 
Zurück
Oben