Krautmaster schrieb:
naja nach heutiger Architektur immerhin effizienter als AMD.
Andersherum, ineffizienter als AMD. Intel ist maximal pro Fläche effizienter. Aber wie gesagt, hier reden wir auch von 32 vs 45 nm. Bei gleicher Strukturbreite und vergleichbarer Infrastruktur sähe das ausgeglichener aus.
Krautmaster schrieb:
Zumindest bei den üblichen Aufgaben die im Office Bereich bzw zu Hause anfallen.
Nochmal, wir reden über Server Prozessoren. Was hat das mit Office oder zu Hause zu tun? Bleib doch mal beim Thema.
Krautmaster schrieb:
Es ist wie immer der Einsatzort. Es gibt einfach Aufgaben bei denen Eine GPu selbt einen 24 Kern AMD System um Welten überflügeln würde und umgekehrt. Bestes Beispiel ist und bleibt 3D. Genau darauf ist die GPU ausgelegt und das kann sie am besten. Trotzdem kann sie bei dem Knacken von Passwörtern auch um Faktor X schneller sein.
Du musst nicht krampfhaft irgendwas schreiben, nur um etwas geschrieben zu haben. Dagegen hat doch gar niemand etwas gesagt. Du scheinst aber zu glauben, dass die GPU die CPU ersetzt. Und das wird nicht passieren. Sie wird die CPU bei bestimmten rechenintensiven Aufgaben auf absehbare Zeit maximal unterstützen. Nicht mehr und nicht weniger.
Krautmaster schrieb:
Die GFLOP zahl ist doch vollkommen uninteressant für den Desktop Bereich.
Das war auch nur ein Beispiel. Ich dachte eigentlich, das wäre deutlich geworden. Nimm von mir aus die Zeit, die ein Bild zur Konvertierung braucht, die FPS eines Spiels oder was auch immer du willst. Das ändert an meiner Aussage nichts. Und wir reden übrigens immer noch von Servern.
Krautmaster schrieb:
Die Antwort ist einfach: Parallelisierung hilft nur begrenzt weiter
Ja, das würde die Intel PR in der momentanen Situation wohl auch sagen. Die Wahrheit ist aber eine ganz andere. Parallelisierung hilft, bisherige Aufgaben deutlich zu beschleunigen. Und das gilt besonders für die Märkte, über die wir hier sprechen. Serielle Performance stagniert sowieso seit längerem.
Krautmaster schrieb:
Wir sind immeroch beim Durchsatz und der ist im Desktop schwer zu messen.
Nein, wir sind immer noch bei SERVERN.
Krautmaster schrieb:
Wichtig ist nur, dass mit wenig Takten soviel wie möglich Einzeloperationen durchgeführt werden können. Heißt wie schnell ein "Kern" bzw die ganze CPU eine, nicht zwei Aufgaben meistern kann. Diese eine Aufgabe zu palarllelisieren erfolgt erst im 2. Schritt, und hier kann man wieder optimieren.
Eher weniger. Generell sind es zwei Schritte, die man gleichzeitig gehen muss. Nur so lässt sich eine wirklich effiziente Architektur designen. In speziellen Einsatzgebieten ist es nur ein Schritt, da lediglich Parallelisierung zählt. Wie ich schon mal sagte, serielle Performance ist ein Relikt aus vergangenen Tagen. Das hat heutzutage keine ausschiessliche Priorität mehr.
Krautmaster schrieb:
Heute braucht man einfach eine hohe "Einzelperfromance" die man durch Parallelisierung dann auf mehrere Aufgaben verteilen kann.
So pauschalisiert ist dies schlichtweg falsch. Das Endergebnis zählt. Wie gross dabei der einzelne Faktor ist, interessiert am Ende niemanden. Du solltest auch mal bedenken, die Faktoren können dynamisch sein, Stichwort Turbo. Eine CPU mit 8 Kernen taktet @ default mit 2 GHz. Werden nur ein oder zwei Kerne ausgelastet, takten die aber mit 3 GHz. Ist das nicht die deutlich bessere Lösung als ein 4-Kerner, der generell mit 3 GHz taktet, unter der Voraussetzung, beide CPUs haben identische IPC? Ist serielle Performance gefragt, sind beide CPUs gleichwertig, ist parallele Performance gefragt, gewinnt der 8-Kerner deutlich. Und ähnliches dürften wir bei Bulldozer sehen. Magny-Cours hat bisher nur noch keinen Turbo. Den gibt es vorerst nur bei Thuban, da er in diesem Bereich sinnvoller ist. Mit Bulldozer wird Turbo wohl im gesamten Portfolio Einzug halten.
Krautmaster schrieb:
für mich sagt das aus, das ganz theroetisch beide CPUs gleich schnell wären da beide Jobs gleich schnell abgearbeitet werden.
Aber nur, weil du von einem Performanceverhältnis pro Kern von 2:1 ausgehst. Das ist aber nicht korrekt. Wie wir schon mal festgestellt hatten, liegt dies grob eher bei 1,6-1,9:1, je nachdem, wie gut SMT greift.
Krautmaster schrieb:
Steht bei CPU2 jedoch ein nicht parallelisierbarer Job an siegt CPU1.
Wie hier schon jemand sagte, was du machst ist eine Milchmädchenrechnung. Die Praxis schaut deutlich komplexer und weniger vorhersagbar aus.