News AMD „Bulldozer“: Neue Die-Shots und CeBIT-Ankündigung

held2000 schrieb:
Die 90% K 10.5 Leistung sind von AMD und die + 60% minimum HT Leistung gut da hat AMD glaub ich mehr angegeben, habe aber auch min +60 Angegeben so komme ich besser auf 150% :) hier könnte dann die Leistung auch noch höher liegen insgesammt hat AMD 160% angegeben , hoffendlich verdonnerst Du mich nicht dazu alles noch mal zu lesen :D MFG
Nein das nicht, doch ich wüsste gerne wo du diese Zahlen her hast - sie stimmen einfach nicht und AMD hat solche Leistungsangaben nie gemacht.
AMD hat kein HT ->CMT ist etwas völlig anderes und nicht vergleichbar.
 
deadohiosky schrieb:
Das kann nur noch an der Unfähigkeit von AMDs Marketing-Team oder einem schweren und übersehenen Fehler im Chipdesign scheitern.
AMD hat ein Marketingteam für CPUs? lass mich mal überlegen wann ich die letzte AMD werbung gesehen habe, in der es nicht um grafikkarten ging.
ich werf mal kurz meine zuse an
ratter ratter bingbing klong: keine informationen vorhanden.
könnt ihr euch an eine erinnern?
 
Zuletzt bearbeitet:
@MacroWelle
Hier tummeln sich Halbwissen und Halbwahrheiten.
Na, wer so große Töne spuckt haut jetzt bestimmt sein volles "Wissen" raus...
Und :
1) Ein BD-Core leistet nicht weniger als ein K10.5-Core ("IPC will rise"). Die Angabe mit den 90% beziehen sich auf ein BD-Modul, in dem nur ein Thread aktiv ist bzw. einen imaginären einzelnen Kern mit Bulldozer-Eigenschaften - das ist gemeint mit "klassischem Kern" (100%). Aufgrund der teilweise gemeinsam genutzten Einheiten skaliert die Leistung mit einem zweiten Thread im Modul nicht auf 200%, sondern weniger. Das hat AMD auch schon vor längerem (inklusive Zahlen) gesagt. Alles andere ist Quatsch und stammt aus voneinander abgeschriebenen Falschmeldungen.
RICHTIG...ähm, NEIN, FALSCH
Aber warte :
2) 50% mehr Leistung bei 33% mehr Kernen bezieht sich auf Server-Modelle und -Benchmarks. Das sind andere Welten. Auch weil mehr Kerne nicht automatisch entsprechend mehr Leistung bedeuten. Der Vergleich war übrigens nicht bezogen auf 4- oder 6-Kerner, sondern 12-Kerne zu 16-BD-Kerne.
3) Wenn BD rauskommt, dann dürfen wir lesen "buhuhu, die Lügner von AMD haben uns 50% mehr Leistung versprochen", darauf könnt ihr Gift nehmen.
RICHTIG...Oder? NEIN, schon wieder falsch!
Also wenn man schon großspurig in nem Thread mit der Keule des Wissens rumschleudert muss man Wissen was man tut.
Hier nochmal für dein Gedächtniss die AMD Ankündigung für die Cebit :
Der US-amerikanische CPU- und Chip-Hersteller AMD wird auf der CeBIT 2011 Prozessoren vorstellen, mit denen die Leistung der derzeitigen Top-Modelle der Phenom-II-Reihe um 50 Prozent übertroffen werden soll.

Und dein Punkt 1 ergibt keinen Sinn. Du schreibst
Ein BD-Core leistet nicht weniger als ein K10.5-Core ("IPC will rise").
und gleichzeitig schreibst du
Die Angabe mit den 90% beziehen sich auf ein BD-Modul, in dem nur ein Thread aktiv ist bzw.
in verbindung mit
Aufgrund der teilweise gemeinsam genutzten Einheiten skaliert die Leistung mit einem zweiten Thread im Modul nicht auf 200%, sondern weniger
D.h. bei einem Thread pro Modul erreicht der BD nicht die Leistung eines TYpischen K10.5 Kerns. Bei 2 Threads pro Modul kommt dieser ebenfalls nicht auf die Leistung zweier K10.5 Kerne. Und WO bitte schön soll er denn nicht weniger leisten?

Also nochmal :
Dieses Konzept nennt AMD "Core Multithreading" (CMT). Gegenüber einem Modul mit nur einem Integer-Kern – also einem klassischen "Kern" – kostet der zweite Integer-Kern rund 12 Prozent an Fläche (gemessen an einem Modul), dennoch soll die Leistung laut AMD im Mittel bei 80 Prozent der Leistung eines echten Zweikern-Prozessors liegen.

Und dadurch das bei nur einem Thread pro Modul ein Kern abgeschaltet werden kann können die ganzen shared recourcen an den beschäftigten Kern im Modul übergeben werden. Dies führt zu einer insgesamt bessere Performance als Vorher :
Gleitkomma-Einheit (FPU)

Wie bereits erwähnt teilen sich die beiden Kerne, oder besser gesagt die zwei Threads, die innerhalb eines Moduls abgearbeitet werden, die Gleitkomma-Einheit (FPU). Wie die beiden Kerne verfügt auch diese über einen eigenen Scheduler und einen eigenen Lade-Puffer. Die FPU beinhaltet darüber hinaus zwei Pipelines (MMX genannt), die SIMD-Befehle mit Integer-Operanden oder Gleitkomma-x86-Befehle durchführen können sowie zwei Pipelines, die jeweils einen Fused-Multiply-Add-Befehl (FMAC) oder äquivalente Instruktionen mit 128 Bit breiten (Gleitkomma-)Operanden ausführen können. Das Besondere an FMA-Befehlen ist, dass bei einer Operation der Art a*x + y nicht erst a*x berechnet wird, danach gerundet wird und dann y addiert wird sowie final gerundet wird, sondern nur einmal am Ende eine Rundung erfolgt. Dadurch ist das Ergebnis korrekter als bei einer einfachen Multiply-Add-Instruktion.
Außerdem kommt hier hinzu das AMD diese FPU als FlexFPU verwendet. D.h. 128bit pro Kern in Modul oder aber 256bit für nur einen Kern! Die FPU option bringt zwar nicht allen Anwendungen etwas. Aber es KANN eben das zünglein an der Waage sein!

Nicht vergessen sollte man auch das AMD zusätzlich die Integer überarbeitet hat :
Jeder Integer-Kern beinhaltet einen eigenen Scheduler, eine eigene Retire-Stufe – jene Einheit die bei der Out-of-Order-Ausführung dafür sorgt, dass die Befehle schlussendlich doch in der richtigen Reihenfolge beendet werden – eine eigene Logik zur Registerumbenennung sowie eine eigene Lade- und Speichereinheit. Letztere kann auf einen Puffer mit 40 Einträgen für Lade- und 24 Einträge für Speicher-Operationen zurückgreifen. Laut den Spezifikationen erlaubt diese Einheit die Durchführung von zwei Lade- oder einer Speicheroperation pro Zyklus. Ein aktueller Phenom II beinhaltet zum Vergleich pro Kern lediglich einen Puffer mit insgesamt 44 Einträgen und kann pro Kern zwei Lade- oder einer Speicheroperation pro Zyklus. Ein einzelner Integer-Kern dürfte hier somit geringfügig performanter als ein aktueller Phenom II sein.

Und dann erhöht sich die anzahl der Integer pro Core :
Für Lade- oder Speicheroperationen werden auch die zwei Adressgenerierungseinheiten (AGen) in zwei der vier Pipelines benötigt. In den beiden verbleibenden befindet sich jeweils eine Arithmetisch-Logische-Einheit (ALU), so dass pro Kern insgesamt zwei ALUs und zwei AGens vorhanden sind. Allerdings sind die beiden ALUs nicht komplett identisch, denn nur eine der beiden Einheiten unterstützt Multiplikationen und nur eine Divisionen. Ein Modul kommt somit insgesamt auf vier Integer-ALUs und vier AGens, womit man jeweils um eine Einheit stärker aufgestellt ist als ein Kern auf Basis der aktuellen Architektur.

Nicht zu vergessen ist das AMD mit dem BD alle aktuellen Befehlserweiterungen unterstützen wird von den Intel zum Teil schon heute Profitiert. Da wäre AES und SSE4 zu nennen. AVX kommt auch, wird aber unmittelbar noch nichts bringen weil kaum Software das unterstützt.
Ich denke es ist auch damit zu rechnen das AMD wie Intel den L3 mit CPU Takt laufen lassen wird.
 
Zuletzt bearbeitet:
@digger66a: Solche Beiträge lob ich mir!^^

Wir werden abwarten müssen. digger66a hat es sehr schön veranschaulicht. Wenn ich seinen Beitrag zusammenfasse kommt unterm Strich raus:
Viele Wege führen nach Rom.
Es wird sich jetzt nurnoch zeigen welcher Weg der Beste ist. Alleine die tatsache, dass AMD eine Antwort auf Intels SMT gefunden hat ist schon ein gutes Zeichen Imho.
FAKT ist, dass AMD die Beine in die Hand nehmen muss. Wenn ich die letzten Zahlen zu Rate zieh *räusper* *nachguck*...daaaaaaaaaaaaaaannnnnnn sieht es für AMD alles andere als gut aus, trotz dem "Sandy-Fiasko". Floppt Bulldozer seh ich schwarz. Es lässt sich auf kurz oder lang nicht alles über den Preis regeln :/. Wer Leistung will kommt momentan nicht um Intel herum. Darüber hinaus ist SB in Sachen Leistung/Takt/Watt einfach durch Deneb und Co nicht zu schlagen, da kann AMD die Taktraten anziehen wie sie wollen.

Soviel ;)
 
Bulldozer soll angeblich im Sommer kommen. Wenn man nun davon ausgeht, dass der Sommer nicht vor Juni beginnt, kann ich keine Sekunde nachvollziehen, warum AMD dann 3 Monate vorher auf der Cebit BD Benches zeigen soll? Das hat doch nur Nachteile und keine Vorteile.

Wenn man nun davon ausgeht, dass 15% der Menschen weltweit in einem PC Forum abhängen, gilt auch hier, dass sich die 15% aufteilen in 60-80% Intel Anhänger und 20-40% AMD Anhänger. Also für die Bilanz am Jahresende um dann möglicherweise den einen oder anderen Käufer der dann 3 Monate wartet völlig unbedeutend. Dafür würde man aber Intel alles offen legen und die Konkurrenz Intel kann sich gemütlich 3 Monate auf die dann kommende Situation einstellen.

Kommt Bulldozer schon im April, wäre es nach meiner Auffassung weit eher logisch, dass wir Benches auf der Cebit sehen.
 
digger66a schrieb:
Das war das erste und auch das letzte mal das ich zu dem doofen thema module gleich oder ungleich kerne was sage
Sehr gut. Ich mag nämlich keine Autovergleiche mehr lesen. Außerdem: wenn es irgendeinen der Intel-Fanboys interessieren würde, dann würden Sie es nachlesen und selbst versuchen zu verstehen. Es wurde bisher schon so oft erklärt, vom Kindergarten- bis zum Professorenanwärterniveau.
Fanboys fehlt es aber nicht an logischer Basis, es ist ein Problem des "Nichtverstehenwollen", weil das der Kritik an AMD den Wind aus den Segeln nehmen würde.

Das ist so, als würden die AMD-Fanboys auf einmal verstehen, dass die IGP auf SandyBridge kaum Extrakosten und keinen Energieverbrauch verursacht, wenn sie abgeschaltet ist. Oder das so ein Designfehler wie bei H/P67 andauernd passiert, nur meistens die Konsequenzen vernachlässigbar sind oder die Hersteller den Fehler einfach nicht eingestehen/ignorieren und den Kunden auf dem Schaden sitzen lassen. Oder Totschlagargument "Treiber" bei AMD-Grafikkarten...man kann sich da den Mund fusselig reden. Vorurteilen und Abneigungen aus Prinzip heraus kann man mit logischen Erklärungen genau so wenig entgegentreten wie Rassenhass oder religiösem Fanatismus.

Gruß FatFire

PS: @sanders: Warum widerlegst Du nicht einfach den ganzen Kram, in dem Du darauf hinweist, dass seine ganzen Berechnungen auf einer falschen Annahme beruhen, nämlich der Annahme dass ein Thread in einem Bulldozer-Modul nur mit 90% der Performance eines K10.5 abgearbeitet wird? Dies galt nämlich für Bobcat und hieß vollständig: 90% der Performance auf 50% der Die-Size.
 
Zuletzt bearbeitet:
@FatFire
Danke, vielleicht denke ich einfach zu kompliziert? :D
Aber hast recht, es wäre kürzer gewesen ;)

Fanboys fehlt es aber nicht an logischer Basis, es ist ein Problem des "Nichtverstehenwollen", weil das der Kritik an AMD den Wind aus den Segeln nehmen würde.
Right!
 
Wozu die angekündigten Bulldozer mit Sandy Bridge-Modellen von Intel vergleichen? Wenn irgendwann einmal aus der AMD-Paperware ein verfügbares Produkt geworden ist, liegt von Intel bereits die nächste CPU-Generation in den Läden.
 
Mal etwas anderes:
Gut möglich, dass ich einfach beim Suchen ungeschickt bin, aber ich kann keine Informationen darüber finden, ob BD/Am3+ Dualchannel oder TriChannel Unterstützen wird..
Jemand eine Ahnung, wieviel Kanäle das Ding haben wird ; )?
 
mensch183 schrieb:
Wozu die angekündigten Bulldozer mit Sandy Bridge-Modellen von Intel vergleichen?
Weil es sich aus mehreren Gründen anbietet:
- gleiche Strukturbreite (32nm)
- ähnliches Featureset (SSE 4.1, AVX...)
- werden zeitgleich verfügbar sein, wenn nicht etwas Unvorhergesehenes passiert

Womit sollen wir denn ansonsten vergleichen? Von Ivy Bridge ist doch bisher kaum etwas bekannt. Außerdem erwartet da außer einem Shrink (der die Technologien wieder weniger vergleichbar macht) auch keiner großartig was Neues. Umfassende Architekturänderungen sind nicht vorgesehen. Also wenn Intel den Shrink nicht versemmelt, nur mehr Taktpotenzial und bessere Effizienz.
So muss sich Bulldozer eben an den Vorgängern (laut AMD 50% mehr Performance als Phenom II) und der aktuell verfügbaren Konkurrenz von Intel messen lassen. Die Rumrechnereien die hier einige betreiben sind allerdings von der Qualität her Wahrsagerniveau. Denn genau solche Rechnungen gab es auch im Vorfeld vom Phenom I...wie es ausging wissen wir ja alle.

@Bayne87: Dual-Channel bei AM3+ und C32, Quad-Channel bei den Servervarianten im G34-Sockel.

Gruß FatFire
 
sanders schrieb:
@Canopus
Google kennst du schon oder? Dann liefer doch mal den gegenbeweis. Und "nein stimmt nicht..." ist für mich kein Argument.


KLICK

@unter mir

Und wo findet deine Behauptung jetzt eine Bestätigung, dass immer nur die Rede von ca. 80-90% der alten Cores sei?
Wie soll man für eine Behauptung über Google Gegenbeweise bringen, wenn doch schon die Behauptung nicht bewiesen werden kann?
 
sanders schrieb:
D.h. bei einem Thread pro Modul erreicht der BD nicht die Leistung eines TYpischen K10.5 Kerns. Bei 2 Threads pro Modul kommt dieser ebenfalls nicht auf die Leistung zweier K10.5 Kerne. Und WO bitte schön soll er denn nicht weniger leisten?
Der Vergleich zu den 10.5 Kernen ist einfach nicht korrekt - AMD vergleicht immer Bulldozerkerne miteinander und nicht die vorherigen Kerne. Es geht lediglich darum eine relative Performance von Singlethread<->Dualthread Workload zu veranschaulichen

1 Thread -> 100%
2 Threads -> 180%

So wie eben auch bei Intels SMT:
1 Thread -> 100 %
2 Threads -> 125 %

Daraus kann man ja auch nicht schließen dass die Singlethread Performance bei Intel 62,5% der vorhergehende Generation beträgt - also warum dann bei Bulldozer den selben Denkfehler machen?

Der Vergleich zu K10 betrifft lediglich den Aufbau der CPU:
Dualcore (auch CMP genannt) vs. Modul (mit CMT) - nicht die absolute Performance.
 
freifacht schrieb:
Ergänzung vom 27.02.2011 22:22 Uhr:
Zitat:
Zitat von TommiX1980

Wozu der wohl benutzt werden wird

Auszug aus dem Artikel:
"um den Augeninnendruck von an Grünem Star erkrankten Patienten zu messen. In das menschliche Auge implantiert, soll das System kontinuierlich den Verlauf der Krankheit erfassen und messen."
Wer lesen kann, ist im Vorteil

Wie Bitte, das hab ich doch gar nicht geschrieben?;)

Edit meint, alles Klar freifacht.
 
Zuletzt bearbeitet:
Complication schrieb:
Der Vergleich zu den 10.5 Kernen ist einfach nicht korrekt - AMD vergleicht immer Bulldozerkerne miteinander und nicht die vorherigen Kerne. Es geht lediglich darum eine relative Performance von Singlethread<->Dualthread Workload zu veranschaulichen

1 Thread -> 100%
2 Threads -> 180%

So wie eben auch bei Intels SMT:
1 Thread -> 100 %
2 Threads -> 125 %

Daraus kann man ja auch nicht schließen dass die Singlethread Performance bei Intel 62,5% der vorhergehende Generation beträgt - also warum dann bei Bulldozer den selben Denkfehler machen?

Der Vergleich zu K10 betrifft lediglich den Aufbau der CPU:
Dualcore (auch CMP genannt) vs. Modul (mit CMT) - nicht die absolute Performance.

richtig, sonst könnte AMD auch schlecht behaupten, dass ein Bulldozer "DualCore" Modul schneller sein kann als ein K10.5 mit zwei Kernen:

bulldozer-vs-magnycourz7r5.jpg


man darf also auf erhöhte Leistung / Takt / Kern hoffen...
 
TommiX1980 schrieb:
sorry, da ist mir was durcheinander geraten. (das Zitier-System im Forum ist aber auch etwas umständlich)

ich bezog mich eigentlich auf diesen Beitrag:
Holt schrieb:
Marius schrieb:
http://www.krone.at/Digital/Forsche...ter_der_Welt-Ein_Kubikmillimeter-Story-247783

Wissenschaftler der Universität von Michigan haben den nach eigenen Angaben kleinsten PC der Welt entwickelt. Auf einer Grundfläche von gerade einmal einem Quadratmillimeter (!) beherbergt der Mini-Rechner unter anderem einen Prozessor plus Speicher, eine Batterie, einen Sensor sowie ein Radio samt Antenne zur drahtlosen Datenübertragung.


Wozu der wohl benutzt werden wird :evillol:
 
Mal ne Frage zum Kerne vs Module - Gefecht:
ist es nicht völlig egal, wie der Rechner auf seine Leistung kommt?
Mir ist in erster (und auch in zweiter und dritter) Linie wichtig, was hinten rauskommt.
Welches System bietet die bessere Leistung für den geplanten Einsatzzweck? Das interessiert mich.
Alles andere ist doch nur eine akademische Diskussion ohne praktischen "Nährwert"
:confused_alt:
 
Und auch wenn BD nicht mit SB zurande kommen wird.
Wir haben ALLE gesehen was nVidia mit einem Refresh aus dem Fermi gemacht hat...neue Architekturen können beim ersten Versuch versagen und beim zweiten den Gegner einfach stehen lassen...das Selbe ist ja AMDs Radeon 6000 eigentlich auch (ich sage dass die neue CPU und die aktuelle GPU von AMD sehr viel Potential haben wird)....
 
@freifacht: Da es noch keine offiziellen Tests und Benchmarks gibt, also auch keiner weiß was am Ende alles in allem rauskommt, ist das hier so oder so alles nur akademische Diskussion ohne praktischen Nährwert. Aber das ist einfach der Aufregung und Erwartungshaltung geschuldet. Und da der Mensch ein Gewohnheitstier ist, ist bei...hm...sagen wir mal 80% der Nutzer hier eh schon eine Kaufentscheidung für oder gegen Bulldozer gefallen und die Diskussion nur die Rechtfertigung für die Entscheidung, die in frühestens zwei oder drei Monaten dann auch praktisch umgesetzt wird. :)

Gruß FatFire

PS: Und nein, es ist nicht ganz egal, ob die gleiche Leistung aus einem, zwei, vier, acht oder 571 Kernen kommt, da sich bestimmte Aufgaben einfach nicht parallelisieren lassen (Zahnartbesuch, Magenspiegelung, Essen und Zähne putzen gleichzeitig geht einfach nicht, muss man nacheinander machen).
 
FatFire schrieb:
PS: Und nein, es ist nicht ganz egal, ob die gleiche Leistung aus einem, zwei, vier, acht oder 571 Kernen kommt, da sich bestimmte Aufgaben einfach nicht parallelisieren lassen (Zahnartbesuch, Magenspiegelung, Essen und Zähne putzen gleichzeitig geht einfach nicht, muss man nacheinander machen).
deshalb schrieb ich ja, "für den geplanten Einsatzzweck"
Wie ich schon zuvor erwähnte, benötige ich den Rechner für Videobearbeitung und 3D-Rendering.
Wobei es eher seltenst vorkommt, dass die rechenintensiveren Sachen wie Rendering und Videoberechnungen parallel laufen.
Eher mal irgendwelche Texturen in Photoshop bearbeiten, während ein (Test-)Rendering läuft. Wobei da Photoshop auch nicht unbedingt die CPU voll fordert.

Aber selbst da, wenn man mal den Rechner über Nacht an 2 unterschiedlichen Projekten gleichzeitig (also bspw. ein Maya-Projekt und ein Premiere- oder AfterEffects-Projekt) rechnen lässt, kann ich mir irgendwie nicht vorstellen, dass sich BD und SB bezüglich Parallelisierbarkeit großartig unterscheiden würden.
Ich denke schon, dass im genannten Anwendungsbeispiel bei beiden Systemen die CPUs ohne größere Leerlaufzeiten optimal ausgelastet würden.

Ich lass mich da natürlich gerne eines besseren belehren
 
Zurück
Oben