News „Bulldozer“ erlaubt offenbar hohe Speichertaktraten

Preise sollen angeblich schon bekannt geworden sein.
Wenn man Slashcam.de vertrauen schencken darf wird der FX8130 um die 320$ kosten.
Das sind momentan 226.54€.
Da mus Intel die C7i reihe sowie die C5i reihe vom Preis deutlisch senken.
( Wenn es soweit ist )
 
deadohiosky schrieb:
Potential, Potential?

Du hast gerade eben deine Vermutungen oder deine Skepsis über die Modulbauweise zum Ausdruck gebracht.
Ich weiß zwar nicht genau was du meinst, ich bin im Gegenteil sogar ein großer Fan spannender neuer Ansätze wie auch dem Modulsystem, was mich aber nicht an meiner Erfahrung zweifeln lässt, dass neue Ansätze und dabei gerade die, die so radikal wie die der Modulbauweise sind, ihre Leistungsfähigkeit praktisch erst unter Beweis stellen müssen. Nicht nur weil ein solche CPU in ihrer Charakteristik noch nicht wirklich verstanden ist(wie etwa verhält sich die neue, zwar doppelt breite aber nur noch 1x pro Modul vorhanden aber dafür splittbare Fließkommaeinheit in der Praxis?), sondern auch, weil bei großen Umwälzungen auch viele Fehler gemacht werden können, wartet man gerade beim BD lieber erst mal auf ein paar Benchmarkergebnisse und betet dafür, dass AMD die vielen CPU Komponenten auch wieder sauber zusammengesetzt haben, nachdem sie sie vorher in ihre Einzelteile zerlegten. Jedenfalls ist das eher meine Devise. Du kannst natürlich gerne spekulieren.

@Lazkopat
Das währen ~260€ für eine übertaktungsfreundliche 8 Kern CPU, und wenn sich die neusten Benches bewahrheiten, würde so etwas einschlagen wie ein mittlerer bis mittelgroßer Meteorit.
 
Ich glaube wir drehen uns weiterhin im Kreis.

Wie gesagt es ging mir von vornherein nur um die Aussage mit dem Servermarkt und auf Grund meiner Aussage hast du mir dann eine Nähe zu AMD unterstellt.

Dabei geht es mir im Endeffekt nur darum eine Balance zwischen den Extremen herzustellen und eher mit Fakten meine Meinung darzulegen.

Denn es wird immer wieder geschwafelt: 8 Kerne... höhö das schafft Intel ja mit 4. Und diese Banalitäten gehen mir einfach gegen den Zeiger. Anstatt sich nüchtern mit dem Thema auseinanderzusetzen werden dann komische Behauptungen aufgestellt, da werde ich dann schon emotionaler.

Und wie gesagt:

Wie effizient und wie praktikabel das ist, darüber kann bis jetzt nur spekuliert werden.

Da wird einfach nicht differenziert. Was am Ende zählt ist das P/L-Verhältnis. Wenn der AMD Prozessor zu wenig Leistung liefert, dann wird eben ein Intel gekauft. Ich sehe da nicht das Problem.

Da bete ich nicht, da warte ich ab was passiert. Mich interessiert die Technik dahinter, das Unternehmen ist mir relativ egal. Nicht egal ist mir jedoch Intels Gebahren gegenüber Konkurrenten und damit meine ich nicht nur AMD sondern, das was seit Jahrzehnten hinter den Kulissen abläuft.

Aber das macht AMD nicht zum "besseren" Unternehmen. Ein Unternehmen ist... nun mal auf Profitmaximierung aus und daher lasse ich meine Antipathie gegenüber Intel auch nicht in Sympathie gegenüber AMD umschwenken. Das wäre, als würde man sich zwischen Teufel und Belzebub entscheiden.

Und jetzt kommt das finale Aber: Aber ich bin auch ein Mensch mit knapper Kasse und überlege erst einmal ob ich wirklich den neuesten Prozessor mit dem am besten ausgestatteten MB für 200 Euro brauche mit dem teuersten Speicher... oder doch eher die CPU für 150 Euro und das Board, bei dem ich dann später vllt noch die nächste Chip-Generation raufbasteln kann. Und das ist zumeist AMD.
 
Kommt mir vor wie: warum einfach wenn´s auch kompliziert geht?
Auf jeden Fall aber, ja, ich freue mich auch auf Bulli, oder ich freue mich alleine auf Bulli und du nicht wegen der Balance zwischen den Extremen die sachlich über deinen Entscheidungen schwebt oder wie auch immer.

Wenn du dir aber aktuell ein AM3+ Board zulegen möchtest, dann wäre ich vorsichtig. Es ist sehr naheliegend, dass sich AMD bereits mit Trinity wieder vom AM3+ zu Gunsten eines FM1 o.Ä. verabschiedet, zwecks Unterstüzung der OnDieGraphic.

In dieser Beziehung bin ich auch sehr auf den AM3-Board-Bulldozer-Bios-Upgrad-Fight Teil 3 gespannt, der noch mal richtig aufflammen sollte, sobald die CPU endlich verfügbar ist.
 
Ich weiß jetzt nicht was du mir mit dem ersten, sehr verschwurbelten Satz sagen wolltest
aber das ist ja nicht so schlimm.;)

Es ging mir um die Extreme: "Der Bulli, der wird alles platt machen, wie eine Planierraupe"...

und

"Bulldozer ist Bullshit. AMD ist und war und bleibt eine zweitklassige Firma und wird von Intel künstlich am Leben erhalten, damit man nicht vom Kartellamt zerschlagen wird."

Das Gelaber kann ich einfach nicht mehr hören. AMD ist mit ihren "HighEnd" Consumer-CPUs im Moment nicht auf der Höhe der Zeit, trotzdem gibt es Bereiche in der selbst ein mickriger X4 einem i3 überlegen ist, oder auch ein X6 einem i7. Das wird aber nicht anerkannt sondern als Anomalie abgetan.:rolleyes:


Zur Sockelproblematik: Ja, die Folie die FMx detailliert kenne ich schon, und dass Am3+ anscheinend (noch ist ja nichts sicher) so eine kurze Lebenszeit hat, ist natürlich nicht schön und wird sich auch dahingehend auswirken, dass ich mir keinen BD zulegen werde. Ich hätte mich für einen 2M/4 Kerner interessiert.

Stattdessen werde ich mir die nähere Llano-Zukunft (nächsten 6 Monate) anschauen bei ordentlichen Preisen ein System zusammenbauen und hoffen, das FM"x" und FM1 untereinander kompatibel sind und ich dann einen Trinity einsetzen könnte.
 
ExcaliburCasi schrieb:
Wieso?

Sollte man bei 4 gegen 4 Threads die Nase vorne haben, wird das doch bei weniger Threads nicht mehr schlechter !?
nein nein, ich meine in dem Test, in welchem sich Bulldozer mit 8 Threads / Kernen offensichtlich gut gegen den SB schlägt.

CineBench zum Beispiel wird vermutlich die 8 Kerne / 4 Module nahe der Maximalleistung ausreizen. Für die 8 Kerne bei hohem Takt fällt die Leistung dann wiederum zwar gut, aber eher unter meinem Erwarten aus. Bei Anwendungsfällen die auf voll 8 Kerne gehen sollte Bulldozer deutlich vorne liegen, imho sind seine 8 Threads viel mehr 8 realen, vollständigen Kernen gleichzusetzen als Intels SMT. Genau darin liegt ja sein Vorteil.


deadohiosky schrieb:
Ich glaube KM hat immer noch nicht die Vorteile der Modulbauweise verstanden.

Naja, das habe ich schon, die Frage ist wie gut die CPU bei weniger Threads (zB 4) ausgelastet wird. Arbeiten die zwei Kerne eines Moduls sozusagen zusammen einen Thread ab (natürlich tun sie das, da es Einheiten wie die FPU gibt die von den Kernen geteilt werden)?

Im schlechtesten Fall wäre die Leistung bei 4 Threads nur halb so groß wie bei 8 Threads (wenn zB nur die FPU benutzt wird).

Real wird sie irgendwo darüber liegen, wird sich zeigen müssen wie gut die Kerne / Module mit wenig Threads umgehen.

Auf dem Papier sieht die Modulbauweise super aus, vor allem im Server Umfeld wenn viele Threads parallel abgearbeitet werden müssen da hier bezogen auf die Fläche und Transitorenzahl mehr Performance zur Verfügung steht.
 
Zuletzt bearbeitet:
Nein, nein ich lag mit meiner Vermutung schon sehr richtig. Du hast das Konzept der "Modulbauweise" nicht verstanden.

AMD sagt aus: "nimmt man einen imaginären!!! normalen Bulldozer Dual Core mit jeweils vollen Ressourcen und vergleicht ihn mit der Modulbauweise, so bringt ein Kern eines Moduls mit geteilten Ressourcen ungefähr 90% Leistung (wie gesagt im Vergleich zu einem normalen Kern) und das gesamte Modul kann bis zu 190-195% der Leistung eines vollen Dual Cores erbringen".

Aber sobald nur ein Thread anstatt zwei bearbeitet werden müssen, steht einem (Integer) Kern die vollen Ressourcen zur Verfügung und er kann 100% der Leistung erbringen: logisch... ungeteilte Ressourcen, ungeteilte Leistung.

D.h. 1 Kern eines Moduls arbeitet einen Thread ab und ist dabei einem "normalen" (aber imaginären) BD Core ebenbürtig.

Jetzt kommt aber der Clue, für den zweiten Integerkern wird nur 12% mehr Fläche benötigt.

Also bei 112% Fläche bis zu 195% Leistung (bei zwei Threads) gegenüber einem BD Dual Core der 200% Fläche braucht und 200% Leistung erbringt.
 
@deadohiosky
Tja, dann wünsche ich dir mal viel Glück, dass du auf deinem zukünftigen FM1 Board deinen Trinity zum laufen bekommst. Im Gegenzug kannst du mir ja die Daumen dafür drücken, dass ich mein 880ger Board nicht ausbauen muss :-).

Auf AM3+ wechseln werde ich aber wohl nicht. Im schlimmsten Fall werde ich eher auf Trinity warten. Natürlich darf mich Intel nicht zwischenzeitlich mit einem unwiderstehlichem Angebot vom Weg abbringen. Bin echt mal auf die Folgen des Bulli Einschlags gespannt. So viel Bewegung gab es jedenfalls schon lange nicht mehr.
 
Welche Firma, welches Board genau?


Zu FM1:

Ich bin mir relativ sicher... auch Charlie von semiaccurate.com geht von einer Kompatibilität aus und er ist sehr gut informiert über die "Geschehnisse hinter den Kulissen":


I think Trinity is going to be socket compatible, the laptop looked like a production part (HP?), and that makes sense considering how new the socket is. AMD tends to change sockets on memory transitions, and both will use DDR3. If there is anything weird like a sideport, it would have been known when FM1 was designed.

-Charlie


http://semiaccurate.com/forums/showpost.php?p=122460&postcount=38


Wie gesagt: wenn du einen PC/ein neues System brauchst dann kauf dir das Produkt, dass die beste Leistung bringt. Ich warte zwar jetzt auch schon eine ganze Weile, aber das liegt einfach daran, dass ich ein System brauche dass ein wenig länger überlebt als nur 2, 3 Jahre. 5, 6 sind so meine Marke und es reicht vollkommen aus. Hier und da mal ein Upgrade und das wars.
 
Sehr oft ist es am effektivsten, nicht ewig zu warten und das zu kaufen was momentan erhältlich ist, aber halt nicht immer :-). Die Aussage von Charlie von semiaccurate.com etwa spricht sehr für den FM1, aber um so weniger für den AM3+.

Mein Board ist ein Asus M4A88TD-V EVO/USB3, also kein 890er Topboard, und deshalb (hoffentlich noch-)nicht in Asus´s Bios-Bulli-Kompatibilitäts-Updateliste gelistet.

Was ich davon ab bei AMD noch vermisse, ist eine im Chipsatzt manifestierte Funktion, die es Herstellern ermöglichst, Boards mit integriertem SSD Cash anzubieten, wie es eine kürzlich vorgestelltes Intelboard von Gigabyte vorführt. Ich habe zwar eine SSD, aber das ständige Anlaufen der HDD´s in meinem Sys, und deren relative schwachen Zugriffszeiten sind etwas, was ich mit solch einem Cash elegant ausgleichen könnte, ohne mir zu diesem Zweck gleich eine zweite SSD zuzulegen.
 
deadohiosky schrieb:
Nein, nein ich lag mit meiner Vermutung schon sehr richtig. Du hast das Konzept der "Modulbauweise" nicht verstanden.

AMD sagt aus: "nimmt man einen imaginären!!! normalen Bulldozer Dual Core mit jeweils vollen Ressourcen und vergleicht ihn mit der Modulbauweise, so bringt ein Kern eines Moduls mit geteilten Ressourcen ungefähr 90% Leistung (wie gesagt im Vergleich zu einem normalen Kern) und das gesamte Modul kann bis zu 190-195% der Leistung eines vollen Dual Cores erbringen".

Aber sobald nur ein Thread anstatt zwei bearbeitet werden müssen, steht einem (Integer) Kern die vollen Ressourcen zur Verfügung und er kann 100% der Leistung erbringen: logisch... ungeteilte Ressourcen, ungeteilte Leistung.

D.h. 1 Kern eines Moduls arbeitet einen Thread ab und ist dabei einem "normalen" (aber imaginären) BD Core ebenbürtig.

Jetzt kommt aber der Clue, für den zweiten Integerkern wird nur 12% mehr Fläche benötigt.

Also bei 112% Fläche bis zu 195% Leistung (bei zwei Threads) gegenüber einem BD Dual Core der 200% Fläche braucht und 200% Leistung erbringt.

und was soll ich daran jetzt nich verstanden haben? :freak:

Vollkommen klar, dass ein Thread 100% dieses imaginären "Kerns" ausschöpfen kann. Die Frage ist viel eher wie hoch diese 100% an Leistung sind.

Genau darum ging es mir ja.

Jetzt wirfst du 195% in den Raum, sofern das Modul voll ausgelastet wird, also bei 2 Threads.
Wie viel % erreicht dann ein Thread auf dem Modul? 100% ? Wäre etwas langsam oder?
Das würde bedeuten, dass CineBench beschränkt auf 4 Threads ungefähr die Hälfte leistet (100% zu 195%)?

195% klingt gut, aber dafür wäre dann das Ergebnis des Tests relativ ernüchternd (für einen praktisch quasi 8 Kern CPU).

Die Modulweise ist gut. Sie rückt wie du richtig erkannt hast die Effizienz / Transistoren in den Vordergrund indem man nicht wie bisher komplette Kerne redundant klont und vervielfacht, sondern je nach Bedarf werden nur Teil-Bereiche wie der Integer Kern vervielfacht. Gegenüber Cache, SI etc sind die Kerne heut recht klein, weshalb AMD das mit den 12% (die ich dir nun mal glaube) gelingt.

Grob gesagt rückt Intel mehr mit größeren, starken Kernen die pro Kern Leistung in den Vordergrund, während AMD mit Bulldozers Architektur mehr die Leistung bei vielen Threads fokussiert was durch die Modulbauweise 2 Int + 1 FPU sicher gut gelingt.

Schöne Server CPU also.

% Werte sind schön und gut, aber ohne die Leistung eines Moduls bei einem Thread zu kennen bringen diese Zahlen wenig.

Wenn wir im Test also 195% der Leistung eines imaginären Bulldozer Quads sehen würden wäre es eher ernüchternd.
 
Zuletzt bearbeitet:
deadohiosky schrieb:
so bringt ein Kern eines Moduls mit geteilten Ressourcen ungefähr 90% Leistung
...
das gesamte Modul kann bis zu 190-195% der Leistung eines vollen Dual Cores erbringen".
...
Also bei 112% Fläche bis zu 195% Leistung (

aber müsste man nicht 2x 90% erwarten und somit 180% ? ungefähr.
Das würde meinem Wissen eher entsprechen, denn soweit ich weiß ist die aussage auch mit 12,5% mehr Fläche, 80% mehr Leistung ...

Krautmaster schrieb:
Ah okay, du gehst also davon aus, das AMD besser skaliert, (weil CMT klar die bessere Technik ist) und deshalb könnte Bulli mit 8 Threads vorne liegen, und trotzdem mit 4 threads dahinterfallen, sprich bei 180% liegen Sie vor Intel 125% (SMT = +25% Theoretisch), aber bei 100% gegen 100% muss das nicht ebenfalls so sein oder sogar umgekehrt ...


möglich wär das sicherlich, alleine wenn man sich anschaut das AMD eben bei Multithreading 180% rausholt, die Frage ist halt tatsächlich wie weit man denn nun vor Intel liegt mit diesen 180%, möglicherweise macht AMD aber gerade bei 4 Threads alles mit 4,2ghz wett was sie verlieren würden ... wir sind gespannt ...
 
Ja, aufgrund der Technik gehe ich davon aus, dass CMT bezogen auf Threads mehr Power rauskitzelt / Fläche als Intel mit SMT.

Viel mehr als 25% holt Intel mit HT nicht raus.

Bei wenig Threads sehe ich aber Intel vorne, bzw AMD muss hier massiv auf Takt gehen. 4,2 Ghz stehen ja im raum bei 4 Threads.

An die 80% bzw 180 kann ich mich auch erinnern.
 
Du vergisst hierbei, dass damit rein nichts über die IPC ausgesagt wird.

Und leider habe ich auch einen Fehler gemacht:

Hier ist die Aussage von John Fruehe, falls es dich interessiert in Gänze (etwas kompliziert geschrieben und auf Englisch):

http://www.xtremesystems.org/forums...t-ISSCC-2011&p=4755711&viewfull=1#post4755711

Er sagt, dass ein Kern 100% Durchsatz (throughtput, Serversprache daher schwer auf den Desktop zu "übersetzen") bringt, wenn man einen zweiten Kern dazu nimmt sind es nominell nur 195%, rein aus mathematisch-physikalisch-philosophischen.... etc. Gründen (weil es eben immer kleinere Probleme und Fehler gibt, z.B. dass ein Thread nochmal abgearbeitet werden muss).

Wenn man einen Kern mit HTT "ausstattet" kann man je nach Anwendung 114 bis 122% höheren Durchsatz erreichen (bei 5% mehr Fläche), der Einfachheit halber sagt er das Plus beträgt durschnittlich 118%

Also: 1 Kern 100% + HTT= 118%


Die nächste Aussage bezieht sich wieder auf BD: Wenn man zwei Threads auf zwei Modulen ausführt, dann hat man 195% Durchsatz...also der gleiche Durchsatz den ich auf zwei normalen Kernen erreiche, da der erste (Integer)Kern des Moduls ja 100% der Ressourcen zur Verfügung hat.

Werden nun aber die 2 Threads auf einem Modul ausgeführt/berechnet "sinkt" der Durchsatz auf 180%!!!

Aber: der zweite (Integer) kostet nur 12% mehr Fläche im Modul

D.h.:

Im Vergleich:

1 Kern + HTT (+5% Die Fläche) = 112% Durchsatz
1 Modul (zweiter Kern, +12% Die-Fläche) = 180% Durchsatz



Und dazu:

Mythical 6-core bulldozer:
100% + 95% + 95% + 95% + 95% + 95% = 575%

Orochi die with 4 modules:
180% + 180% + 180% + 180% = 720%

Jeder weitere Kern in "normaler Bauweise" bringt 95% der Leistung des ersten Kerns

In Modulbauweise sind es 180% bei zwei Kernen, die sich die Ressourcen teilen.


Dadurch wird erreicht solange 8 Threads bearbeitet, dass bei 33% mehr Kernen (also von 6 auf 8 Kernen) 50% höher Durchsatz möglich ist, sehr unmathematisch ein "Reingewinn" von ca 25% (575x1.25= 718,75).


Aber wie gesagt, dabei wird immer noch nichts über die IPC ausgesagt. Dies muss dann durch die Optimierung der restlichen Architektur erreicht werden.
 
Fragt man sich, inwiefern die CPU selber, das BS oder bereits die Anwendung die Verteilung der Tasks über die Module und Cores steuert und ob es deshalb noch Raum für Optimierungen gibt. Die gleiche Frage richtet sich natürlich auch an die neuartige Flieskommaeinheit.
 
@Vidy_Z

Ich schätze mal die einzelnen Module werden sich beim OS als Core + virtueller Core (bzw. CMT Core) melden, genau wie es auch die Intel Cores (+HT) machen.
Windows schiebt die Threads die viel CPU Zeit benötigen dann bevorzugt den "echten" Cores zu.

Wenn ein Modul nur zur "Hälfte" ausgelastet ist (--> nur eine Integer Einheit wird belastet), dann steht die die Fließkommaeinheit mit voller Genauigkeit (256bit) zur Verfügung. Andernfalls wird die Fließkommaeinheiten "aufgeteilt" (je 128bit).
Die optimale Verteilung des Workload innerhalb des Moduls wird dann wohl jedes Modul selbst übernehmen
--> die Software hat da wenig bis garkeinen Einfluss drauf.

Dafür hab ich zwar keine Quelle, aber es klingt für mich so am logischsten. Falls ich komplett falsch liege, bitte korrigiert mich ;)
 
Zuletzt bearbeitet:
Es hört sich sogar sehr nachvollziehbar an, auch wenn ich mich verschwommen erinnere, dass Intel damals und kurz nach Vorstellung der HT Technik, Entwicklern gewisse Tipps und Unterstüzung angeboten hat, um Software im Sinne von HT optimaler zu gestalten.

Aber gut, es ist schon lange her, und damals war eben noch einiges anders, es ging damals auch eher darum, Software überhaupt in mehrere Threads zu teilen, und WindowXP selber war ebenfalls noch nicht auf HT optimiert, von daher bleibt für die Software in der heutigen Umgebung wohl kaum noch eine Entscheidung über die Threads übrig :-).

Wenn man davon ausgeht, dass die Fließkommaeinheit bei 256bit lediglich mit höherer Genauigkeit arbeitet und nicht etwa auch die Berechnungszeit bei einfacher Genauigkeit verkürzt, dann muss man dir sicher auch in diesem Punkt zustimmen. Aber das weis man halt (noch)nicht so genau.
 
Zuletzt bearbeitet:
So dann frag ich mal etwas, zum eigentlichen Tread titel, ich hab mir jetz alles durchgelesen...die letzten seiten dieses Treads sind ganz vom Speichertakt abgekommen.

Da ich da, schon immer so meine probleme hatte diese speichertakt sache zu verstehen,hier mal meine frag...
Ich hab mich gerade Bulli Rdy gemacht, sprich neues Board..990FxA Uda3 vorübergehend nen x4 955 phenom...drauf.
Speicher 1600mhz G.Skill 8gb...
Nunja, was soll ich sagen...Bulli 1866mhz, ich hab keine lust direkt wieder neuen speicher zu kaufen...noch ist meiner verpackt.
Soll ich ihn umtauschen und mir lieber 1866 holen, oder macht das den braten nicht wirklich fett, ob 1600mhz oder 1866 mhz..vieleicht kann mir mal jemand das schema dahinter erklären. Den ich denke wenn der Bulli kommt, und der 1866iger eine größere nachfrage hat, wird auch dieser teurer.
Aber mir gehts ehr um den nutzen faktor, ich muss bei sowas immer 100% sicher sein, so fehlkäufe, machen mich nervös. Sowas läst mir keine ruhe...hab keine lust 2x zu investieren...:)

Lg Jameson
 
Kannst ruhig bei 1600MHz Ram bleiben. Die 1866MHz bringen nur minimalst etwas. wenn dann schon dann beim Llano
 
Zurück
Oben