Bericht Bericht: AMD A8-4500M („Trinity“)

@derbene

das geht so lange gut bis man gegen die Wand fährt. 2-3,5 Ghz gehen heute fast ohne Spannungs+ bei sehr linearem Anstieg im Verbrauch. Bulldozer wäre super wenn man damit 6 Ghz fahren könnte so mal eben, die aktuellen Modelle zeigen aber, dass auch bei der auf taktoptimiertesten Architektur bei ~ 4 Ghz Schluss ist da die Spannung überproportional steigen muss.

Deswegen ist es zur Zeit wichtiger bei bei ~ 3 Ghz und einer perfekten Spannung / Takt die höchste Performance herauszukitzeln.

Kann natürlich sein, dass Trinity nun bei +0,1 V die 5 Ghz reißt. Ich bezweifle es aber. Vllt in GFs 28 oder 22 nm.
 
Zuletzt bearbeitet:
Krautmaster schrieb:
Und ja, die Pilediver Kerne enttäuschen, warum, weil sie weniger leisten als der Vorgänger.
Wenn man Trinity-A10 mit Llano-A8 vergleicht dann nicht. IPC ist nun mal nicht alles.

Natürlich hätte AMD Llano 2.0 bringen können, ein paar hundert MHz extra draufklatschen können. Dann wäre ein Llano 2.0-A10 wahrscheinlich erstmal(!) etwas schneller als Trinity-A10, aber es bliebe eine olle Architektur. Warte mal so 'n anderthalb Jahr und vergleich dann noch mal unter Windows 8 und mit dann aktueller Software. :evillol:
 
IPC ist nicht alles, aber schau dir mal den Post an.

https://www.computerbase.de/forum/threads/bericht-amd-a8-4500m-trinity.1061293/page-12#post-12043525

Für mich ist weniger interessant wie es AMD schafft mehr Takt bei gleichem Verbrauch herauszuholen, als das was heute auch mit Llano kein Problem wäre.

Im Notebook Segment wird AMD sicher Boden gut machen, auch zu Llano. Allein weil man den besagten straffen Turbo fährt. Bei GPU + CPU Last wird es deutlich enger zugehen.

Und im Desktop Umfeld. Hier sind von sehr hohen Taktraten seitens des A10 Modell die rede die auch nötig sind um sich mehr als 5% vor das beste Llano Modell zu schieben.

Llano steht aber erst richtig gut da, wenn man bedenkt, dass das A8-3850er Model bei jetziger Fertigung locker in die 65W TDP Klasse passen würde, keines wegs mehr 100W nötig sind. Vermutlich hat AMD das schon damals gewusst und die Llano TDP mit 100W auch wegen Trinity so hoch angesetzt.

Bulldozer hatte es schon trotz 45nm vs 32nm schwer mit dem X6 mitzuhalten, bei 32nm vs 32nm wirds noch schwerer. Und man wusste dass das mit Llano 32nm vs Trinity 32nm bevorstehen wird.

Da setzt man die Spannung von Llano einfach recht hoch an, genau wie die TDP. Zum einen war das sicher etwas nötig wegen der jungen Fertigung, zum anderen zeigt das enorme UV Potential (40%) was bei Selektion möglich gewesen wäre / heute möglich wäre.

Für mich ist die Modulbauweise bisher wenig Gewinn zur Stars / K10 Architektur. Die 32nm von Bulldozer haben das etwas kaschiert, bei Trinity wird es die hohe Stock TDP bei Desktop Llano kaschieren.

UV vs. UV Perf/W wird interessant ;)

Edit:

gut, unter Strich wird mit Trinity ohne zweifel das @ stock schnellere und effizientere Modell herauskommen, zwischen den Zeilen mag das anders aussehen.

Trinitys Stärke liegt eher im 17W Modell und in den idle Optimierungen.
 
Zuletzt bearbeitet:
@geodomus
Das lässt sich so aber nicht vergleichen da der a64 damals auch den intel ohne das 64 bit gedöns überlegen war, was hier nicht der Fall ist.
Bleibt nur die frage wie schnell die instructionen die Trinity von Lliano unterscheiden bei normalen Anwendungen unterstüzt werden und wie sie sich dort schlagen .


Ich sag es hier mal so das Trinity nicht schneller als Liano sein muss und intel wird amd sowiso nicht einholen.Somit braucht Trinity nur gleich gut wie Lliano sein was für den Laptop ausreichend ist muss , sollte dann aber wenigstens bei Wattverbrauch Punkten was im Laptopberreich in meinen Augen mehr Prioritäten hat.

Wie ist es eigentlich mit Windows 8 ?
Bringt das auch ausserhalb einer besseren core Verteilung für die FX 8xxx bei den kleinen 4 Kernern auch vorteile in hinsicht auf die Instructionen ?
 
Zuletzt bearbeitet:
ja sicher, auf allen ModulBasierten CPU.

Allerdings hat man auch hier die Qual der Wahl. Was nutzt man?:

Turbo oder CMT?

Damit der Turbo maximal zündet müssen 2 Threads auf ein Modul gelegt werden. Das bedeutet bei Integer Operationen ~ 80 % der Leistung - ohne Turbo wäre die Verteilung auf 2 Module besser.

Der Turbo macht aber (meistens) mehr als 20% Mehrleistung - also 1. Wahl.

Bei Floating wäre es genau umgekehrt, da 1 Modul nur 1x Float kann, sollte / muss auf 2 Module gesplittet werden sonst gibts massiven Perf. Verlust.

Jetzt stellt sich die Frage wie dass der OS Sheduler wissen soll, bekomme ich nun float oder integer lastige Threads... wie misch ich das Ganze...

Genau da kapituliert meiner Ansicht nach die Modulbauweise. Und ich verspreche mir da auch von Windows 8 nichts, der "Sheduler Patch" legt das ja schon nahe.

Was besser ausfallen sollte ist der idle Verbrauch durch Core-Parking.

Edit: Ich finde diesen Zwiespalt von zentraler Bedeutung. Die theoretische integer als auch floatig Leistung ist extrem gut bezogen auf die Transistoren Zahl & Fläche. Allerdings wurde das Shedler Problem, die Misch Last weniger berücksichtigt. In wie fern die Software und AMD damit über die nächsten Jahre umgeht wird sich zeigen.
 
Zuletzt bearbeitet:
Fischkopp schrieb:
Eigentlich ist Cinebench einer der Aussagekräftigsten Tests wenn es um die reine CPU Leistung geht, da sehr Praxisbezogen, besonders bei Single- und Multithread Anwendungen!
Den OpenGL Test kann man aber getrost vergessen, auch wenn viele den gern sehen wenn sie die schwache CPU vorn sehen wollen, denn da limitiert IMMER die GPU!

Nein, Cinebench ist nicht aussagekräftig. Maxon nutzt den Intel C++ Compiler, der AMD Prozessoren definitiv benachteiligt. Warum das so ist, kannst Du im Blog von Agner Fog nachlesen. Auch alle von Maxon genutzten Optimierungsprogramme stammen von Intel. Außerdem optimiert Maxon die Software gezielt für die aktuelle Prozessorgeneration von Intel. Dagegen ist ja nichts einzuwenden, aber eine objektive Vergleichbarkeit von Benchmarkergebnissen ist dadurch nicht mehr gegeben. Kurz: Cinebench ist für einen Vergleich zwischen Intel- und AMD- oder VIA-Prozessoren denkbar wenig geeignet.

Kleines Youtubevideo dazu:
http://tinyurl.com/cuqapb4
 
Ich bezog mich auf die einzelne Floatingeinheit die es gibt. Wie fähig diese ist ist da erstmal außen vor.

Zudem sind viele wichtige Bereiche eines Cores in einem Modul nur einfach abgebildet. Deswegen sind 2T auf 2C meist deutlich schneller.

Das ändert auch nichts am Zwiespalt bzw daran das man schwer definieren kann was nun die günstigste Belegung ist. Siehe zB die Tatsache, dass SingleThreads oft bei 4M/4T tw schneller sind als mit aktivem CMT.

Was wäre richtig? Threads einzeln auf Module oder Module direkt füllen?
 
Zuletzt bearbeitet:
Die Threads, die inhaltlich zusammen gehören, müssen auf ein Modul, da die Integer-Kerne über den L2 kommunizieren können. Dazu muss dem Betriebssystem aber gesagt werden, welche Threads untereinander kommunizieren müssen. Ich weiß nicht, ob das jemals erfolgen wird.

Die Grundprobleme sind einmal der zu schmale Instruktionsdekoder, dann die Tatsache, dass der FX nur noch 2 Integer-ALUs pro Takt abarbeiten kann trotz seiner 4 Pipelines und es gibt wohl ein Problem mit dem L1-Daten-Cache, mit dem längst nicht so viele Speicheroperationen durchgeführt werden können, wie theoretisch machbar sein sollte.

Der Scheduler hat meiner Meinung nach keinen großen Einfluss auf die Performance.
 
Zuletzt bearbeitet:
Krautmaster schrieb:
Toll.
Undervolte mal hunderte bis tausende Llanos und schau, wieviel du im Schnitt rausholen kannst und was die Standardabweichung ist.
Vorher können wir nur spekulieren. Und ich spekuliere da einfach, dass wir heute tatsächlich Llano 2.0 sehen würden, wenn AMD schon bei Llanos Erscheinen wirklich deutlich mehr hätte rausholen können. Dann hätten sie jetzt nämlich noch mal etwas mehr rausgeholt (was die verbesserte Fertigung halt hergibt) und dagegen hätte Trinity keine Chance. Das hätte der Rest der Welt dann aber nur vermuten können, weil es Trinity dann einfach nicht geben würde. Erst Kaveri hätte dann eine CPU auf Bulldozer-Basis.
 
Naja das ist in der Theorie ja alles schön und gut. Es gibt aber auch von derselben Anwendung 2 Threads die erstmal unabh. voneinander operieren und dann wieder zusammen etc... Irgendwann ist der Verwaltungsaufwand größer als der Nutzen.

Bisher scheint es nur bedingt zu funktionieren. Zumal der Turbo ja eine große Rolle spielt wenn mal eben 1 Ghz Takt dazukommen. (da macht es dann Sinn zwei eig. unabhängige Threads trotzdem zusammenzulegen...)

@Caanon

Bulldozer ist seit 2005 angekündtigt und hat wohl Unsummen in der Entwicklung verschlungen. Sollte mal 2009 kommen ;)

Vermutlich war Trinity schon früher geplant als Llano. Zumal Trinity bei Llano Start schon lauffähig war... und in fertigen Notebooks präsentiert wurde.

So einfach reißt man nicht den Hebel rum.
 
Zuletzt bearbeitet:
Hallo Forum, hallo cb-tester, schreiber/leser

danke an cb für diesen kostenlosen Trinity (-Test) ähm Bericht.

Ich bin zwar kein Fan von Bechnmark Ergebnissen, aber wie sonst soll man
einen Prozessor vergleichsweise einstufen oder bewerten können.

Wenn man sich also die Mühe macht, soviele Notebook(Prozessoren) miteinander zu
vergleichen, wäre es dann auch mal möglich ein etwas älteres Modell mit einzubeziehen.

Natürlich setzt AMD die neuesten Prozessoren gegen die neueren Intel CPUs.
(es ist schon klar, dass diese dann Priorität haben)
Aber vielleicht haben manche Leser eine ältere CPU u. würden gerade deshalb gerne erfahren wollen, um wieviel man sich bei einem CPU/Laptop-Neukauf besser stellen würde.
Ich z.B. habe eine Mobile Turion Neo K685 mit Chipsatz - Grafik (ein garnicht mal so
uralter Prozzi) aber leider taucht dieser vergleichsweise z.B. nie auf, so dass ich nie
weiss, ob ich mit einem Neukauf die Benchmark Schallmauer durchbrechen könnte oder eher auf andere Dinge wie Akkulaufzeit, Verarbeitung, Ausstattung achten müßte, dass
ein Neukauf begründet sein könnte.

Auch vermisse ich ein bisschen die Praxisnähe in den Tests. (Nicht jeder spielt BF3 und nach Cinebench mußte ich erst googeln). Ein kleiner Test mit Linuxumgebung würde m.e. auch nicht schaden (aber ok, das liefert meist phoronix)

Dass soll keine echte Kritik sein, eure Tests müssen unendlich anstrengend, langwierig und schwierig sein, sondern eher eine Anregung für Ideen noch mehr Interessen der Leser zu erwecken.

Dass AMD z.Z. nicht an die Intel Benchmarks heranreicht, ist hinlänglich übers ganze Netz bereits geschrieben worden.
 
Zuletzt bearbeitet:
Macht Ihr das Fazit immer vor dem "richtigen" Test ?

Besonders sinnvoll ist es, dass Gerät mit nur einem Speicherkanal zu vermessen. Die Intelteile haben sicherlich beide Speicherkanäle belegt.
 
Er kann das ja ruhig mit einem Riegel testen, wenn das Notebook so geliefert wird und er der Meinung ist, da so machen zu müssen. Den schwerwiegenden Fehler hat er gemacht, als er die Messwerte dann in die übrigen Testergebnisse eingereiht und somit jegliche Vergleichsgrundlage entzogen hat. Die Vergleichsgrafiken sind daher schlicht und ergreifend falsch. Solche Windeier würde beispielsweise die ct nie nie niemals machen und das ist das, was mich wirklich ärgert!
 
Zuletzt bearbeitet:
naja aber ich finde das Fazit trifft es doch wirklich wenn auch leider.

OEM-Partner werden zudem in den günstigen Notebooks – und exakt dort sind die „Trinity“ bisher angekündigt – Speicherkonstellationen verbauen, die unvorteilhaft sind, sei es mit zu geringem Takt oder die Nutzung von nur einer Speicherbank. Dies war bereits beim Vorgänger mehr die Regel denn die Ausnahme und wird auch heute noch plattformübergreifend so gehandhabt, wie unser Preisvergleich bei Notebooks bis 1.000 Euro zeigt, bei dem vier von fünf Modellen lediglich einen Speicherriegel nutzen. Letztlich zeigt unser Testmodell also genau das, was man auch im Handel bekommt – keine idealisierte Testplattform mit schnellster CPU, SSD und schnellem Speicher, sondern eben nur das zweitbeste CPU-Modell mit einer HDD und typischem Notebook-RAM. Mehr sollte man in Anbetracht dessen vielleicht gar nicht erwarten.

In den kommenden Wochen werden wir uns – aufgrund des Starts seitens AMD in mehreren Wellen – noch einige Notebooks sowie die Desktop-Vertreter von „Trinity“ ansehen, um ein endgültiges Fazit zu „Trinity“ ziehen zu können. Am Ende dürfte sich am bisherigen, vorläufigen Fazit jedoch kaum etwas ändern: Während die Grafikleistung überzeugt, ist der Prozessor leistungsschwach.

leider könnte man meinen viele hätten beim ersten Satz aufgehört zu lesen oder das Gehirn abgeschaltet.

Allerdings hätte der Titel dann mehr auf "Ausblick" getrimmt werden müssen.
 
Krautmaster schrieb:
Vermutlich hat AMD das schon damals gewusst und die Llano TDP mit 100W auch wegen Trinity so hoch angesetzt.

Da setzt man die Spannung von Llano einfach recht hoch an, genau wie die TDP. Zum einen war das sicher etwas nötig wegen der jungen Fertigung, zum anderen zeigt das enorme UV Potential (40%) was bei Selektion möglich gewesen wäre / heute möglich wäre.

Das mit der hohen Vcore macht AMD bei jeder Generation. Mein Uralt Brisbane (65nm) Normal: 2,3GHz@1,35V läuft ohne Probleme bei 2,3 GHz@1V bzw. 1,5 GHz@0,83V.

Bei Llano ist die Fertigung schuld an der hohen TDP/Vcore, bei Marktstart lag die Yield-Rate bei 25%. Das ist grottenschlecht, da mußte man soviel wie möglich verwerten, sprich Vcore nach oben setzten. Das letzte an was die Jungs dabei gedacht haben ist Trinity. Beim Trinity wird die Vcore auch wieder zu hoch angesetzt sein. Zumal der 32nm Prozess immer noch nicht optimal läuft. Da heißt es nur warten, warten und hoffen auf bessere Zeiten.
 
Krautmaster schrieb:
So einfach reißt man nicht den Hebel rum.
Vor Trinitys Tape Out wäre am Hebel bestimmt kein reißen nötig gewesen, AMD hätte es über Bulldozer- und Llano-Engineering Samples aber sicherlich schon gut einschätzen können, ob 2012 ein Llano 2.0 eigentlich wesentlich besser wäre als Trinity.
Vor Bulldozers Tape Out gab es jedenfalls kein Tape Out einer CPU auf Bulldozer-Basis, da war nix mit gut einschätzen, sonst hätten sie ja vielleicht selbst da stattdessen was mit 8 Husky-Kernen gebracht. :evillol:
 
Krautmaster schrieb:
Für mich ist weniger interessant wie es AMD schafft mehr Takt bei gleichem Verbrauch herauszuholen, als das was heute auch mit Llano kein Problem wäre.
Nur mal als kleiner Einwand:

Du vergleichst jetzt ncht ernsthaft einen bis ans Limit undervolteten Llano mit einem normal validierten Trinity, der später kostengünstig auf den Markt kommen soll?
AMD hat die Namensgebung verändert, der A10 ist jetzt das Topmodell, der jetzige A8 ist eher eine schlichte weiterführung des vorherigen A8.

Deswegen sind 2T auf 2C meist deutlich schneller.

Naja, wenn man das ganze wieder pro Modul aufteilt, hat man eigentlich den ganzen Sinn des Designs über Board geworfen.
Man wollte ja usprünglich damit Strom sparen und ich denke es ist auch sinvoller ein Modul komplett abzuschalten und die restliche Performance über den Turbo zu holen.

Krautmaster schrieb:
Genau da kapituliert meiner Ansicht nach die Modulbauweise. Und ich verspreche mir da auch von Windows 8 nichts, der "Sheduler Patch" legt das ja schon nahe.

Hm soviel ich weiß, wird Windows 8 etwas anders die Threads verteilen als der Sheduler Patch das bei Windows 7 macht.

Wobei der Sheduler sowieso nicht viel Einfluss auf die entgültige Performance hat, denn wie DinciVinci schon sagte liegt es aktuell zumindest etwas an den von ihm genannten Punkten.

Wenn das Design nicht mechanisch erstellt worden wäre (bei Intel ist das durch mehr Manpower möglich), wäre AMD sowieso sehr knapp an Intel drann.

Krautmaster schrieb:
naja aber ich finde das Fazit trifft es doch wirklich wenn auch leider.

Ich kapiere halt nicht, warum man vor dem Test in der Einleitung schon alles wissenswerte schreibt, nämlich dass der Test sehr mau ausfallen wird und dass AMD angeblich die Erwartungen nicht eingehalten hat, was eigentlich gar nicht stimmt.

Hinzu kommen die Leser verwirrenden Performancevergleiche bei gleichem Takt und die falschen Messwerte der Cinebench Performance.
Ich kann keine Enttäuschung sehen, es ist eine kleine aber feine Weiterentwicklung und man schließt etwas näher auf Intel- was die CPU Performance angeht auf.
 
Wintel schrieb:
Nur mal als kleiner Einwand:

Du vergleichst jetzt ncht ernsthaft einen bis ans Limit undervolteten Llano mit einem normal validierten Trinity, der später kostengünstig auf den Markt kommen soll?
AMD hat die Namensgebung verändert, der A10 ist jetzt das Topmodell, der jetzige A8 ist eher eine schlichte weiterführung des vorherigen A8.

keineswegs, das wäre ja bescheuert ^^

Es geht wie öfter besagt um Llanos UV Potential und dass ich bezweifle, dass ein Trinity hier mithalten kann...

Also UV Llano vs UV Trinity bei Performance / W.

Man wollte ja usprünglich damit Strom sparen und ich denke es ist auch sinvoller ein Modul komplett abzuschalten und die restliche Performance über den Turbo zu holen.

sofern man einen hohen Turbo hat Mittel der Wahl. Jetzt ist aber gleichzeitig die GPU am Anschlag... was macht man nun? Es steht kaum Turbo zur Verfügung...

Es hängt an sehr vielen Faktoren und Microsoft ist wohl selber auch etwas überfordert... sah man ja gut an dem Windows 7 Patch .

Hm soviel ich weiß, wird Windows 8 etwas anders die Threads verteilen als der Sheduler Patch das bei Windows 7 macht.

ein einfacher Test sollte das klären. Die Customer Preview ist ja frei verfügbar. Vllt gibts ja schon ausreichend Berichte. Ich nehme an die wären mir bekannt wenn ein FX6XXX nun 10% Mehrleistung hat auf Windows 8.

Wenn das Design nicht mechanisch erstellt worden wäre (bei Intel ist das durch mehr Manpower möglich), wäre AMD sowieso sehr knapp an Intel drann.

jop das wurde ja auch von dem EX AMD Mitarbeiter bemängelt. Aber wie gesagt, selbst für eine CPU ist Bulldozer extrem lang komplett neu aufgerollt worden, dabei ist Llano das wunderbare Beispiel wie effizient die bisherige Architektur sein kann, auf 32nm steht die eigentlich ganz gut da, Fertigung vorausgesetzt.

Ich kapiere halt nicht,...

Wenn ich ehrlich bin schau ich bei dieser Art von Tests fast ausschließlich auf Werte und bilde mir meine Meinung indem ich eigenes Wissen einbringe. Natürlich bezieht sich das auch auf die Limitierung.

Hinzu kommen die Leser verwirrenden Performancevergleiche bei gleichem Takt und die falschen Messwerte der Cinebench Performance.

seht die Vergleiche mal weniger als Vergleiche sondern als reine Werte und bildet eigene Vergleiche. Die Werte werden CB typisch schon korrekt ermittelt sein. Maybe setze der Turbo zu schwach ein... weil die GPU nicht in den richtigen Energiesparmodus wechselte, was auch immer. Wunder erwarte ich keine. Ohne L3 wird man gerade so Bulldozerniveau / Modul erreichen was schon gut ist.

Ich kann keine Enttäuschung sehen, es ist eine kleine aber feine Weiterentwicklung und man schließt etwas näher auf Intel- was die CPU Performance angeht auf.

Ich finde den Schritt weiter zu mehr GPU Leistung um sich zu Differenzieren als auch dem APU Konzept an sich einen Schritt in die richtige Richtung ja. Ob diese ModulSache dabei allerdings tw nicht mehr im Weg steht als nutzt ... da bin ich mir oft nicht so sicher.

Der Test des Desktop Trinitys wird auch zeigen wo der Weg beim Bulldozer Follower hinführt.
 
Zurück
Oben