News AMDs „Trinity“-CPU kommt mit VLIW4-GPU

Bei Llano ist die integrierte GPU ja zusätzlich nutzbar. Langfristig soll diese aber auch Rechenoperationen von normaler Software übernehmen die mit OpenCL programmiert ist. Im Prinzip passiert jetzt das selbe wie mit den FPUs vor einigen Jahren. 1992 wurden diese ja auch noch als Zusatzchip auf dem Mainboard untergebracht, ebenso wie Level 2 Cache. Heute würde keiner mehr auf die Idee kommen eine CPU ohne diese integrierten Komponenten zu bauen.
 
@calluna

Da ich keinen live feed von diesem Thread habe und der edit nach 5 Min kam, konnte ich nichts anderes machen als auf den Fehler hinzuweisen. Außerdem habe ich noch nach der Folie gesucht, daher wurde der Beitrag verspätet von mir abgesendet. Kein Grund sich zu echauffieren.
 
@HOT
Auch in diesem Bereich hat AMD einen Schritt nach vorne gemacht und ermöglicht es die Grafikchips gleicher/kompatibler Generationen zu verbinden (aktuell 5000er und 6000er).
Momentan gilt das natürlich nur für die Verbindung von der Grafikeinheit einer APU mit der GPU einer Grafikkarte, wobei ich hoffe das sie das auch für normale Grafikkarten ermöglichen.

Dual-Graphics ist hier das Schlagwort:
Jedenfalls setzt Dual Graphics nicht voraus, dass man wie bei klassischem CrossFire zwei identische GPUs kombiniert, und die Performance wird auch nicht vom kleinsten gemeinsamen Nenner bestimmt. Stattdessen wird die Arbeitslast auf die verfügbare Grafikhardware aufgeteilt. Ist die zusätzliche GPU beispielsweise doppelt so schnell wie die integrierte Lösung, holt sich der Treiber immer abwechselnd zwei Frames von der dedizierten Grafiklösung und einen Frame von der APU.

Quelle: Tom's Hardware
Wie du aus dem verlinkten Artikel entnehmen kannst ist das ganze zwar noch nicht ausgereift aber zeigt auf in welche Richtung das sich in Zukunft entwickeln wird.

Über die Vorteile im bezüglich des geringeren Energiebedarfs bei abgeschalteter dedizierter Grafikkarte brauchen wir wohl hoffentlich nicht mehr zu diskutieren ;)
 
Zuletzt bearbeitet:
@Complication

Aber das Ding ist ja, eine FPU oder Level2-Cache hat man sich früher nicht extra dazugekauft. Das waren einfach fertige Chips, die separat auf dem Mainboard lagen. Man konnte sich nicht abhängig von der Leistung, die man braucht, extra was kaufen. Im Gegensatz dazu decken Grafikkarten alle Segmente von lahm bis profi ab und man sucht sich, was man braucht.

Wenn jetzt die GPU in die CPU integriert wird, fällt zunächst erstmal sofort auf, dass die iGPU ums 1000fache kleiner ist, als ein 30cm langes dediziertes Grafikbrett. Dass da niemals die gleiche Leistung bei rausspringen kann, sollte offensichtlich erscheinen.

Nun ist das aber mit den APUs zum Trend geworden und als User kommt man nicht drumherum, sich doch noch eine dedizierte Grafikkarte zu kaufen. Man gibt also 2x Geld für Grafikeinheiten aus.

Es sei denn, die Rechnung geht folgendermaßen (lapidar):
iGPUs sind noch relativ langsam, sprich, sie ersetzen Low-End-Grafikkarten. Hier wäre Geld wieder gespart. Wer zocken will, braucht dann aber vielleicht auch keine High-End-Karte mehr: eine aus dem mittleren Segment reicht nun, weil deren Leistung + die iGPU sozusagen ein High-End darstellt. Im Umkehrschluss würde das dann heißen, es wird keine extra Low-End und High-End-Karten mehr geben. Und wenn die iGPUs irgendwann mal richtig fix werden, gibt's gar keine Grafikkarten mehr.

Naja ich bin ja mal gespannt, wie sich das entwickelt...
 
Zuletzt bearbeitet:
Also an den 50 Prozent, die AMD da angibt, würde ich mich nicht festhalten. Denn zufällig hat AMD den Punkt für diese 50 Prozent Zuwachs mal kurzerhand um 100 GFlops abgesenkt. Man geht da nämlich nur noch von 400(+) für Llano aus: http://www.planet3dnow.de/photoplog/index.php?n=15211

Gestern zum Llano-Start hieß es für eben jene Modelle immer noch 500 GFlops (sh. Anhang). Aber 50 Prozent von 400 GFlops mehr wären halt nur 20 Prozent von 500 GFlops um zum gleichen Ziel von 600 zu gelangen - das klingt ja mal direkt mau und kann man so nicht schreiben. Es kommt eben immer das zum Vorschein, was sich besser vermarkten lässt. Als Außenstehender muss man deshalb gut aufpassen und sich auch nicht von kleinen (+) irritieren lassen.
 

Anhänge

  • Llano.jpg
    Llano.jpg
    166,4 KB · Aufrufe: 614
  • Llano 2.jpg
    Llano 2.jpg
    168,8 KB · Aufrufe: 597
Zuletzt bearbeitet:
Volker schrieb:
Aber 50 Prozent von 400 GFlops mehr wären halt nur 20 Prozent von 500 GFlops - das klingt ja mal direkt mau und kann man so nicht schreiben.
Sorry - aber das ist nicht mit dem Taschenrechner gerechnet, oder? :evillol:

400 GFLOPS-> 50% = 200
500 GFLOPS-> 20% = 100
 
@ Complication

Es ist schon richtig so. :p

@ HardRockDude

Stimmt, die Modularität hat schon gewisse Vorteile... man kann die Leistung in bestimmten Bereichen besser seinen Bedürfnissen anpassen / bzw. die Leistung in einem bestimmten Bereich gezielt erweitern.

Langfristig finde ich da auch Intels Ansatz mit (dem vorerst gescheiterten) Larrabee interessant.
 
Zuletzt bearbeitet:
HardRockDude schrieb:
@Complication

Aber das Ding ist ja, eine FPU oder Level2-Cache hat man sich früher nicht extra dazugekauft.
Natürlich hat man das.
http://www.heise.de/newsticker/meldung/Coprozessor-Karten-Preise-sinken-Angebot-waechst-136014.html
http://lowendmac.com/ppc/g3-l2.shtml
Ergänzung ()

Volker schrieb:
Gestern zum Llano-Start hieß es für eben jene Modelle immer noch 500 GFlops (sh. Anhang). Aber 50 Prozent von 400 GFlops mehr wären halt nur 20 Prozent von 500 GFlops um zum gleichen Ziel von 600 zu gelangen - das klingt ja mal direkt mau und kann man so nicht schreiben.
Anstatt dich zu korrigieren machst du immer merkwürdigere Behauptungen - wo hat AMD 600 GFLOPS als Ziel genannt?
So wie du kann man das also schreiben?
 
Zuletzt bearbeitet:
Complication schrieb:
Natürlich hat man das. [...]

Hm, aber ist das nicht für industrielle Nutzung? Daheim braucht doch niemand mehr z.B. einen extra mathematischen Coprozessor (oder etwa doch?). Jedenfalls interessant. Dann wird es irgendwann wohl wirklich so kommen mit den Grafikkarten. Geben wir den APUs ein bißchen Zeit, bis sie ihre Grafikleistung so sehr gesteigert haben, dass sie dedizierte Grafikkarten überflüssig machen.
 
Zuletzt bearbeitet:
@deadohiosky
Falsch verstanden, das kombinieren einer 6990 mit einer 6970 ist nichts neues, das ist lediglich Triple CF (3x gleiche GPU, wenn auch nur auf 2 Karten), ist schon seit der 3870X2 möglich. Ich meine eher das zusammen schalten von zwei verschiedenen GPUs die im Crossfire normalerweise nicht kombiniert werden können (ausgenommen mit dem Hydra Chip von Lucid Logic).

Hier siehst du die verschiedenen Kombinationen die bisher möglich sind und was dann deren Ergebnis ist!
Dual%20Graphics%20Models%20-%20Notebook.jpg


Der schwächere Chip bekommt nur soviel Arbeit zugewiesen wie er bewältigen kann und der stärkere Chip übernimmt den Rest. Das aktuelle Limit ist das die stärkere Chip max. die doppelte Leistung des schwachen Chips erbringen kann und das es nur mit einer APU + dedizierte Grafikkarte geht.
 
Zuletzt bearbeitet:
Wusa....... 50% sind nicht schlächt. Aber abwarten bis wir wirklich was für die Augen haben. Aber eine HD6900 Reihe drauf hauen ist ja schonmal nicht schlächt. Wenn die dann noch Power hat, dann könnte ein Notebook wirklich Dampf unter der Haube bekommen. Und wenn dann noch die CPU Power stimmt könnte das ganz schön interessant werden. Mal sehen, was die Zukunft bringt :D

Edit: AMD sollte mal anfangen eigene Notebooks zu bauen ;O

_____________________________
Mein Rechenknecht :
Prozessor: AMD Phenom II x6 1090T
Mainboard: ASUS M4A87TD Evo
Arbeitsspeicher: G. Skill Ripjarws CL7 1333 4GB
Netzteil: CoolerMaster Silent M600
CPU Kühler: Mugen 2
Graka: Gainward GTX 570 Phantom
 
Zuletzt bearbeitet von einem Moderator:
Solange das AFR benutzt ist das Mist, ganz egal, was das AMD-Marketing das verspricht. Natürlich kann man verschiedene GPUs und auch IGPs zusammen in AFR laufen lassen, da aber immer ein Frame abwechselnd gerechnet wird, gibts a.) µRuckler (weil sich extrem schlecht timen lässt, wann der Frame wirklich fertig wird) und b.) genau 2x die Geschwindigkeit des langsameren Chips. Es ist möglich AFR mit einem 2x so schnellen Chip zu machen (2 Frames vom schnellen und 1Frame vom langsamen) usw. Aber es muss dringend eine bessere Technik her, um sowas handhabbar zu machen.
 
Zuletzt bearbeitet:
Volker schrieb:
Gestern zum Llano-Start hieß es für eben jene Modelle immer noch 500 GFlops (sh. Anhang). Aber 50 Prozent von 400 GFlops mehr wären halt nur 20 Prozent von 500 GFlops um zum gleichen Ziel von 600 zu gelangen - das klingt ja mal direkt mau und kann man so nicht schreiben.

Alle 3 Folien sagen doch das Gleiche aus. Auf der einen steht "400+ GFLOPs" auf den anderen "bis zu 500 GFLOPs". Da sind also nirgendwo mal eben 100 GFLOPs verschwunden.
 
500- hätte zudem irgendwie doof ausgesehen ;)

Bei den iGPUs wird wohl auf absehbare Zeit die Speicheranbindung ein Problem sein. Für OpenCL aber recht unwichtig, wobei ich behaupte, dass wenn man die GPU auf OpenCL trimmen würde und weniger auf Gaming Leistung käme weit mehr dabei raus. Zudem sind die alten 5D Shader auch besser was das angeht als die neuen 4D Shader bezochen auf Leistungaufnahme / Leistung in Open CL (HD5870 vs HD6970).
 
Zuletzt bearbeitet:
Die Speicheranbindung der APU Grafik ist jetzt schon bis zu 50 GB/s fähig.
Da wird es keinen Flaschenhals geben auf absehbare Zeit:
http://www.anandtech.com/Show/Index...-notebook-review-a-series-fusion-apu-a8-3500m
AMD shared a few choice details about the Llano memory controller architecture. To begin, AMD guarantees more than 30GB/s of bandwidth is available between the GPU and the memory controller—in other words, the path from GPU to the memory controller won't become a bottleneck. The GPU/memory controller link (i.e. within the APU die) can apparently scale up to as much as 50GB/s to support future APUs with even faster memory interfaces. Note that unlike previous integrated graphics solutions, there is no support for dedicated external memory—this is a pure shared memory architecture.
Die Bandbreite ist eine Frage des Stromverbrauchs.
 
zwischen GPU und Memory Controller... und zum eigentlichen RAM?

Lustig, dass AMD noch "GPU" und "CPU Cores" in den Mund nimmt während einige hier einen verteufeln wenn man nur ansatzweise bei der APU von CPU + GPU redet ;)

Edit:

https://pics.computerbase.de/3/4/9/8/5/21-1080.1030328699.png

das Bild spricht zumindest von 29,8 GB/s. Intern zwischen Controller und GPU von < 29,8GB/s. Kann man die Speicherbandbreite der GPU messen? Gibts da Tools?

~30GB/s entsprechen recht genau den Daten einer HD5570, sollte also passen.
 
Zuletzt bearbeitet:
Hinzu kommt der gravierende Unterschied, dass die APU Architektur weitaus weniger Daten über den Bus verschieben muss als eine dedizierte Grafiklösung oder eine iGPU. Dafür sorgt der gemeinsame Speicherzugriff von CPU und GPU und die neuartige High-Speed-Block-Transfer-Engines:
http://de.wikipedia.org/wiki/AMD_Fusion
Obwohl die skalaren x86er-Kerne und SIMD-Engines der APUs einen gemeinsamen Pfad zum Systemspeicher teilen, soll die erste Generation der AMD APUs den Speicher noch in verschiedene Speicherregionen teilen. Zum einen in einen Speicherbereich, der vom Betriebssystem verwaltet wird, welches auf den x86er-Kernen läuft, zum anderen in Speicherregionen, die von der Software verwaltet werden, welche auf den SIMD-Engines ausgeführt wird. Für den Datentransfer zwischen den beiden Speicherregionen hat AMD High-Speed-Block-Transfer-Engines eingerichtet. Im Gegensatz zu Datentransfers zwischen externen Framebuffern und dem Systemspeicher sollen diese Transfers nie den externen Systembus belegen.
http://sites.amd.com/de/Documents/48423B_fusion_whitepaper_WEB.pdf

Ob nun GPU oder SIMD Engines, CPU Kerne oder x86 Kerne - wichtig ist dass klar wird dass eine onboard/onchip GPU nicht das selbe ist wie die APU-GPU.
 
x-polo schrieb:
Auf Folie die Volker verlinkt hat steht "Excellent Memory Bandwith",könnte das so was wie Sideport Speicheranbindung (mit GDDR-5 RAM) werden ?
Nein - da würde ja der ganze Vorteil wieder dahin gehen. Sideportspeicher kann dann wiederum nur von der GPU genutzt werden und es erfolgt kein gemeinsamer Zugriff auf Adressbereiche.
Das würde nicht mehr funktionieren:
für den Datentransfer zwischen den beiden Speicherregionen hat AMD High-Speed-Block-Transfer-Engines eingerichtet. Im Gegensatz zu Datentransfers zwischen externen Framebuffern und dem Systemspeicher sollen diese Transfers nie den externen Systembus belegen.
 
Zurück
Oben