News AMDs „Trinity“-CPU kommt mit VLIW4-GPU

Complication · 15. Juni 2011

Bei Llano ist die integrierte GPU ja zusätzlich nutzbar. Langfristig soll diese aber auch Rechenoperationen von normaler Software übernehmen die mit OpenCL programmiert ist. Im Prinzip passiert jetzt das selbe wie mit den FPUs vor einigen Jahren. 1992 wurden diese ja auch noch als Zusatzchip auf dem Mainboard untergebracht, ebenso wie Level 2 Cache. Heute würde keiner mehr auf die Idee kommen eine CPU ohne diese integrierten Komponenten zu bauen.

deadohiosky · 15. Juni 2011

@calluna

Da ich keinen live feed von diesem Thread habe und der edit nach 5 Min kam, konnte ich nichts anderes machen als auf den Fehler hinzuweisen. Außerdem habe ich noch nach der Folie gesucht, daher wurde der Beitrag verspätet von mir abgesendet. Kein Grund sich zu echauffieren.

Techniker Freak · 15. Juni 2011

@HOT
Auch in diesem Bereich hat AMD einen Schritt nach vorne gemacht und ermöglicht es die Grafikchips gleicher/kompatibler Generationen zu verbinden (aktuell 5000er und 6000er).
Momentan gilt das natürlich nur für die Verbindung von der Grafikeinheit einer APU mit der GPU einer Grafikkarte, wobei ich hoffe das sie das auch für normale Grafikkarten ermöglichen.

Dual-Graphics ist hier das Schlagwort:

Jedenfalls setzt Dual Graphics nicht voraus, dass man wie bei klassischem CrossFire zwei identische GPUs kombiniert, und die Performance wird auch nicht vom kleinsten gemeinsamen Nenner bestimmt. Stattdessen wird die Arbeitslast auf die verfügbare Grafikhardware aufgeteilt. Ist die zusätzliche GPU beispielsweise doppelt so schnell wie die integrierte Lösung, holt sich der Treiber immer abwechselnd zwei Frames von der dedizierten Grafiklösung und einen Frame von der APU.

Quelle: Tom's Hardware

Wie du aus dem verlinkten Artikel entnehmen kannst ist das ganze zwar noch nicht ausgereift aber zeigt auf in welche Richtung das sich in Zukunft entwickeln wird.

Über die Vorteile im bezüglich des geringeren Energiebedarfs bei abgeschalteter dedizierter Grafikkarte brauchen wir wohl hoffentlich nicht mehr zu diskutieren

deadohiosky · 15. Juni 2011

@Techniker Freak

Ist schon längst Realität, oder habe ich dich da jetzt falsch verstanden?

http://www.hardocp.com/article/2011/04/11/amd_radeon_69906970_crossfirex_trifire_review/

HardRockDude · 15. Juni 2011

@Complication

Aber das Ding ist ja, eine FPU oder Level2-Cache hat man sich früher nicht extra dazugekauft. Das waren einfach fertige Chips, die separat auf dem Mainboard lagen. Man konnte sich nicht abhängig von der Leistung, die man braucht, extra was kaufen. Im Gegensatz dazu decken Grafikkarten alle Segmente von lahm bis profi ab und man sucht sich, was man braucht.

Wenn jetzt die GPU in die CPU integriert wird, fällt zunächst erstmal sofort auf, dass die iGPU ums 1000fache kleiner ist, als ein 30cm langes dediziertes Grafikbrett. Dass da niemals die gleiche Leistung bei rausspringen kann, sollte offensichtlich erscheinen.

Nun ist das aber mit den APUs zum Trend geworden und als User kommt man nicht drumherum, sich doch noch eine dedizierte Grafikkarte zu kaufen. Man gibt also 2x Geld für Grafikeinheiten aus.

Es sei denn, die Rechnung geht folgendermaßen (lapidar):
iGPUs sind noch relativ langsam, sprich, sie ersetzen Low-End-Grafikkarten. Hier wäre Geld wieder gespart. Wer zocken will, braucht dann aber vielleicht auch keine High-End-Karte mehr: eine aus dem mittleren Segment reicht nun, weil deren Leistung + die iGPU sozusagen ein High-End darstellt. Im Umkehrschluss würde das dann heißen, es wird keine extra Low-End und High-End-Karten mehr geben. Und wenn die iGPUs irgendwann mal richtig fix werden, gibt's gar keine Grafikkarten mehr.

Naja ich bin ja mal gespannt, wie sich das entwickelt...

Volker · 15. Juni 2011

Also an den 50 Prozent, die AMD da angibt, würde ich mich nicht festhalten. Denn zufällig hat AMD den Punkt für diese 50 Prozent Zuwachs mal kurzerhand um 100 GFlops abgesenkt. Man geht da nämlich nur noch von 400(+) für Llano aus: http://www.planet3dnow.de/photoplog/index.php?n=15211

Gestern zum Llano-Start hieß es für eben jene Modelle immer noch 500 GFlops (sh. Anhang). Aber 50 Prozent von 400 GFlops mehr wären halt nur 20 Prozent von 500 GFlops um zum gleichen Ziel von 600 zu gelangen - das klingt ja mal direkt mau und kann man so nicht schreiben. Es kommt eben immer das zum Vorschein, was sich besser vermarkten lässt. Als Außenstehender muss man deshalb gut aufpassen und sich auch nicht von kleinen (+) irritieren lassen.

Complication · 15. Juni 2011

Volker schrieb:
Aber 50 Prozent von 400 GFlops mehr wären halt nur 20 Prozent von 500 GFlops - das klingt ja mal direkt mau und kann man so nicht schreiben.

Sorry - aber das ist nicht mit dem Taschenrechner gerechnet, oder?

400 GFLOPS-> 50% = 200
500 GFLOPS-> 20% = 100

calluna · 15. Juni 2011

@ Complication

Es ist schon richtig so.

@ HardRockDude

Stimmt, die Modularität hat schon gewisse Vorteile... man kann die Leistung in bestimmten Bereichen besser seinen Bedürfnissen anpassen / bzw. die Leistung in einem bestimmten Bereich gezielt erweitern.

Langfristig finde ich da auch Intels Ansatz mit (dem vorerst gescheiterten) Larrabee interessant.

Complication · 15. Juni 2011

HardRockDude schrieb:
@Complication

Aber das Ding ist ja, eine FPU oder Level2-Cache hat man sich früher nicht extra dazugekauft.

Natürlich hat man das.
http://www.heise.de/newsticker/meldung/Coprozessor-Karten-Preise-sinken-Angebot-waechst-136014.html
http://lowendmac.com/ppc/g3-l2.shtml

Ergänzung (15. Juni 2011)

Volker schrieb:
Gestern zum Llano-Start hieß es für eben jene Modelle immer noch 500 GFlops (sh. Anhang). Aber 50 Prozent von 400 GFlops mehr wären halt nur 20 Prozent von 500 GFlops um zum gleichen Ziel von 600 zu gelangen - das klingt ja mal direkt mau und kann man so nicht schreiben.

Anstatt dich zu korrigieren machst du immer merkwürdigere Behauptungen - wo hat AMD 600 GFLOPS als Ziel genannt?
So wie du kann man das also schreiben?

HardRockDude · 15. Juni 2011

Complication schrieb:
Natürlich hat man das. [...]

Hm, aber ist das nicht für industrielle Nutzung? Daheim braucht doch niemand mehr z.B. einen extra mathematischen Coprozessor (oder etwa doch?). Jedenfalls interessant. Dann wird es irgendwann wohl wirklich so kommen mit den Grafikkarten. Geben wir den APUs ein bißchen Zeit, bis sie ihre Grafikleistung so sehr gesteigert haben, dass sie dedizierte Grafikkarten überflüssig machen.

Techniker Freak · 15. Juni 2011

@deadohiosky
Falsch verstanden, das kombinieren einer 6990 mit einer 6970 ist nichts neues, das ist lediglich Triple CF (3x gleiche GPU, wenn auch nur auf 2 Karten), ist schon seit der 3870X2 möglich. Ich meine eher das zusammen schalten von zwei verschiedenen GPUs die im Crossfire normalerweise nicht kombiniert werden können (ausgenommen mit dem Hydra Chip von Lucid Logic).

Hier siehst du die verschiedenen Kombinationen die bisher möglich sind und was dann deren Ergebnis ist!

Dual%20Graphics%20Models%20-%20Notebook.jpg

Der schwächere Chip bekommt nur soviel Arbeit zugewiesen wie er bewältigen kann und der stärkere Chip übernimmt den Rest. Das aktuelle Limit ist das die stärkere Chip max. die doppelte Leistung des schwachen Chips erbringen kann und das es nur mit einer APU + dedizierte Grafikkarte geht.

marcelino1703 · 15. Juni 2011

Wusa....... 50% sind nicht schlächt. Aber abwarten bis wir wirklich was für die Augen haben. Aber eine HD6900 Reihe drauf hauen ist ja schonmal nicht schlächt. Wenn die dann noch Power hat, dann könnte ein Notebook wirklich Dampf unter der Haube bekommen. Und wenn dann noch die CPU Power stimmt könnte das ganz schön interessant werden. Mal sehen, was die Zukunft bringt

Edit: AMD sollte mal anfangen eigene Notebooks zu bauen ;O

_____________________________
Mein Rechenknecht :
Prozessor: AMD Phenom II x6 1090T
Mainboard: ASUS M4A87TD Evo
Arbeitsspeicher: G. Skill Ripjarws CL7 1333 4GB
Netzteil: CoolerMaster Silent M600
CPU Kühler: Mugen 2
Graka: Gainward GTX 570 Phantom

HOT · 15. Juni 2011

Solange das AFR benutzt ist das Mist, ganz egal, was das AMD-Marketing das verspricht. Natürlich kann man verschiedene GPUs und auch IGPs zusammen in AFR laufen lassen, da aber immer ein Frame abwechselnd gerechnet wird, gibts a.) µRuckler (weil sich extrem schlecht timen lässt, wann der Frame wirklich fertig wird) und b.) genau 2x die Geschwindigkeit des langsameren Chips. Es ist möglich AFR mit einem 2x so schnellen Chip zu machen (2 Frames vom schnellen und 1Frame vom langsamen) usw. Aber es muss dringend eine bessere Technik her, um sowas handhabbar zu machen.

Matzegr · 15. Juni 2011

Volker schrieb:
Gestern zum Llano-Start hieß es für eben jene Modelle immer noch 500 GFlops (sh. Anhang). Aber 50 Prozent von 400 GFlops mehr wären halt nur 20 Prozent von 500 GFlops um zum gleichen Ziel von 600 zu gelangen - das klingt ja mal direkt mau und kann man so nicht schreiben.

Alle 3 Folien sagen doch das Gleiche aus. Auf der einen steht "400+ GFLOPs" auf den anderen "bis zu 500 GFLOPs". Da sind also nirgendwo mal eben 100 GFLOPs verschwunden.

Krautmaster · 15. Juni 2011

500- hätte zudem irgendwie doof ausgesehen

Bei den iGPUs wird wohl auf absehbare Zeit die Speicheranbindung ein Problem sein. Für OpenCL aber recht unwichtig, wobei ich behaupte, dass wenn man die GPU auf OpenCL trimmen würde und weniger auf Gaming Leistung käme weit mehr dabei raus. Zudem sind die alten 5D Shader auch besser was das angeht als die neuen 4D Shader bezochen auf Leistungaufnahme / Leistung in Open CL (HD5870 vs HD6970).

Complication · 16. Juni 2011

Die Speicheranbindung der APU Grafik ist jetzt schon bis zu 50 GB/s fähig.
Da wird es keinen Flaschenhals geben auf absehbare Zeit:
http://www.anandtech.com/Show/Index...-notebook-review-a-series-fusion-apu-a8-3500m

AMD shared a few choice details about the Llano memory controller architecture. To begin, AMD guarantees more than 30GB/s of bandwidth is available between the GPU and the memory controller—in other words, the path from GPU to the memory controller won't become a bottleneck. The GPU/memory controller link (i.e. within the APU die) can apparently scale up to as much as 50GB/s to support future APUs with even faster memory interfaces. Note that unlike previous integrated graphics solutions, there is no support for dedicated external memory—this is a pure shared memory architecture.

Die Bandbreite ist eine Frage des Stromverbrauchs.

Krautmaster · 16. Juni 2011

zwischen GPU und Memory Controller... und zum eigentlichen RAM?

Lustig, dass AMD noch "GPU" und "CPU Cores" in den Mund nimmt während einige hier einen verteufeln wenn man nur ansatzweise bei der APU von CPU + GPU redet

Edit:

https://pics.computerbase.de/3/4/9/8/5/21-1080.1030328699.png

das Bild spricht zumindest von 29,8 GB/s. Intern zwischen Controller und GPU von < 29,8GB/s. Kann man die Speicherbandbreite der GPU messen? Gibts da Tools?

~30GB/s entsprechen recht genau den Daten einer HD5570, sollte also passen.

Complication · 16. Juni 2011

Hinzu kommt der gravierende Unterschied, dass die APU Architektur weitaus weniger Daten über den Bus verschieben muss als eine dedizierte Grafiklösung oder eine iGPU. Dafür sorgt der gemeinsame Speicherzugriff von CPU und GPU und die neuartige High-Speed-Block-Transfer-Engines:
http://de.wikipedia.org/wiki/AMD_Fusion

Obwohl die skalaren x86er-Kerne und SIMD-Engines der APUs einen gemeinsamen Pfad zum Systemspeicher teilen, soll die erste Generation der AMD APUs den Speicher noch in verschiedene Speicherregionen teilen. Zum einen in einen Speicherbereich, der vom Betriebssystem verwaltet wird, welches auf den x86er-Kernen läuft, zum anderen in Speicherregionen, die von der Software verwaltet werden, welche auf den SIMD-Engines ausgeführt wird. Für den Datentransfer zwischen den beiden Speicherregionen hat AMD High-Speed-Block-Transfer-Engines eingerichtet. Im Gegensatz zu Datentransfers zwischen externen Framebuffern und dem Systemspeicher sollen diese Transfers nie den externen Systembus belegen.

http://sites.amd.com/de/Documents/48423B_fusion_whitepaper_WEB.pdf

Ob nun GPU oder SIMD Engines, CPU Kerne oder x86 Kerne - wichtig ist dass klar wird dass eine onboard/onchip GPU nicht das selbe ist wie die APU-GPU.

x-polo · 17. Juni 2011

Ob höhere Leistung des Chips nicht durch die begrenzte Speicherbandbreite verpufft ?!

Andtech hat beim AMD A8-3850 die Leistung der HD 6550D mit DRR-3 1333 und DRR-3 1866
getestet.

Auf Folie die Volker verlinkt hat steht "Excellent Memory Bandwith",könnte das so was wie Sideport Speicheranbindung (mit GDDR-5 RAM) werden ?

Complication · 18. Juni 2011

x-polo schrieb:
Auf Folie die Volker verlinkt hat steht "Excellent Memory Bandwith",könnte das so was wie Sideport Speicheranbindung (mit GDDR-5 RAM) werden ?

Nein - da würde ja der ganze Vorteil wieder dahin gehen. Sideportspeicher kann dann wiederum nur von der GPU genutzt werden und es erfolgt kein gemeinsamer Zugriff auf Adressbereiche.
Das würde nicht mehr funktionieren:

für den Datentransfer zwischen den beiden Speicherregionen hat AMD High-Speed-Block-Transfer-Engines eingerichtet. Im Gegensatz zu Datentransfers zwischen externen Framebuffern und dem Systemspeicher sollen diese Transfers nie den externen Systembus belegen.

News AMDs „Trinity“-CPU kommt mit VLIW4-GPU

Banned

Banned

Lieutenant

Banned

Captain

Ost 1

Anhänge

Banned

Commander

Banned

Captain

Lieutenant

marcelino1703

Gast

Lt. Commander

Commander

Fleet Admiral

Banned

Fleet Admiral

Banned

Lt. Commander

Banned

Ähnliche Themen

Passend zum Thema