AMDs APU +20% ohne OC per Software

Crystal

Lt. Commander
Registriert
Mai 2006
Beiträge
1.385
AMDs APU +20% ohne OC - rein per Software opt.

Engineers boost AMD CPU performance by 20% without overclocking Schaut euch das mal an :eek: Eine Steigerung um 20% lediglich durch einen Codeschnipsel, ohne Übertaktung. Also im Grunde hat sich an der Hardware nix verändert, nur die Software wurde optimiert.

Also genau genommen wurde irgend eine handelsübliche APU wahrscheinlich Llano wie es dort heißt verwendet. Man erreichte die 20% in dem man die CPU zu einer fetch/decode unit machten und die GPU zu der primären Recheneinheit. Am 27 Feb. wirds auf der International Symposium on High Performance Computer Architecture genaueres dazu geben.

Das interessanteste kommt eigentlich jetzt. Denn das was man hier erreichte ist exakt das was AMD mit HSA/Fusion vorhat, das ist das wovon einige hier incl. mir, in den aktuellen AMDs News geplaudert haben.
Folgender Absatz ist noch interessant:
“Our approach is to allow the GPU cores to execute computational functions, and have CPU cores pre-fetch the data the GPUs will need from off-chip main memory,” Zhou says.

“This is more efficient because it allows CPUs and GPUs to do what they are good at. GPUs are good at performing computations. CPUs are good at making decisions and flexible data retrieval.”

Ach ja, im Update dort hieß es dass dort eine zukünftige APU herangenommen wurde, also eher Trinity oder sowas und AMD selbst Co-Autor des Papiers war. Also wer weiß. Hier gibts aber noch mehr zulesen.

Auf jeden Fall wird es wie es aussieht am 27. nähere Infos dazu geben.
 
Zuletzt bearbeitet:
Wird nur für die aktuelle Generation nicht mehr kommen. Dazu muss sicher was an der Hardware gemacht werden, da sonst ja die CPU Leistung schlechter wird, wenn die sich um den Prefetch kümmern muss. Kommt bestimmt noch ein gesonderter Kern dazu der sich dann darum kümmern wird.
 
Our experiments on a set of benchmarks show that our proposed preexecution improves the performance by up to 113% and 21.4% on average.

Ich würde mal zu gerne wissen was für Benchmarks die getestet haben.

Also so wie ich das verstehe macht die CPU also die ganzen Sprünge, Entscheidungen und organisiert die Arbeit für die GPU. (also den Prefetch)
Die GPU berechnet einfach alles was die CPU zur GPU hinschiebt.

Aber ein großes Problem sehe ich dabei.
Da die CPU nichts berechnet, muss die GPU alles berechnen. Das ist ja gut in parallelisierbarer Software.
Aber was passiert in einer Single-Thread Anwendung, denn ein einzelner GPU Kern rechnet ja um einiges langsamer als ein CPU Kern.
 
Wenn es ne herkömmliche APU ist, die GPU dann die herkömmliche berrechnung macht. Sollte man mal ein die APU und eine dgpu anschließen und schauen ob es bsp hier einen unterschied gibt zwischen herkömmlichen x86 und APU performance.
Denn immerhin wenn eine APU die CPU bei AMD ersetzt könnte man im Gaming bereich sich wieder gut aufstellen.

dude90
Naja neue AMD GPU Architektur berechnet doch seriel oder ???
Naja Lösung Turbo. (andere Teile deaktivieren bei single thread beanspruchung und overclocken)
 
Fuer HPC die GPU zu nutzen, ist nun wahrlich nichts neues. Das interessante an der Meldung ist eher, dass sie eine normale Consumer-APU dafuer verwendet haben, wobei man auch hier sehr wahrscheinlich wieder mit den ueblichen Einschraenkung bei ATI- und Consumerprodukten leben muss (fehlende Konformität mit IEEE 754). Das macht die Nutzung dieser Hardware letztendlich doch wieder nur bedingt interessant fuer dieses Anwendungsgebiet.
 
Keine aussagekräftige Meldung. Vieleicht haben sie auch nur ihr eigenes Programm geschrieben, und einmal wie üblich und einmal anders auf revolutionäre weise. Und das ist jetzt 20% schneller. Das könnte zB jeder Programmierer von sich behaupten, der seinen Code optimiert.
 
Übliche x86-Anwendungen kann man nicht einfach so auf einer GPU laufen lassen. Selbst wenn die CPU den Code in Echtzeit entsprechend umbauen würde, sind die allermeisten Aufgabenstellungen gar nicht dafür geeignet, z.B. nicht massiv parallelisierbar.

Es handelt sich also offensichtlich nicht einfach um einen kleinen Codeschnipsel, um den jede beliebige Anwendung ergänzt werden könnte und sie läuft auf wundersame weise 20% scheller auf einer APU, sondern von Anfang an um eine spezielle GPGPU-Anwendung.

Dass eine APU in GPGPU-Anwendungen ihre Muskeln spielen lassen kann, ist selbstverständlich, aber die werden niemals mehr als einen Bruchteil der gebräuchlichen Software ausmachen, eben weil sich viele Aufgabenstellungen wie gesagt gar nicht für GPUs eignen.
 
hab ich das jetzt richtig verstanden, die integrierte gpu soll auch bei den aufgaben der cpu mithelfen?
oder andersrum.
das macht doch eigentlich nicht sehr viel sinn, weil die temps dementsprechend steigen, oder liege ich falsch?
da lohnt es sich eher zu übertakten, als die integrierte gpu zu vergewaltigen. :D
 
Also zunächst einmal geht es nicht nur um AMD APUs, sondern das selbe wurde mit Sandy Bridge CPUs auch geschafft. Verwendet wurde eine E2-3200 APU, hier wurde schon mal darüber gesprochen: https://www.computerbase.de/forum/t...en-halbjahr-2014.1156489/page-5#post-13271174
ein erster Link bezieht sich nur auf den L3 Cache bei Sandy Bridge Designs, da bei Intel der L3 Cache zur Kommunikation zwischen CPU und GPU dient. bei AMD APUs wird die selbe Technik über das gemeinsam genutzte Systemmemory (RAM) genutzt. Mehr Details dazu hier:
Es geht um HPC und CPU assisted GPGPU Computing http://www4.ncsu.edu/~yyang14/hpca2012.pdf
Recent examples
include Intel's sandy bridge [21], on which CPUs and
GPUs are on one chip with a shared on-chip L3 cache,
and AMD accelerated processing unit (APU) [26] on
which both on-chip CPUs and GPUs share the same
off-chip memory
Also es funktioniert sowohl mit L3 Cache Designs, als auch mit Gemeinsamem System RAM Designs. Das bedeutet nicht dass es APUs gibt mit L3 Cache, oder dass es diese geben wird. Verwendet wurde eine E2-3200 APU die garantiert keinen L3 Cache besitzt. Das ist auf Seite 2 des Papiers beschrieben.

Zudem geht es um GPGPU Code, der für die GPU geschrieben ist. Kleine Änderungen bringen eben die CPU als Prefetcher ins Spiel. Also keine Games oder normale Anwendungen.
 
Zurück
Oben