News Broadwell: Neue Details zur Grafik von Intel der 8. Generation

Krethi & Plethi · 11. September 2014

nein, ist eben nicht zwingend nötig...

Sephiroth51 · 11. September 2014

Würde mich mal interessieren wie die sich gegen ein Kaveri schlägt .

Piktogramm · 11. September 2014

@cirrussc

Das Intel den Spaß interessant findet hat vor allem damit zu tun, dass im professionellem Umfeld damit etwas zu holen ist. In Bereichen normaler Endkunden wo es um winzig kleine Office Dateien geht, ein bisschen Browsen, Urlaubsphotos zurecht schneiden (natürlich mit der legalen Photoshopvollversion) und Videos angucken ist es aber reichlich egal. Ob die dort verwendeten Aktionen von der CPU in 100ms oder von CPU+GPU in 30ms bewerkstelligt werden hebt kein (normales

) Schwein an. Selbst in den meisten Betrieben sind typische Workloads so verdammt klein, dass sich hunderte Computer an sich langweilen und dieses Feature nicht brauchen.

Selbst im mobilen Bereich ist es mitunter fraglich, ob die GPU Unterstützung an vielen Stellen überhaupt sinnvoll ist. Die mobilen ARM CPUs sind mittlerweile verdammt schnell (und werden immer schneller) und bewältigen die meisten Aufgaben so schnell, dass es kaum lohnt für kurze Kasten die GPU-Einheiten mit zu bemühen. Da deren Aufwachen aus dem Energiesparzustand mitunter mehr Energie verpulvert als einfach die CPU minimal länger rechnen zu lassen.

Kurzum, HSA/Huma ist für Numbercruncher wirklich eine feine Entwicklung, für normale Nutzer aber wohl von so geringem Nutzen, dass die Marktdurchdringung (vor allem entsprechender Software) wohl noch einiges an Zeit braucht.

Und damit ich nicht ganz schwarz male, als Beispiel Pro OpenCL bzw. GPU gestütztes Rechnen fällt mit LibreOffice Calc ein. Als Tabellenkalkulation ist das ein weit verbreitetes Anwendungsbiet normaler Anwender und wirklich sinnvoll. Aber auch da ist es mitunter so, dass Dateien die so groß sind, dass sie von der GPU-Unterstützung wirklich profitieren normalerweise besser in Datenbanksystemen und nicht in einer Tabellenkalkulation aufgehoben wären

pipip · 11. September 2014

Piktogramm schrieb:
Kurzum, HSA/Huma ist für Numbercruncher wirklich eine feine Entwicklung, für normale Nutzer aber wohl von so geringem Nutzen, dass die Marktdurchdringung (vor allem entsprechender Software) wohl noch einiges an Zeit braucht.

Ja weil du in deinem Gedanken-Experiment an eine großen APU wie Kaveri ect denkst.
Wenn du aber eine kleine APU wie jene für Tablets (Mullins) nimmst, hast du nur eine gewisse TDP. Und wenn du dann mit HSA Performance rauskitzeln kannst, die eine CPU alleine nicht schaffen würde, wäre das wieder etwas, was auch für Otto-Normal-Verbraucher ein Vorteil wäre.

Also HSA wird dort zuerst Sinn ergeben, wo auch die meisten Mitglieder der HSA Foundation zu finden sind, nämlich mobile Geräte.

Piktogramm · 11. September 2014

Piktogramm schrieb:
...
Selbst im mobilen Bereich ist es mitunter fraglich, ob die GPU Unterstützung an vielen Stellen überhaupt sinnvoll ist. Die mobilen ARM CPUs sind mittlerweile verdammt schnell (und werden immer schneller) und bewältigen die meisten Aufgaben so schnell, dass es kaum lohnt für kurze Kasten die GPU-Einheiten mit zu bemühen. Da deren Aufwachen aus dem Energiesparzustand mitunter mehr Energie verpulvert als einfach die CPU minimal länger rechnen zu lassen.
...

@pipi

Ich zitiere mich einfach selbst.

Wobei du die mobilen "kleinen" CPUs nennst die alles andere als klein sind. Die Dinger sind kleiner als Desktopbolliden ohne Frage aber in der Regel immer noch leistungsfähig genug, dass oftmals GPU Unterstützung kaum gewinnbringend ist. Es gibt verschiedene Anwendungsfälle:

1. Die CPU schafft das Problem allein so schnell, dass es nicht sinnvoll ist die GPU-Einheiten zu wecken
2. Das Problem lässt sich nicht ausreichend gut parallelisieren - Optimierung in Richtung GPU sind also recht sinnig
3. Das Problem ist aufwendig, kommt häufig genug vor dass sich Optimierung lohnt
3.1 Man verpasst der kleinen CPU/dem SoC eine spezialisierte Hardwareeinheit um das Problem schnell und energieeffizient zu lösen
3.2 Das Problem wird da es sich fest in Hardware gießen lässt über die GPU abgewickelt (solche Probleme sind bei Normalos selten)

Schaut man sich die Mitglieder der HSA Fundation an stellt man vor allem fest, dass die Firmen die dort vertreten sind allesamt bereits mit Servern/Empedded Produkten Erfahrung haben oder aber massiv darauf hinarbeiten und nebenbei mit Mobiltechnik zusätzlich ihr KnowHow verwerten. Die erste ARM Kerne mit HSA Funktionalität finden sich auf AMDs Server SoCs und dort werden explizit die ARM-A57 Kerne genutzt. Ebenso sind die meisten Einsatzgebiete wo sinnvolle HSA Anwendungen genannt werden meist in Richtung Datenbanken (massiv parallelisierte Zugriffe ohne sinnloses Umherkopieren von Speicherbereichen WOOOOHOOOOOOOO) sowie Numbercruncher. Anwendungen für normale Desktops oder gar portable Geräte sind mir bei solchen Folien und Präsentationen noch nicht untergekommen.

Und wenn du schon den TDP ansprichst. Viele CPUs egal ob ARM oder x86 laufen am TDP Limit wenn man sie optimal auslastet, da gibt es oft wenig Raum um überhaupt die GPU-Funktionseinheiten mit zu nutzen. Das wird erst sinnvoll, wenn die Aufgabe per GPU weit effizienter abgewickelt werden kann als rein über die CPU. Wobei in solchen Fällen es alsbald noch viel effizienter ist einfach eine spezialisierte Hardwareinheit einzusetzen (siehe oben)

pipip · 12. September 2014

Piktogramm

3.1 Man verpasst der kleinen CPU/dem SoC eine spezialisierte Hardwareeinheit um das Problem schnell und energieeffizient zu lösen

Fix Funktion gehört aber genauso zu HSA wie wie die GPU. Das kannst du auf deren Seite nachlesen.

Das tolle an HSA soll sein, dass eben diverse Units gleichrangig sind und nicht nur alles von der CPU koordiniert werden.

Dass sich nicht alles parallelisieren lässt stimmt zwar aber ich verlinke zu dem Argument auch gern das hier
http://de.wikipedia.org/wiki/Gustafsons_Gesetz

Viele CPUs egal ob ARM oder x86 laufen am TDP Limit wenn man sie optimal auslastet, da gibt es oft wenig Raum um überhaupt die GPU-Funktionseinheiten mit zu nutzen.

Es geht eben nicht darum die GPU mit zu benützten, sondern Einheiten je nach Instruktion zu aktivieren/deaktivieren. Das ist wie das Herumschieben der Aufgaben. Dank einheitlichen Adressraum auch nicht mehr so aufwendig wie bsp wenn man separat eine CPU und eine GPU hat, wo alles kopiert werden muss. (Auch darf man froh sein, dass das nicht die Aufgabe des Programmierer sein soll, sondern des Compiler)

Aber ja, das ganze Konzept muss sich erst mal beweisen und ich für mein Teil bin mal auf Carrizo und context switching gespannt.

Fix Funktion wird sicher immer der effizienteste Weg sein, eine Aufgabe zu lösen, da kann weder GPU noch CPU mithalten.
Man kann der CPU, als auch der GPU beibringen, wie sie eine Aufgaben lösen kann und je nach Aufgabe, ist aber die CPU oder die GPU schneller.

Beides hat Vor und Nachteile. Die CPU und GPU sind sowieso vorhanden, somit muss man keinen Platz für Fix Funktion verschwenden oder als Programmierer hoffen dass die Instruktion Set vorhanden ist. Anderseits muss man hoffen dass die GPU gewisse Standards beherrscht.

Aber zu behaupten, dass ein Otto von HSA nichts mitbekommen wird

Naja zur Zeiten wo soziale Netzwerke immer wichtig werden, wo Sachen wie Sprach und Gesichtserkennung mehr und mehr kommen wird. Naja eine sehr gewagte Aussage. Vllt aber aus heutige Sicht hast du da nicht Unrecht.
Aber du kannst sicherlich nicht verneinen, dass HSA und besonders die GPU Performance die Tür zu neuer "Software/Anwendung" öffnet, an die du oder ich nicht denken, weil es diese noch nicht gibt.
Die Menschen sind zwar Technik abgeneigt, doch kommen immer mehr Genrationen dazu, die damit aufwachsen sind.

Übrigens, mir ist es zwar wurscht, aber ich gebe mir die Mühe deinen Namen richtig zu schreiben. Wenn du das nicht kannst, dann kopiere den Namen und füge ihn richtig ein, danke.

Daedal · 29. September 2014

Piktogramm schrieb:
Es stimmt schlicht, dass Intel die Features die AMD unter dem Label "HSA" vermarktet groß teils ebenfalls integriert hat bzw. plant zu integrieren. Intel haut in dem Bezug nur nicht so auf die Marketingpauke. Brauchen sie auch nicht, die aktuellen CPUs von Intel sind in (fast*) allen Belangen besser als jene von AMD und Anwendungen für Endanwender die diese Features brauchen sind nicht in Sicht. Hingegen scheint AMD den Zwang zu verspüren die eigenen CPUs mit HSA zu bewerben auch wenn die meisten Normalos davon (kaum/) keinerlei Vorteile daraus ziehen können.

Genau so sieht es aus. Intel nutzt auch seit Sandy Bridge den LLC zum Austausch zwischen CPU und GPU bei bestimmten Szenarien. Von Generation zu Generation wird hier mehr ermöglicht. Nur haben Sie die führende CPU und würden dem Konkurrenten mit Marketing für HSA-ähnliche Features nur in die Hände spielen. AMD muss das Marketing so nutzen um als Vorreiter in dieser Technik zu gelten wenn Intel irgendwann beschließt dies als offizielle Features zu bewerben. Aber ich bin sicher, dass einiges an den Effizienz Steigerungen mit heterogenen Auslastungen der Funktionseinheiten zu tun. Besonders beim Power- und Loadbalancing.

Piktogramm schrieb:
Und wenn du schon den TDP ansprichst. Viele CPUs egal ob ARM oder x86 laufen am TDP Limit wenn man sie optimal auslastet, da gibt es oft wenig Raum um überhaupt die GPU-Funktionseinheiten mit zu nutzen. Das wird erst sinnvoll, wenn die Aufgabe per GPU weit effizienter abgewickelt werden kann als rein über die CPU. Wobei in solchen Fällen es alsbald noch viel effizienter ist einfach eine spezialisierte Hardwareinheit einzusetzen (siehe oben)

Das effizienteste ist wenn beide gleichzeitig an den Daten arbeiten können. Ohne kopieren und im selben Speicherbereich. Wenn auf Hardwareebene Powerbalancing und Contextswitch möglich sind. Das sollte auch in der Summe schneller als CPU und GPU zusammengezählt sein, wegen den reduzierten Overheads um Tasks gemeinsam zu bearbeiten. Den größten Nutzen hat man tatsächlich in den niedrigeren TDP Bereichen wo die Leistungsaufnahme eng begrenzt ist.

Suche

News Broadwell: Neue Details zur Grafik von Intel der 8. Generation

Krethi & Plethi

Banned

Sephiroth51

Lt. Commander

Piktogramm

Admiral

pipip

Fleet Admiral

Piktogramm

Admiral

pipip

Fleet Admiral

Daedal

Banned

Ähnliche Themen

Passend zum Thema

Strix Point (Halo) AMD-Dokument bestätigt Eckdaten der Zen-5-APUs

Bericht Snapdragon X Plus Auch Qualcomms kleiner Chip soll Apple und Intel schlagen

„AMD Ryzen 9000“ Gigabyte nennt Zen-5-Desktop-CPUs beim Namen