Bericht AMD Polaris: So viel Leistung bringt die 4. Generation GCN

EchoeZ schrieb:
. Auch wenn Polaris in diesem Punkt gerde mal auf Maxwell Niveau arbeitet - was ich persönlich schon sehr gut finde - erkennt man, daß AMD nicht geschlafen hat ;)

"Effizienz". Wobei hier auch nur DX11 getestet wurde. Es wird sich zeigen wie es mit kommenden APIs schlägt. NV wird mit Volta eventuell was neues beginnen und vllt sogar einen Ansatz wie GCN folgen. Dazu folgt das Vega GCN5 einführen " soll". Polaris ist in meinen Augen die ursprüngliche 20nm Generation die man nicht verworfen hat. Anders Greenland. Mittlerweile glaube ich, dass es den Chip nicht mehr gibt und Vega wirklich was neueres ist.
 
@ Zeedy
Das Awendungsfeld für diese Art der automatischen Texturkompression sind idr Framebuffertexturen, also Texturen die oft verändert werden. Hier würde eine verlustbehaftete Kompression massive Probeleme bereiten, weshalb es sich nur um eine verlustfreie Kompression handeln kann.
 
pipip schrieb:
"Effizienz". Wobei hier auch nur DX11 getestet wurde. Es wird sich zeigen wie es mit kommenden APIs schlägt. NV wird mit Volta eventuell was neues beginnen und vllt sogar einen Ansatz wie GCN folgen. Dazu folgt das Vega GCN5 einführen " soll". Polaris ist in meinen Augen die ursprüngliche 20nm Generation die man nicht verworfen hat. Anders Greenland. Mittlerweile glaube ich, dass es den Chip nicht mehr gibt und Vega wirklich was neueres ist.

Warum glaubst du denn dass man Greenland verworfen hat? Ich gehe davon aus, dass das Vega 10 eigentlich Greenland heißt, so wie Polaris 10 Ellesmere heißt.

@Nai, okay aber dennoch sollte man dieses Thema nicht völlig missachten. GPU Entwickler wissen sicher am Besten welche Tricks man braucht um bei kaum schlechterer Bildqualität mehr Leistung zu erzielen. Kein wirklich passendes Beispiel, aber zuletzt gabs ja bei Mirrors Edge die Einstellung "Hyper", man sowohl mit einer 970 als auch einer 390 aktivieren konnte, die aber nur auf der AMD Karte wegen des vorhandenen Speichers auch Leistung gekostet hat.
 
Zuletzt bearbeitet:
ovi schrieb:
Seite 2: "The Tahiti-GPU.." :)

Ist mir auch direkt aufgefallen :D
Wenn ich mir das so anschaue...mir reicht meine R9 280 noch voll aus.
Wenns billiger wird schlage ich mal zu jetzt noch nicht. :)
 
Samsuxx schrieb:
Toller Test, sehr aufschlussreich, danke dafür! Da komme ich mir mit meiner 280X doch richtig lahm und alt vor, ein Jahr hält sie aber wohl noch aus.

Hier musste ich aber zweimal lesen


Wäre dann doch die Tahiti ;)

Tahiti LE :D Also ich hab auch noch ne GCN 1 und ich muss sagen schön wie AMD aus GCN soviel rausholt. Schade dass man den HPC Bereich nicht streichen kann bei GCN.. Würde noch bessere Consumerkarten bringen, allerdings wohl nicht auf Pascal Niveau.. Das mit 480 und GDDR5X wäre Intressant.. Ich denke ne Solide 400€ Karte auf 1070 Niveau wäre damit erreichbar. Wohl aber mit mehr TDP
 
tic-tac-toe-x-o schrieb:
Der Unterbau von Pascal ist die G80 so viel ich weiss... Das sagt schon alles über die GPU Entwicklungen. :D

Volta soll ja angeblich komplett neu werden.

ich sehe bei beiden, Nvidia wie AMD, kaum Änderungen im Aufbau seit G80 mit 1D und GCN.

Klar, man vermarktet alles als Gen X aber unter der Haube ist es wie gesagt eher Copy Paste. Was da Nvidia mit diesem Tiled Based Rendering gemacht hat ... hat wohl auch wenig mit der Architektur selbst zu tun, scheint eher ne sehr effiziente Art des Rendern zu sein. Die GTX 750 TI war vielleicht genau deshalb eine Art Testballon. Komischer einstand für ne neue GPU gen, so mit Mainstream Monate vor den eigentlichen Maxwell Karten.

Nvidia hat aber schon einige Veränderungen durch gemacht. Zb das Hot Clocking der Shader usw.
Ergänzung ()

zeedy schrieb:
Wobei Pascal ja im Grunde leicht updatetes Maxwell in 16 nm ist. Die Leistungssteigerung wird eigentlich nur nur den viel höheren Takt erzielt. Ein Vergleich @ 1400 MHz oder so wäre vielleicht dennoch interessant.

gab es glaub auch schon mit der 980 TI. Auch hier ist die Shaderleistung identisch. Leicht pro GTX 980 TI wegen mehr Bandbreite. Pascal is quasi n einfacher Shrink + natürlich neuer UVD usw... vielleicht noch n bisschen was für VR.
 
Zuletzt bearbeitet:
updater14 schrieb:
Im Westen nichts neues...
Wo sind denn die Verbrauchswerte des Stromhungers?

Wenn die 4. Generation so sehr an Speichertakt hängt, wo sind da die Übertaktungs-Vergleichswerte?

Danke für diesen Post. Muss man zu lang scrollen für :D

Ein solcher Test ist nur vollständig, wenn man schaut
was Nvidia in der gleichen Zeit geleistet hat und AMD
gegen Intel stellt - und dann ein Fazit zieht, das diesmal
auf den Fakten im Artikel basiert. Frei von persönlicher
Präferenz und Zukunftsvermutungen. ;)
 
Krautmaster schrieb:
das kann man aber nur bei Tonga und Tahiti anstellen, die 14nm kann man ja schlecht über die Effizienz vergleichen. Der Fertigungswechsel haut da ja viel mehr rein als irgendwelche Änderungen am Design. [...]

Stimmt nicht so ganz. Kleinere Fertigungsverfahren, haben das Primärziel eine höhere Waver Ausbeutung. Bessere Effizienz ist ein positiver Nebeneffekt, aber der Sprung wird immer kleiner, weil wir uns schon sehr nahe an der 10nm befinden. Den Großteil der Effizienz macht jetzt inzwischen die Architektur. Power Gating ist ein Schritt in die richtige Richtung, auch besseres Caching und Memory Management steigert die Effizienz (wurde auch bei Polaris verbessert), usw.

Eine große Veränderung bei Pascal gegenüber Maxwell ist beispielsweise der hohe Takt bei gleichem bzw. niedrigeren Verbrauch (so 1500+ zu 1100). Keine Ahnung wie die das bewerkstelligen, aber ich glaub das hat nichts mit Fertigung zu tun, sondern mit der Architektur. Würde Maxwell so hoch takten, würden die beiden Generationen wahrscheinlich kaum Performance Unterschiede haben.
 
Zuletzt bearbeitet:
Nitschi66 schrieb:
So ein quatsch was du da erzählst...
https://www.computerbase.de/2016-06/radeon-rx-480-test/9/#abschnitt_uebertaktbarkeit
ein um 500MHz übertakteter VRAM ergaben ganze 3% Mehrleistung in den drei getesteten spielen...
Genau deswegen verstehe ich das mit der Speicher Limitierung auch noch nicht so ganz.
Entweder limitiert der Durchsatz, dann sollte eine Übertaktung von 4000 auf 4500 deutlich mehr bringen, oder er limitiert eben nicht.
Hierzu hätte ich gerne nochmal eine Erklärung.
 
incurable schrieb:
Es gibt mittlerweile entsprechende Aufnahmen, die die 36er Konfiguration bestätigen.
THX für den Link @EchoeZ
Indeed Thnx for the link.
Tjoa. Sch...ade.
 
Anstatt eines Grundlagenartikels über die Architektur der AMD-Karten hätte mich zwar mehr ein Praxistest (z.B. ein Vergleich der GTX 1070-Partnerkarten ;-) ) interessiert. Aber das ist natürlich nur meine unmaßgebliche Meinung.
 
Schlumpfbert schrieb:
Entweder limitiert der Durchsatz, dann sollte eine Übertaktung von 4000 auf 4500 deutlich mehr bringen, oder er limitiert eben nicht.

Magst du mir den Zusammenhang bitte kurz erläutern? :-/
 
Dann habe ich mir mit der Nitro 470 8GB anscheinend genau die richtige Karte gekauft ;)
Ich dachte zuerst, dass die erhöhte Speicherfrequenz unnütz wäre. Da habe ich mich wohl (glücklicherweise) geirrt.

Mit ein wenig Undervolting und Lüfter auf 1800 U/Min begrenzt ist die Nitro 470 ziemlich angenehm. Aber ich werde noch weiter testen, was da möglich ist.
 
eiscreme schrieb:
Stimmt nicht so ganz. Kleinere Fertigungsverfahren, haben das Primärziel eine höhere Waver Ausbeutung. Bessere Effizienz ist ein positiver Nebeneffekt, aber der Sprung wird immer kleiner, weil wir uns schon sehr nahe an der 10nm befinden. Den Großteil der Effizienz macht jetzt inzwischen die Architektur.

ich würde sagen der Großteil geht nach wie vor auf die Fertigung, gerade bei einem Doppelsprung wie 28-> 16/14nm. Schau dir doch an wie die Effizienz der Pascal GPU zugelegt hat. Da geht nicht einen Deut auf Kappe der Architektur, das ist rein Fertigung.

Das ist ziemlich genau auch das was TSMC für 20nm (übersprungen) und 16nm angegeben hat.

Die niedrigen Spannungen kombiniert mit höherem Takt reichen dazu aus.

http://www.tsmc.com/english/dedicatedFoundry/technology/16nm.htm

TSMC's 16FF+ (FinFET Plus) technology can provide above 65 percent higher speed, around 2 times the density, or 70 percent less power than its 28HPM technology. Comparing with 20SoC technology, 16FF+ provides extra 40% higher speed and 60% power saving. By leveraging the experience of 20SoC technology, TSMC 16FF+ shares the same metal backend process in order to quickly improve yield and demonstrate process maturity for time-to-market value.

Gerade auch FinFet spielt da stark mit rein.

Edit: Bei Intel geht es primär um die Ausbeute und Kosten / Transistor, gerade auch weil die Chips immer kleiner werden ja und die Konkurrenz ja nichts entgegen bringen kann. Bei den GPU hingehen skaliert man quasi perfekt über die Fläche und sobald es nötig und wirtschaftlich ist (neuer Prozess is meist teurer) baut man aus, Shrinkt die Architektur und hat die Möglichkeit etwa das doppelte an Shadern auf gleicher Fläche unterzubringen. Aktuell ist ja der GP102 / GP100 das Größte was auf 16nm realisiert wird, aber auch der GP102 kann noch etwa ein Drittel zulegen wenn man mal von 600mm² als Schmerzgrenze ausgeht.

Ein AMD Fiji Shrink mit 4096 Shadern würde in 16nm ja auch nur auf ~300mm² kommen. Im Prinzip kann mich mir Vega gut bei Polaris *2 vorstellen+ ggf höherer Takt.
 
Zuletzt bearbeitet:
faraday schrieb:
Magst du mir den Zusammenhang bitte kurz erläutern? :-/
Naja, wenn der Speicherdurchsatz limitiert, dann sollte eine Übertaktung des Speichers von 12,5% mehr bringen als im Endeffekt nur 3%.
 
Auch wenn AMD mit Polaris einen guten Schritt nach vorne gemacht hat fehlt mir bei der Energieeffizienz noch zu viel zu nVidia.
Außerdem ist keine Karte mit HighEng Leistung verfügbar und wann eine kommt steht noch in den Sternen :(
 
Schlumpfbert schrieb:
Naja, wenn der Speicherdurchsatz limitiert, dann sollte eine Übertaktung des Speichers von 12,5% mehr bringen als im Endeffekt nur 3%.

Ja genau, das hab ich verstanden. Aber warum ist dem so? :)
 
faraday schrieb:
Ja genau, das hab ich verstanden. Aber warum ist dem so? :)
Genau das wüsste ich ja auch gerne. :D
Dieser Artikel behauptet, dass der Speicherdurchsatz die Gesamtperformance arg limitiert.

Dieser Test von CB hat aber gezeigt, dass eine Erhöhung der Taktfrequenz des Speichers kaum etwas bringt:
https://www.computerbase.de/2016-06/radeon-rx-480-test/9/#abschnitt_uebertaktbarkeit

Entweder stimmt eines von beiden nicht, oder ich hätte gerne eine Erklärung dafür, dass beides zutrifft.
 
Zurück
Oben