Notiz Renoir-APUs für AM4-Desktops: Niedrige Latenz durch hohen Fabric- und Speichertakt

SV3N

Redakteur
Ersteller dieses Themas
Teammitglied
Dabei seit
Juni 2007
Beiträge
13.562
Mal dumm gefragt: Wo merke ich als Nutzer diese geringere Latenz? Habe ich dadurch einen Vorteil im Sinne von etwas läuft smoother oder resultiert daraus eine höhere Leistung, sodass z.B. ein höherer Durchsatz möglich ist?
Ich finde die Frage nicht dumm, sondern durchaus berechtigt.

Ganz so einfach lässt sich das nicht sagen, denn im Großen und ganzen geht es um den Speichercontroller, den sogenannten IMC als solches. Wenn der so gut ist, dass er DDR4-4266 mit einem synchronen FCLK hinbekommt, wir reden hier jetzt gar nicht über so Extrembeispiele wie 4266CL14, dann ist das für das spielen im CPU-Limit interessant respektive um dieses CPU-Limit noch einmal nach oben zu verschieben.

Außerdem profitiert ja auch der Durchsatz des Arbeitsspeichers von hohen Taktraten und nicht zuletzt die integrierte Grafikeinheit der APU.

Selten war schneller RAM, RAM-OC und Optimierung so interessant wie bei den kommenden Desktop-APUs.

Ein guter und flexibler Speichercontroller ist vor allem bei APUs ein echter Multiplikator.

Liebe Grüße,
Sven
 

Krautmaster

Fleet Admiral
Dabei seit
Feb. 2007
Beiträge
23.147
Größer Cache dürfte aber einen ähnlichen Effekt haben. Allein schon adurch dass der L3 hier so klein ist (Renoir) entsteht meines Wissens ein Latenz Vorteil zum Ram, andererseits muss dieser aber auch öfters zugegriffen werden da der L3 eben kleiner ist.
 

C.J.

Lieutenant
Dabei seit
Juni 2006
Beiträge
513
Ich halte es ja immer noch für möglich, dass man so langsam eine weitere Maske auflegt und nachdem man schon 8 Kern APUs hat, auch die 6 und 8 Kerner als monolithische Gaming CPU mit 35-45ns bringt, während die 12 und 16 Kerner als Arbeitstiere die auch zum Spielen geeignet sind, mit I/O Die und 50-60ns kommen.
Es wäre zumindest wünschenswert, wenn die Gaming-Modelle als monolithische 7nm-Chips kommen, da das anscheinend doch gut was ausmacht. Da 7nm mittlerweile gut läuft und AMD auch nicht mehr so klamm sein dürfte, ist das deutlich wahrscheinlicher als bei Zen 2. Allerdings würde ich einen monolithischen 16-Kerner für wahrscheinlicher halten als einen 8-Kerner. AMD wird sicher kein Downgrade machen und max. 8 Kerne anbieten bei Ryzen 4000. Aber wenn sie einen extra IO-Die auflegen für Ryzen, damit da 2 8er Chiplets drankönnen, werden die nicht nochmal extra einen monolithischen 8-Kerner bringen (das wären ja dann zwei neue Chips!), sondern einfach nur ein Chiplet nehmen, so wie bei Ryzen 3000. Da halte ich es für wahrscheinlicher, dass man bis zum 4700 alles mit Renoir abdeckt und darüber dann Zen 3 mit 10-16 Kernen. Dafür würden die XT-Modelle sprechen.

Latenztechnisch stört mich beim Chiplet-Design weniger die Off-Chip-Kommunikation, sondern eher dass der 12nm IO-Die taktmäßig einfach zu früh schlapp macht. Renoir schafft hier anscheinend deutlich mehr Takt und bei deutlich weniger Verbrauch. 35-45ns sind natürlich völliger Quatsch, selbst 50ns dürften mit normalsterblichen RAM nicht zu knacken sein. Aber besser als 65ns+ würde es allemal.

Mal dumm gefragt: Wo merke ich als Nutzer diese geringere Latenz? Habe ich dadurch einen Vorteil im Sinne von etwas läuft smoother oder resultiert daraus eine höhere Leistung, sodass z.B. ein höherer Durchsatz möglich ist?
Geringe Latenzen sind dann gut, wenn Code mit schlechter Datenlokalität ausgeführt wird. Das ist bei Spielen oft der Fall. Die fragen ständig kreuz und quer im Speicher irgendwelche Daten an, die oft nicht im Cache liegen, sodass die Speicherlatenz hier schnell zum Flaschenhals werden kann. Denn in der Zeit, wo die CPU auf Daten wartet, kann sie nicht rechnen. Rechenlastige Programme wie z.B. Videokonverter o.ä. haben weniger diversen Code wie Spiele und rechnen größtenteils aus dem Cache. Hier bringt eine bessere Speicherlatenz dann praktisch keine Vorteile mehr.
 

Baal Netbeck

Vice Admiral
Dabei seit
Apr. 2008
Beiträge
7.135
Schöne Nachricht, aber so ganz habe ich das noch nicht verstanden. :(

Die unter 50ns sind ja bestimmt mit 1:1:1 entstanden....bei 4333er Ram(real 2166MHz).
Das wäre ja eine Ecke besser als die maximal 3800 die im Moment erreicht werden können(zen2).

Da stellt sich die Frage ob das auch stabil war...usw.

Mit den Ausführungen von Robert Hallock hat das dann aber weniger zu tun oder sehe ich die Verbindung nicht?

Denn da geht es ja dann um Stromsparen, und wie AMD die 1:1:1 Verhältnisse aufhebt...Takte senkt...und trotzdem situationsgebunden die bestmögliche Leistung bereitstellt...coole Technik, aber am Desktop brauche ich doch vermutlich nicht auf solche Sachen achten und kann immer 1:1:1 halten?
 

SV3N

Redakteur
Ersteller dieses Themas
Teammitglied
Dabei seit
Juni 2007
Beiträge
13.562
Für mich ist das Ganze nur ein Indiz dafür, dass der Speichercontroller noch einmal deutlich besser geworden ist, auch wenn man „at default“ ggf. bei 55-58 ns landet.

Der IMC in Renoir scheint in jedem Fall weitaus höhere Leistungsreserven als bei Matisse.

Wir in jedem Fall nicht langweilig.
 

C.J.

Lieutenant
Dabei seit
Juni 2006
Beiträge
513
Schöne Nachricht, aber so ganz habe ich das noch nicht verstanden. :(

Die unter 50ns sind ja bestimmt mit 1:1:1 entstanden....bei 4333er Ram(real 2166MHz).
Das wäre ja eine Ecke besser als die maximal 3800 die im Moment erreicht werden können(zen2).
Ich vermute, dass Renoir aufgrund von 7nm einfach einen deutlich höheren IF-Takt schafft. Der IO-Die wird noch in 12nm hergestellt und man hat ja bei den GPUs gesehen, wie viel 7nm in dem Bereich (<2Ghz) an Mehrtakt gebracht hat. Deswegen wäre ein monolithisches Design für Zen 3 absolut genial. Oder wenigstens den IO-Die in 12nm+ (https://www.hardwareluxx.de/index.p...dries-bietet-finfet-fertigung-in-12lp-an.html).
 

Convert

Ensign
Dabei seit
Dez. 2018
Beiträge
179
Allerdings würde ich einen monolithischen 16-Kerner für wahrscheinlicher halten als einen 8-Kerner. AMD wird sicher kein Downgrade machen und max. 8 Kerne anbieten bei Ryzen 4000. Aber wenn sie einen extra IO-Die auflegen für Ryzen, damit da 2 8er Chiplets drankönnen, werden die nicht nochmal extra einen monolithischen 8-Kerner bringen (das wären ja dann zwei neue Chips!),
Den IO-Die müssen die ja nicht extra auflegen. Den gibt es ja bereits, den kann man einfach weiter verwenden für die 16-Kerner und die 8-Kern-Chiplet brauchst du sowieso für die Server und Threadripper mit Chiplet...

Ein aktienunternehmen wie AMD wird den Aktionären eine zusätzliche monolitsche Maske, die keine Kosten einspart schwer verkaufen können... "Ah wisst ihr, bei uns läuft es so gut, wir haben uns einfach mal eine weitere Maske gegönnt..."

Eine monolitsche Maske macht nur dann Sinn, wenn sie über Laufzeit kosten einspart.

Wenn man also bei den 8-Kernern den I/O-Die sparrt, dann reduziert dies den Teilepreis und wirft über Laufzeit mehr Gewinn ab, wenn die Stückzahl hoch genug ist.

Ein 16-Kerner hat eine schlechtere Ausbeute durch die größere Chipfläche und die Stückzahl ist geringer, hier könnte ein I/O-Die Design auch über Laufzeit kostengünstiger sein. Außerdem hat AMD dann im Falle eines 16-Kerners keine 8-Kerner mit neuster Zen 3-Technik. Dies führt zu verlusten bei Marktanteilen, da man unter 10 Kerner nichts in aktueller Technik zu bieten hat, oder man muss den teuren 16-Kerner halb deaktivieren, was auch nicht günstig ist...

Daher ist 16-Kern Maske weniger wahrscheinlich als eine 8-Kern-Maske...

Allerdingst ist eine weitere Maske nicht nur eine Frage des Geldes, sondern auch der Resourcen. Hat AMD überhaupt genug Leute, die eine weitere Maske parallel machen können? Oder machen die es zeitversetzt und wir kriegen erst die 16 und 12 Kerner aus dem Chipletdesign und die monolitschen 8-Kerner kommen nächstes Jahr? Und wenn die 8-Kerner erst nächstes jahr kommen, dann macht auch der Ryzen 7 3800XT wieder Sinn.
 
Zuletzt bearbeitet:

PS828

Commodore
Dabei seit
Juni 2019
Beiträge
4.270
Bin echt gespannt wie die Tests dann aussehen wenn die Teile rauskommen. Und wie groß wird AMD den APUs Platz einräumen im Vergleich zu den anderen ryzen ohne iGPU
 

yummycandy

Commodore
Dabei seit
März 2005
Beiträge
4.108
Da stellt sich die Frage ob das auch stabil war...usw.

Mit den Ausführungen von Robert Hallock hat das dann aber weniger zu tun oder sehe ich die Verbindung nicht?

coole Technik, aber am Desktop brauche ich doch vermutlich nicht auf solche Sachen achten und kann immer 1:1:1 halten?
Das war stabil, aber wohl extrem übertaktet.
Richtig, Robert Hallock ging gar nicht auf die Ergebnisse ein, sondern beschrieb nochmals, wie sich die unterschiedlichen Clockdomains im Gegensatz zu Matisse verhalten. Es kann aber sein, daß gerade dieses "Stromspartechnik" die Stabilität vom MC jenseits von 1733Mhz ehöhte. AFAIK gehen die 1900Mhz auch nur bei einzelnen Matisse Exemplaren.

@CJ.
IMHO stand im vorhinein fest, daß Renoir monolithisch wird. Man wird dann allerdings maximal 8Core sehen, denn bisher wurde bei APUs bisher einfach das eventuelle zweite Chiplet durch die GPU ersetzt, was wohl mit den IF Links zu tun haben wird.
 

Convert

Ensign
Dabei seit
Dez. 2018
Beiträge
179
Zitat aus der News: " Die Fertigung in 12LP+ wird bei GLOBALFOUNDRIES in der Fab 8 in Malta, im US-Bundesstaat New York ausgeführt. Die ersten Tape-Outs sollen in der zweiten Jahreshälfte 2020 erfolgen. "

Das Tape-Out wäre zu spät für Zen 3, der ja dieses Jahr kommen soll. Ich denke, AMD wird weiterhin den bekannten I/O-Die für 16 und 12-Kerner verwenden. Vielleicht kommt ja 12LP+ dann beim I/O-Die beim Zen 3+ mit DDR5 auf einem neuen Sokel Ende 2021 zum Einsatz... Aufgrund des Wechsels auf DDR 5 muss AMD dann den I/O-Die sowieso neu auflegen...

Global Foundries hat übrigens auch noch 12FDX-Prozess

https://www.globalfoundries.com/technology-solutions/cmos/fdx/12fdx

Ist das tauglich für ein I/O-Die?
 
Zuletzt bearbeitet:

amdfanuwe

Ensign
Dabei seit
Mai 2008
Beiträge
185
@Convert
Ein 16-Kerner hat eine schlechtere Ausbeute durch die größere Chipfläche und die Stückzahl ist geringer, hier könnte ein I/O-Die Design auch über Laufzeit kostengünstiger sein. Außerdem hat AMD dann im Falle eines 16-Kerners keine 8-Kerner mit neuster Zen 3-Technik.
Sehe da nicht das Problem. Durch 2 x 8C CCX lassen sich auch gut 14C und 12C Chips daraus gewinnen.
Selbst bei einem totalausfall eines 8C CCX kann man noch einen schnelle 8C CPU daraus machen.
Durch die Wiederverwendung teildefekter Chips dürfte die Ausbeute sehr gut sein.
Die Stückzahl wird auch ausreichend hoch sein. Bei ZEN2 Chiplets war es wohl eher ein Problem, dass allein für Server die Stückzahl zu gering war. Für ZEN3 sollten die Stückzahlen aber hoch genug sein, dass sich sowohl für Server als auch Desktop eigene Masken lohnen.
Bis 8C kann man die ZEN3 APU Cezanne verwenden. Nachdem genügend Kapazitäten bei TSMC vorhanden sind kann dieser auch zügig in den Desktop gebracht werden.
Wer keine Top Leistung braucht, ist auch noch gut mit Ryzen 3000 bedient. Da gab es auch erst vor kurzem die Vervollständigung des Portfolios mit den 4C CPUs. Da der 3300 im Gaming nicht schlecht ist, hätte der wohl die 6C kanibalisiert.

Also, schlechte Ausbeute gibt es nicht wegen Verwertung teildefekter Chips und schnelle 8C CPUs liegen erstmal nicht im Firmeninteresse, da man lieber teurerer 12C und 16C verkauft.
 

Convert

Ensign
Dabei seit
Dez. 2018
Beiträge
179
Bis 8C kann man die ZEN3 APU Cezanne verwenden. Nachdem genügend Kapazitäten bei TSMC vorhanden sind kann dieser auch zügig in den Desktop gebracht werden.
Die Mindestlaufzeit einer CPU bis diese neu aufgelegt wurde, beträgt 1 Jahr. Das liegt einfach an den Lieferbedingungen. Die 4000G-PRO CPUs will AMD Zwei Jahre lang (oder 18 Monate?) liefern. Wenn AMD die CPU schon nach einem halben Jahr einstellt, müsste AMD eine große Menge CPUs auf halde legen. Auch stellen OEMs nur einmal im Jahr neue Systeme auf und wollen nicht nach einem halben Jahr schon eine veraltete CPU anbieten. Ein Vorziehen von Cezanne unter 1 Jahr Lebensdauer von Renoir-Deskopt-CPUs wird es daher nicht geben, auch wenn es technisch möglich wäre...

Also, schlechte Ausbeute gibt es nicht wegen Verwertung teildefekter Chips
Kommt drauf an wo der Fehler ist. Wenn der Fehler Beispielsweise im I/O-Bereich ist, kannst du noch so viele Kerne deaktivieren, der komplette Chip ist Schrott..

und schnelle 8C CPUs liegen erstmal nicht im Firmeninteresse, da man lieber teurerer 12C und 16C verkauft.
Das ist schon richtig. Die Frage ist nur ob sich der Konsument darauf wird locken lassen, oder doch lieber einen 8-Kerner von Intel kauft, der genau so schnell in Spielen ist und billiger ist... und AMD dadurch Marktanteile an Intel verliert...
Wenn ich kein 12-Kerner brauche, kaufe ich auch keinen, sondern nehme den günstigeren 8-Kener, wenn er für mein Anwendungszweck die gleiche Leistung bei kleinerem Preis bietet...

Die Stückzahl wird auch ausreichend hoch sein.
Dies bezweifel ich. Hab grad auf Mindfactory nachgeschaut:

R9 3900X =17.160 Stück verkauft
R9 3950X = 2.370 Stück verkauft

Macht insgesamt 19.530 CPUs

Zum Vergleich:
R7 3700 = über 44.000
R5 3600 = über 72.000

Und das sind noch nicht alle 6 und 8-Kerner... Die 8 und 6-Kerner spielen in einer ganz anderen Liega als die R9-CPUs was die Stückzahlen angeht, daher wird sich eine Maske für die 8-Kener auch sehr viel schneller bezahlt machen, wenn diese sich bei den 16-Kerner überhaupt jemals auszahlt...
 
Zuletzt bearbeitet:

Taxxor

Fleet Admiral
Dabei seit
Mai 2011
Beiträge
11.118
Die 8C Chiplets finden ja dann weiterhin Verwendung bei TR 4000 und Epyc 7004 sowie bei den Ryzens über 8 Kernen.
Da der Prozess zu läuft, hat man mittlerweile bestimmt eh nicht mehr so viele Chiplets raus, die nicht für TR oder Epyc in Frage kommen würden und packt sie nur in die Ryzens, weil man dafür noch die Masse braucht.

Dann macht man die 6 und 8 Kerner eben allesamt 10% teurer und eine neue Maske wird sich durch die Verkaufzahlen sehr schnell bezahlt machen.
Dafür hat man dann auch CPUs, die den Modellen mit I/O Die im Gaming deutlich überlegen sind, sofern man sie nicht zu sehr im Takt beschneidet.

Klar gibt es hier bestimmt einige, die sich einen 3900X fürs Gaming gekauft haben, weil er in Zukunft vielleicht mal im Mittel 5% vor einem 3700X liegen könnte, aber das ist eine Minderheit.
Die Masse wird sich auch hier im Preisbereich zwischen 150 und 300€ bewegen, dort die Wahl zwsichen Intel 10000 und Ryzen 3000 haben und fürs Gaming dann bei Intel immer noch etwas mehr fürs Geld bekommen.

Dass man bis zum 8 Kerner mit Renoir kommt, ist sehr unwahrscheinlich, da man dann in der Gruppe mit den meisten Absätzen nur Zen2 hätte, und auch wenn Renoir geringere Latenzen hat, mehr als 10% würden da nicht bei rum kommen denke ich.
Während es bei Zen3 Kernen mit solchen Latenzen schnell 30% werden könnten.
 

[wege]mini

Commodore
Dabei seit
Juli 2018
Beiträge
4.139
DDR 4000....So so.

Wenn sie 20% am Takt drauf packen und plötzlich 30% an der Latenz finden, ist das natürlich nicht schlecht.

Jetzt müssen nur langsam die Software Heinis aus dem Po kommen und die Fähigkeiten von DX12 und der Hardware endlich mal nutzen.

Es ist doch z.K., dass die interne GPU verschwendetes Silizium ist, wenn eine externe GPU verwendet wird. :stock:

mfg
 

GreyPrinceZote

Lt. Commander
Dabei seit
Aug. 2008
Beiträge
1.839
Weiß man's?^^

Ich halte es ja immer noch für möglich, dass man so langsam eine weitere Maske auflegt und nachdem man schon 8 Kern APUs hat, auch die 6 und 8 Kerner als monolithische Gaming CPU mit 35-45ns bringt, während die 12 und 16 Kerner als Arbeitstiere die auch zum Spielen geeignet sind, mit I/O Die und 50-60ns kommen.
Ne, das war eher mein ungebildetes Verständnis von der Sache. Du und andere machen ja gute Argumente warum es da nicht nur Chiplet Design geben könnte.

Wäre auf jeden Fall schön zu sehen. Dann wird mein potenzieller Wechsel von 3600 auf z.B. 4700x noch attraktiver :love:
 

YforU

Captain
Dabei seit
März 2001
Beiträge
3.384
Das AMD oder auch Intel nochmal monolithische Mainstrem Desktop CPUs ohne zumindest physikalisch vorhandene IGP bringen ist schon ziemlich illusorisch. Viel zu teuer für einen längst viel zu kleinen Markt. Vor allen da praktisch die gleichen Designs mit IGP so oder so benötigt werden und ein um Faktoren höheres Volumen haben (zusätzlich Office Desktop + Mobile).
 
Zuletzt bearbeitet:

Makso

Commander
Dabei seit
Okt. 2006
Beiträge
2.654
@Convert Du hast recht. Aber ich brauche Threds. Den R5 bekommt der Sohnemann samt der RX590.
R3 3200G ist einfach zu schwach für meine Anwendungen.
 

Krautmaster

Fleet Admiral
Dabei seit
Feb. 2007
Beiträge
23.147
wieso sollte das illusorisch sein?

Wir bewegen uns selbst bei einem 16C AMD mit 7nm in einem Größenbereich der locker wirtschaftlich rentabel sein kann als Mono Die. AMD hat aber die Chiplets aus dem Server Segment eh, und als 7nm noch jung war profitierte man von der hohen Ausbeute bei den etwa 80mm² Chiplets.

Je reifer der Prozess, umso eher kann ich aber größere Die fertigen und das ist technisch gegenüber den Multi Chip Designs erstmal zu bevorzugen. Man spart sich ja auch Interposer und Arbeitsschritte.

Ich glaube hier herrscht teils ein großer Irrglaube über die Ausbeute bei TSMC und Intel.

Navi 14 hat 160mm² (so viel wie 2 Chiplets) und kostet ink Ram, GPU Board, Spannungswandler, Kühler.
Weiter verkauft die AMD nicht direkt sondern der OEM verdient einen großen Teil dran.

Geht soweit ich sehe bei 175€ los.

Je nach dem wie es AMD geht kann man sich auch wieder eine zusätzliche Maske leisten.
Dennoch denke ich auch nicht dass man da jetzt was dran ändert. 8C wird Renoir im Desktop bedienen, die IO Die dürfte für Zen 3 nahezu identisch wenn nicht komplett identisch bleiben, lediglich die Chiplets werden durch neue 8er CCX getauscht. Selbst "Zen4" macht da dann ggf nur wieder 2 CCX / Chiplet drauf, dann haben wir ggf entsprechend größere Chiplets und doppelte Kernzahl aber die funktioniert vermutlich nach wie vor an selber IO Die.
 

YforU

Captain
Dabei seit
März 2001
Beiträge
3.384
@Krautmaster
Es geht dabei nicht um die Kosten der Fertigung sondern um das Volumen. Ein monolitisches Mainstream CPU Design ohne IGP fällt nicht vom Himmel. R&D, Validierung, Masken, Packaging, Lagerhaltung etc. Das ist heute insgesamt brutal teuer und die Chips wären am Ende nur für eine sehr kleine Schnittmenge des gesamten Marktes zu gebrauchen. Nichtmal Intel mit im Vergleich zu AMD vielfach höheren Volumen leistet sich noch dedizierte Designs für Consumer ohne IGP. Wenn monolitisch (Consumer) wird immer eine zumindest kleine IGP dabei sein denn das ist die Voraussetzung um ein Design auch für Mobile, Entry, Office etc einsetzen zu können. Gaming (Mainstream) Desktop ist in Relation dazu (CPU Stückzahlen) eine Nische.
 
Zuletzt bearbeitet:

Krautmaster

Fleet Admiral
Dabei seit
Feb. 2007
Beiträge
23.147
da bin ich bei dir.

Ich denke dass Renoir weitestgehend die bis 8 Kerner im Desktop beerbt da die Chips AMD ggf gar günstiger kommen als die IO Die + Chiplet Lösung. Auch etwas davon abhängig welchen Takt Renoir macht.

Die bis 16C oder später 32C wird man denke ich wie bisher bei 2 Chiplets belassen. Wie du sagst, die IO Di ehat man ja und eine weitere Maske wäre da eher Verschwendung.
 
Top