News Smart Access Memory: Ryzen 3000 und Vorgängern fehlt es an Hardware-Support

Teralios schrieb:
Na ja … eher haben @foo_1337 als auch ich mir die Mühe gemacht gewisse Informationen zusammenzutragen und uns darüber ausgetauscht. Du hasst dann ein weiteres Schlüsselsteinchen dazu gegeben, wodurch wir auf eine Spur gekommen sind.

Ich hatte erst die Sicherheitsfunktionen in verdacht, der Hinweis von dir auf den Twitter-Tweet hat dann aber das nötige Steinchen geliefert.
Jup, hatte @foo_1337 ausdrücklich erwähnt hier im Thread. Dich wollte ich auch erwähnen, wusste aber nicht, dass nach dem e ein r kommt.. ^^
 
  • Gefällt mir
Reaktionen: Colindo und Teralios
famkcc schrieb:
Zumindest ist es jetzt offiziell bestätigt
Eben nicht, es ist nicht offiziell.
@foo_1337 Bei reddit gibt es auch nur Vermutungen. Größtenteils ist man sich aber einig, dass die Meldung Unsinn ist.
 
  • Gefällt mir
Reaktionen: nosound
@Teralios Danke für die verständliche Erklärung. Wenn ich das richtig verstehe, liefert das auch den Grund, warum das auf 5700ern nicht funktioniert, es gibt keine Maske für deren Adressraum. Habe ich das richtig schlußgefolgert oder mich jetzt total blamiert?
 
ZeroStrat schrieb:
Jup, hatte @foo_1337 ausdrücklich erwähnt hier im Thread. Dich wollte ich auch erwähnen, wusste aber nicht, dass nach dem e ein r kommt.. ^^
Alles gut! Wichtig wäre noch - ich bin da nicht mehr drin, vielleicht kann es einer besser erklären.

@Enurian
ich bin nicht wirklich tief genug in der Materie drin, kann dir aber sagen, dass auf Reddit viele, die ihren Senf dazu geben, keine wirkliche Ahnung haben und nur blubbern.

Es ist an der Stelle schwerer zu erklären, die letzte direkte »RAM-Controller« habe ich vor 12 Jahren auf einem Z80 programmiert. Da die MMIO nur 32 Bit hat, kann man hier bis zu 4GB RAM des Device abbilden (Es sind WENIGER, da jedes Device eine ID als Prefix bekommt. Mit einer Bit-Maske und der damit verbundenen Maskierung kann man nun diese 32Bit dazu nutzen mehr als 4GB abzubilden, in dem du die MMIO-Adressen anhand von einer Maske auf 64Bit aufblähen kannst oder eben zusammen schrumpfen kannst.

Wie gesagt, ich hab es das letzte mal beim Z80 mit 8Bit auf 10Bit oder waren es 12Bit? Keine Ahnung, war zumindest eine Aufgabe in der damaligen Kursarbeit. Ich muss mal schauen, ob ich die Unterlagen noch habe.

Das ist natürlich alles ohne Gewähr, aber es ist eine Möglichkeit, die sehr wahrscheinlich ist.

@Balikon nein, die Maske ist eigentlich nur für den »Treiber« relevant. AMD könnte durchaus auch BAR für die 5x00er Reihe frei schalten, man wird schauen müssen, was kommt.
 
  • Gefällt mir
Reaktionen: fox40phil und Col.Maybourne
lordfritte schrieb:
Also benötigt man eine RX6000 und einen Ryzen5000... Beides was man nicht kaufen kann.. toll.

Quark. Nur, wenn du auch das Smart-Access-Memory feature nutzen möchtest.
Die Karte tut aber auch ohne...!
 
Teralios schrieb:
@Balikon nein, die Maske ist eigentlich nur für den »Treiber« relevant. AMD könnte durchaus auch BAR für die 5x00er Reihe frei schalten, man wird schauen müssen, was kommt.
Das meinte ich. Auf den 5700ern geht das noch nicht, weil AMD es noch nicht angepackt hat. Es wäre aber möglich, das auch für die 5700er zu machen, wir wissen nur nicht, ob sie wollen.
 
  • Gefällt mir
Reaktionen: Colindo
Teralios schrieb:
@Enurian
ich bin nicht wirklich tief genug in der Materie drin, kann dir aber sagen, dass auf Reddit viele, die ihren Senf dazu geben, keine wirkliche Ahnung haben und nur blubbern.
Wie willst du das beurteilen, wenn du selbst nicht in der Materie steckst? Das widerspricht sich doch.
An deinen Ausführungen finde ich schon mal komisch, dass du meinst, der Controller würde das tun. Der PCIe-Controller steckt im IO Die und der ist identisch zwischen Zen2 und Zen3.
Zudem gibt es die Option "above 4g decoding", die die MMIO auf 64 Bit verbreitert, ja nun schon ewig. Wenn dabei Instruktionen verwendet werden, die arsch langsam laufen, müsste das dann nicht mit jeder GPU eine Performanceverringerung auf z.B. Zen 2 verursachen? Teste ich gern mal.
 
Danke an @MichaG und den Entdeckern für den Artikel, nun kann man den Leuten wieder mehr als nur Forenbeiträge unter die Nase halten :daumen:

Berserkervmax schrieb:
Bei NV wird es aber nicht soviel bringen weil NV nicht das Speicherbandbreiten Problem der AMD Karten hat.
Komisch, dass die Karten, die die geringste Bandbreitenlimiterung seit Jahrzenten haben, genau deshalb davon profitieren sollen.

https://www.computerbase.de/2020-11..._4k_limitiert_er_in_hohen_aufloesungen_update
7,5% mehr RAM-Takt resultieren in 1% mehr Leistung. Du bekommst bei allen anderen Karte der letzten 10 Jahre eine bessere Skalierung hin ;) Auch bei den HBM Modellen.

Auch Lustig, das genau SAM in FHD am meisten bringt, wo Bandbreite eher am geringsten profitiert.
https://www.pcgameshardware.de/Call...ld-War-Benchmark-Release-Review-1362383/2/#a1
 
  • Gefällt mir
Reaktionen: fox40phil, Tanzmusikus und Colindo
ich kann mir sogar vorstellen das Nvidia in vram lastigen situationen mehr davon profitiert mit ihrem VRAM geiz
 
"mehr FPS in Spielen" - das klingt nach typischem Marketing-Deutsch, wonach der unbedarfte Leser glaubt, ihm entgingen zehn, 20, 30% an FPS... 🙄
Faktisch reden wir entsprechend der bisherigen Benchmarks von maximal 2% - in Worten: ZWEI - Prozent!
=> Das ist allenfalls meßbar, toll für nen neuen Rekord im 3D-Mark - aber absolut nicht spürbar.
Wenn ein Spiel vorher mit 20 FPS geruckelt ist, ruckelt es jetzt mit 20,VIER!... wenn es mit 40 halbwegs flüssig gelaufen ist, hat man jetzt 40,ACHT!... und wenn es mit 144 FPS auf dem richtigen Monitor eSports-fähig gelaufen ist, hat man jetzt ganze 146,88 FPS!! - der absolute Wahnsinn 😂

Nicht falsch verstehen:
Die Technologie als solche ist ja okay, und als VR-Gamer nehme ich grundsätzlich schon auch gern alles mit, was geht.
Aber selbst für 5 oder 10% FPS-Steigerung würde ich mir abseits von irgendwelchen Benchmarks echt kein Bein ausreißen - und hier sind wir von solchen Größenordnungen noch meilenweit entfernt.
Trotzdem wird gefühlt mittlerweile alle zwei drei Tage darüber berichtet, als wäre es der neue Gral der Spieleperformance.

Naja... jeder wie er mag ;) 🤷‍♂️
 
  • Gefällt mir
Reaktionen: Cpt.Willard und loser
16GB Vram bringen aber nix wenn du nur 256Bit hast um sie zu füllen.

Das wird bei der 6900XT noch mehr in Gewicht fallen und ohne SAM zu noch größeren Verlusten führen.

Aber AMD ist bei mir eh raus wegen der schlechten RT Leistung.

Ich hoffe nur das SAM auf Z390 Chipsatz kommt.
Der Befehlssatz ist bei Intel seit Haswell vorhanden und nicht wie bei AMD erst jetzt Hardwareseitig.
Daher hoffe ich das Z390 und 9900K bedient werden.
 
Was sagt denn AMD dazu, wurde da überhaupt nachgefragt? Mag ja alles stimmen, aber einen Artikel rein auf Basis von Twitter-Posts, reddit- oder Forum-Beiträgen zu erstellen und das ganze ohne offizielle Stellungnahme als Fakt darzustellen finde ich nicht gut.
 
  • Gefällt mir
Reaktionen: fox40phil, elvis2k1 und Enurian
Eine doch recht fundamentale Frage scheint nirgendwo beantwortet zu sein, weder hier noch auf Reddit:

Warum braucht man ueberhaupt genau diese Bit-Operation, um resizable BAR effizient zu verwenden? Warum soll keine einzige, der anderen Bit-Operationen, die es sonst noch so gibt, auch im Stande sein, etwas Aehnliches mit einer aehnlichen Performance zu erreichen?

Falls es darum geht, bestimmte Transformationsoperationen zu beschleunigen, ist nicht erkennbar, warum man dazu ueberhaupt die CPU braucht, da die GPU diese Transformationen in jedem Fall viel schneller durchfuehren koennte. Aber was fuer eine Transformation muesste man ueberhaupt auf der CPU ausfuehren - es geht ja nur darum, Daten zwischen bestimmten Speicheradressen hinundherzukopieren?

Also, entweder sind die tatsaechlichen Operationen, die durch SAM beschleunigt werden, wesentlich komplizierter als ein "einfacher Speicherzugriff", oder die ganze Behauptung, dass diese Bitoperationen relevant sind, ist falsch.
 
  • Gefällt mir
Reaktionen: fox40phil
@branhalor
klick doch mal auf meinen CoD Link
in FHD sind es 15% mehr FPS mit SAM

@Berserkervmax
Du kannst nicht behaupt es limitiert, wenn es nicht limitiert.
Das ist schlicht falsch und Müll

@HighDefinist
Du hast ein 32 Bit Register = kann 4GB darstellen
Du kannst 4 GB sofort abbilden, ohne besonderes zutun.
Die Karten haben aber 6+ GB
Jetzt musst du dein 4GB Fenster verschieben -> die erwähnte Funktion im Artikel
Zen3 und Intel schaffen das in wenigen Zyklen
(Zen 3 -> 3 Zyklen, bei 4 GHz -> 0,75 ns; bei Zen 2 -> 300 Zyklen, bei 4 GHz -> 75 ns)
Zen 2 ist einfach zu langsam dafür, das es einen (großen) Nutzen hat.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: fox40phil, Col.Maybourne, Tanzmusikus und 2 andere
branhalor schrieb:
"mehr FPS in Spielen" - das klingt nach typischem Marketing-Deutsch, wonach der unbedarfte Leser glaubt, ihm entgingen zehn, 20, 30% an FPS... 🙄
Faktisch reden wir entsprechend der bisherigen Benchmarks von maximal 2% - in Worten: ZWEI - Prozent!

Das ist nicht wahr. In mehreren Beispielen bringt es tatsächlich bis zu 10% mehr Leistung/FPS.
Vor allem die min. Framerates steigen dadurch drastisch, siehe hier:
AMD Radeon RX 6800XT sees performance boost on Intel Z490 with Resizable BAR enabled - VideoCardz.com
1607097591376.png
 
  • Gefällt mir
Reaktionen: DanHot, fox40phil, Cpt.Willard und eine weitere Person
lordfritte schrieb:
Also benötigt man eine RX6000 und einen Ryzen5000... Beides was man nicht kaufen kann.. toll.
Oder, wie der Artikel sagt ein S1200 Intel Board und eine Nvidia Karte, sobald die es im Treiber freischalten.
 
@Enurian @Epistolarius ganz ehrlich: Ich bin es leid, mich zu diesem Thema rechtfertigen zu müssen. @Teralios, @Piktogramm und ich haben zu dem grundsätzlichen Thema (SAM = Res. Bar) schon genug "Beweise" geliefert gehabt. Und dennoch kamen ständig Meinungen (bewusste Wortwahl), dass AMD da doch Magie machen würde und dass das ja was ganz anderes wäre. Als Quelle wurde dann ein Reddit gewählt, welcher einen Kommentar unter einem Videocardz Artikel zitiert hat und ein weiterer aus Igors Forum. Beide Male war die Argumentation völlig unschlüssig und technisch mehr als inkorrekt.
Daher auch mein Hinweis hier sich den Reddit Thread zu geben. Die Argumentationen dagegen sind nämlich auch wieder mal völlig absurd. Aber so ist das nunmal in Diskussionsplattformen. Dazu kommt, dass sich @MichaG offensichlich hier nicht einfach nur der Aussagen in den Threads im Forum hier bedient hat, sondern das ganze auch selbst Nachrecherchiert hat.
Wenn ihr das Ganze für unglaubwürdig haltet, ist das ok. Es wollte ja auch keiner wahr haben, dass Intel relativ schnell Support für resizable Bars auf den Consumer Boards bringt. Sogar noch besser: Es wurde dann in diesem Thread gar fabuliert, dass AMD dafür ja Lizenzgebühren verlangen könne. Das ist dann an Absurdität kaum noch zu überbieten.

Vielleicht macht ihr euch mal Gedanken, weshalb SAM im einen Spiel mehr und im anderen weniger Boost bringt und was das wohl mit dieser Argumentation hier zu tun haben könnte. Die CPU kann hier den Swizzle machen und direkt in den VRAM schieben. Ohne schnelles _pdep_u32 macht das keinen Sinn.
 
Zuletzt bearbeitet von einem Moderator:
  • Gefällt mir
Reaktionen: guillome, fox40phil, Cpt.Willard und 5 andere
bad_sign schrieb:
@branhalor
Jetzt musst du dein 4GB Fenster verschieben -> die erwähnte Funktion im Artikel

Aber das macht die Funktion doch ueberhaupt nicht. Hier ist die Definition der Funktion:

https://www.felixcloutier.com/x86/pdep

Das hat nichts mit dem "Verschieben eines 4 GB Fensters zu tun".

Es ist noch nichteinmal klar, was mit "Verschieben eines 4 GB Fensters" ueberhaupt gemeint sein soll. Sofern es nur um ein paar Bitshifts oder 64-bit Additionen geht, kann man das jedenfalls auch mit anderen Operationen flott durchfuehren.
 
Zurück
Oben