News KI-Upsampling: AMD bringt FSR 4.1 offiziell auf RDNA 3 und RDNA 2

DANKE AMD!
Für etwas was selbstverständlich hätte sein sollen, als ihr es vorgestellt habt.
Danke an den/diejenige, die das SDK ursprünglich geleakt hat, mögest du in Frieden ruhen.

Jetzt hab ich dann wenigstens keinen 2K Briefbeschwerer AKA 395+ (und ja, ich nutze Optiscaler, ein "Downer" ist das ganze Gebastel trotzdem und ja ich bastel gerne...).

Dennoch muss ich sagen, dass ich mir bzgl. dieses Dramas in Zukunft gut überlegen werde aus der Grafiksparte von AMD noch was zuzulegen.
Wenn NV einen ARM SoC Handheld bringen würde, würde ich vermutlich diesen kaufen.
Das Vertrauensverhältnis ist nachhaltig geschädigt.
 
Blood011 schrieb:
Soviel zum Thema wegen fehlenden Matrix-Cores würde FSR4 nicht richtig drauf funktionieren..
Matrix-Cores? Waren die nicht bei Nvidia Karten verbaut? Ich glaube du verwechselst da was.

Edit: Nein ich bin am verwechseln. Nvidia hat Tensor Cores. :D
Ganz schön Hardcore mit diesen Cores...
 
Xbox series spiele könnten künftig stärker von FSR 4.1 profitieren
https://www.play3.de/2026/05/15/ps5...rophezeit-performance-schub-dank-amd-fsr-4-1/

Ändert natürlich wenig an den geringen Absatzzahlen und bisher erschienene SPiele werden wohl nur vereinzelt ein Upgrade im Upscaling erhalten, wenn überhaupt.
Und dann steht 2027 ja eh schon die neue Konsolengen bevor, so dass Hersteller sich jetzt nicht unbedingt zu Verbesserungen der "Last gen" genötigt sehen.
Sony wird zum Thema AI Upcaling eh erstmal auf ihre tolle PS5 PRO verweisen
 
Tevur schrieb:
Das kann man alles heute schon unter Linux beobachten:
FSR4 mit FP8 auf RDNA4
FSR4 FP8 emuliert über FP16 mit WMMA auf RDNA3
FSR4 mit INT8 auf RDNA2

nein. kann man nicht
so weit ich das jetzt gelesen habe geht man davon aus, dass die RDNA2+3 versionen eine mischversion zwischen INT8 und FP16 sein wird. also INT8 für einfachere dinge, FP16 für komplexere dinge wie zB vegetation

während der leak ein reines INT8 modell ist. also die bildqualität sollte steigen. was auch mit AMDs aussage zusammenpasst, dass es 4.1 qualität haben wird. FP16 ist nunmal viel genauer als RDNA4s FP8
also flimmern in zäunen, laserstrahlen, schraubengewinde und andere feine strukturen sollte mit der neuen version verringert werden

RDNA3 wird zusätzlich noch WMMA verwenden, um dieses "Mixed Precision" effizienter zu verarbeiten. damit sollte RDNA3 gegenüber RDNA2 die ein oder andere ms upscalezeit besser sein, selbst bei gleicher INT8/FP16 leistung

und natürlich wird das ganze auch generell optimierter sein. die "geleakte" version soll ein sehr früher prototyp sein.

während FP8 emuliert auf einer RDNA3 karte je nach spiel doch deutlich höhere upscalezeiten hat als die INT8 version. diese emulationszeit fällt dann natürlich komplett weg bei der offiziellen version

also man kann leider überhaupt nichts beobachten, weil die neuen versionen ganz anders funktionieren als das aktuelle INT8 modell
 
  • Gefällt mir
Reaktionen: Pisaro und mibbio
longusnickus schrieb:
und natürlich wird das ganze auch generell optimierter sein. die "geleakte" version soll ein sehr früher prototyp sein.
Das dürfte dann auch der Hauptgrund sein, warum es offiziell jetzt erst kommt. AMD wird schlicht die Zeit gebraucht haben, um es seit der geleakten "Rohfassung" so gut wie möglich für RDNA 2 & 3 anzupassen und zu optimieren.

Das reine Portieren geht ja durchaus vergleichsweise schnell, aber Optimieren ist dann das, was immens Entwicklungszeit verschlingt, je nachdem, wie weit man die Optimierung treiben will.

Sieht man ja auch bei Spielen recht gut. Die werden entweder direkt als Multiplattform entwickelt oder zumindest recht schnell portiert, aber in der PC-Fassung fehlt es dann gerne an Optimierungen, weil das sehr zeit- und damit kostenintensiv ist.
 
steirerblut schrieb:
Im Umkehrschluss leite ich daraus einfach mal FSR5 ~ 1 Jahr nach Release auf RDNA 4./5 für RDNA 4 ab. "together we advance_" sieht da für mich anders aus
Wird nicht passieren, Nvidia Blackwell hat physisch seperate Tensor Cores (5. Generation), die sind rein für Ki Berechnungen (Matrix Multiplikation). Für DLSS 5 haben die neue Hardware-Funktionen wie Cooperative Vectors, wodurch Shader-Threads und KI-Kerne parallel arbeiten können, ohne sich gegenseitig auszubremsen.

Bei RDNA4 sind die AI Kerne fester Bestandteil der normalen CUs und teilen sich die physischen Pipelines mit den normalen Grafik-Shadern. Wenn FSR 5 KI-gestütztes Neural Rendering verlangt, blockieren diese Berechnungen die normale Grafikleistung der RX 9000er, so wie bei den 7000ern RT nebenher auf den normalen Shadern gelaufen ist, was je nach RT Last zu massiven FPS Einbruch führte. FSR5 für Neural Rendering wird architekturbedingt erst auf UDNA laufen.

Eine 5070 Ti hat meine ich zum Beispiel 280 separate Matrix Einheiten, eine 9070XT hat Null separate Matrix Einheiten, sondern 128, die aber ebend mit den normalen Grafikkernen verwoben sind.
Dadurch die einfache Architektur kann man die Karten aber auch viel günstiger verkaufen und nicht jeder Käufer schaut genauer hin was er da kauft, hat ja bei den 7000er Karten auch geklappt. Knapp 300,- Preisdifferenz sind auf den ersten Blick schon verlockend, dafür muss man dann aber 2x kaufen wenn man zukünftige Features haben will.
 
  • Gefällt mir
Reaktionen: angHell
longusnickus schrieb:
während der leak ein reines INT8 modell ist
Wir reden hier von Linux. Dort braucht man die INT8-Leak-Version nicht für FSR4 auf RDNA3 und kann entsprechend dort auch 4.1 statt 4.0.2 nutzen. Dass der Performance-Einbruch durch die Emulation höher ist, ist nachvollziehbar aber kann eben auch jetzt schon gemessen werden, wenn man will.

Und RDNA2 kann mangels Matrix-Cores nur INT8, da ist nix mit Mischung mit FP16. Wo ist das eigentlich her, dass die neue Implementierung eine Mischung sein soll?
 
Pro_Bro schrieb:
Wird nicht passieren, Nvidia Blackwell hat physisch seperate Tensor Cores (5. Generation), die sind rein für Ki Berechnungen (Matrix Multiplikation). Für DLSS 5 haben die neue Hardware-Funktionen wie Cooperative Vectors, wodurch Shader-Threads und KI-Kerne parallel arbeiten können, ohne sich gegenseitig auszubremsen.

Bei RDNA4 sind die AI Kerne fester Bestandteil der normalen CUs und teilen sich die physischen Pipelines mit den normalen Grafik-Shadern. Wenn FSR 5 KI-gestütztes Neural Rendering verlangt, blockieren diese Berechnungen die normale Grafikleistung der RX 9000er, so wie bei den 7000ern RT nebenher auf den normalen Shadern gelaufen ist, was je nach RT Last zu massiven FPS Einbruch führte. FSR5 für Neural Rendering wird architekturbedingt erst auf UDNA laufen.

Eine 5070 Ti hat meine ich zum Beispiel 280 separate Matrix Einheiten, eine 9070XT hat Null separate Matrix Einheiten, sondern 128, die aber ebend mit den normalen Grafikkernen verwoben sind.
Dadurch die einfache Architektur kann man die Karten aber auch viel günstiger verkaufen und nicht jeder Käufer schaut genauer hin was er da kauft, hat ja bei den 7000er Karten auch geklappt. Knapp 300,- Preisdifferenz sind auf den ersten Blick schon verlockend, dafür muss man dann aber 2x kaufen wenn man zukünftige Features haben will.
Wird denn DLSS 5.0 ohne große Performance Einbußen auf z.b einer 5070TI laufen?
 
Die Hardware ist zumindest von vornerein darauf ausgelegt es zu können.
 
Damit wären RDNA 2 7 Jahre alt, zumindest offiziell und da wird sowieso Zeit die abzustossen, wenn die nicht schon eh vorher verrecken. Wenn Raytracing immer öfter in die Spiele fest integriert wird, ohne dass man die Funktion abschalten kann, dann wäre RDNA 2 erst recht im Nachteil. Wenn ich Remnant 2, Lord of Fallen und weitere UE 5 Titel problemlos in 2K spielen konnte, so wird das bei Titel wie bei Borderlands 4 oder Star Wars Outlaws schon schwierig.
Schon alleine aus dem Grund wäre Nvidia die bessere Wahl, nicht nur wegen des Upscalers.
 
Na, ob sich die Warterei auf DLSS 5 überhaupt lohnt... :evillol:
 
  • Gefällt mir
Reaktionen: the_IT_Guy
mibbio schrieb:
Das dürfte dann auch der Hauptgrund sein, warum es offiziell jetzt erst kommt. AMD wird schlicht die Zeit gebraucht haben,
die frage wann AMD damit begonnen hat bleibt. generell hätte sie ja schon vor 2020, dem RDNA2 release beginnen können

Tevur schrieb:
Wir reden hier von Linux. Dort braucht man die INT8-Leak-Version nicht für FSR4 auf RDNA3 und kann entsprechend dort auch 4.1 statt 4.0.2 nutzen. Dass der Performance-Einbruch durch die Emulation höher ist, ist nachvollziehbar aber kann eben auch jetzt schon gemessen werden, wenn man will.
ja und wie misst du die emulationszeit UND wie misst du den "Mixed Precision" vorgang?
also worauf willst du jetzt hinaus?

Tevur schrieb:
Und RDNA2 kann mangels Matrix-Cores nur INT8, da ist nix mit Mischung mit FP16. Wo ist das eigentlich her, dass die neue Implementierung eine Mischung sein soll?
braucht man nicht. auch das kann man anders handhaben. siehe intel mit xess und DP4A. ist langsamer funktioniert aber auch mit RDNA2 und vielen anderen GPUs

klingt für mich nachvollziehbar. wie sonst will man 4.1 bildqualität erreichen? mit INT8 alleine geht das offenbar nicht

hast du eine besser idee wie AMD das umsetzen wird. dann sag doch einfach!
 
Wir wollen euch einen Überblick darüber geben, was AMD für die Serien 7000/6000 und RX 9000 zu bieten hat.



Wer glaubt, dass eine RX 6000/7000-GPU mit der RX 9000-Serie mithalten kann, irrt sich gewaltig.



Zweifellos ist die Community dankbar – und ich ganz besonders –, dass die RX 6000/7000-Modelle über FSR 4.1 Int8 in den Treibern verfügen und von AMD offiziell unterstützt werden.



Wir werden die Unterschiede zwischen diesem FSR 4.1 Int8 und dem FSR 4.1 FP8 der RX 9000-Serie untersuchen müssen.

Wenn AMD im Test eine FSR 4.1-Version erreicht, die der Schärfe von FSR 4.1 FP8 sehr nahe kommt und nur leichte Leistungseinbußen mit sich bringt, wäre das ein großer Erfolg und ein Update für diese GPUs, deren Wert auf dem Gebrauchtmarkt steigen würde.



Ich glaube jedoch, dass sich das FSR 4 FP8 der RX 9000-Serie in der Gegenwart und Zukunft weiterentwickeln wird, während das FSR 4.1 Int8 für die RX 6000/7000-Serie auf dem Stand der Dinge verharren wird.

Das ist normal und logisch, da die FSR-/DLSS-Skalierer derzeit FP8 und nicht Int8 verwenden.

Was AMD angestrebt hat, wird nun umgesetzt: den Skalierer auf die weniger leistungsstarken Technologien der von AMD verkauften Produktreihen zu übertragen.


Hier sieht man, welche Technologien in den einzelnen RX-Serien enthalten sind. Die KI-Technologien sind tatsächlich in der RX 9000 enthalten, da diese über FP8 verfügt – ein Merkmal, das sie von den Vorgängergenerationen unterscheidet.
Ergänzung ()

Neue Spiele setzen zunehmend auf Raytracing in Kombination mit Rasterisierung, was einen deutlich größeren Sprung in der Bildqualität gegenüber früheren Versionen darstellt.

Die GPUs der RX 9000-Serie bieten mit diesen Technologien eine deutlich höhere Leistung als die RX 7000/6000-Serie und erzielen mit „Ray Regeneration“ noch bessere Ergebnisse, sofern das Spiel diese Funktion unterstützt.
 

Anhänge

  • Captura de pantalla (245).png
    Captura de pantalla (245).png
    915,7 KB · Aufrufe: 25
  • Captura de pantalla (246).png
    Captura de pantalla (246).png
    631,6 KB · Aufrufe: 27
Zuletzt bearbeitet:
longusnickus schrieb:
braucht man nicht. auch das kann man anders handhaben. siehe intel mit xess und DP4A. ist langsamer funktioniert aber auch mit RDNA2 und vielen anderen GPUs
Ist der FSR3 Weg und kommt nicht an die Qualität von FSR4.1/DLSS4 heran. Bessere BQ liefert nur die XMX Version, welche wiederum dedizierte Hardware benötigt.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Redirion und EmmanuelMar
EmmanuelMar schrieb:
Wir wollen euch einen Überblick darüber geben

Wer ist wir? Woher stammt dieser Text?

EmmanuelMar schrieb:
Wenn AMD im Test eine FSR 4.1-Version erreicht, die der Schärfe von FSR 4.1 FP8 sehr nahe kommt

Schärfe war nie das Problem. Wie kommst Du/der Autor darauf? Zudem lässt sich das ganz einfach mit RIS nachregeln.

EmmanuelMar schrieb:
Neue Spiele setzen zunehmend auf Raytracing in Kombination mit Rasterisierung, was einen deutlich größeren Sprung in der Bildqualität gegenüber früheren Versionen darstellt.

Das Raytracing immer mehr Einzug hält stimmt zwar, aber das ein "deutlich größerer Sprung" ist, ist eher so... halb gelogen. Das hängt stark von der konkreten Implementierung ab, und große Sprünge gibt es wenn, dann meist nur mit Pathtracing. Und das läuft auf egal welcher Karte aktuell noch immer ziemlich bescheiden.

Und es ist ja nicht so, als ob Raytracing nicht wieder neue Probleme mitbringen würde...
 
longusnickus schrieb:
hast du eine besser idee wie AMD das umsetzen wird. dann sag doch einfach!
Na sie machen einfach das, was jeder halbwegs versierte Nutzer jetzt schon unter Linux macht, ich sehe keinen Grund, was anderes anzunehmen. Auch 4.1 würde heute schon auf RDNA2 funktionieren, wenn es jemand gegen INT8 kompilieren könnte.
Als es nur 4.0.2 gab, konnte man doch schon die Unterschiede bei Performance und Bildqualität zwischen RDNA2, RDNA3 und RDNA4 prima sehen. FSR4.1 ist nix Neues, das wird analoge Ergebnisse bringen.
Und darum geht es. Es wurde gefragt, wie die Unterschiede aussehen werden und ich sage: kannste jetzt schon unter Linux sehen!
 
MaverickM schrieb:
Wer ist wir? Woher stammt dieser Text?



Schärfe war nie das Problem. Wie kommst Du/der Autor darauf? Zudem lässt sich das ganz einfach mit RIS nachregeln.



Das Raytracing immer mehr Einzug hält stimmt zwar, aber das ein "deutlich größerer Sprung" ist, ist eher so... halb gelogen. Das hängt stark von der konkreten Implementierung ab, und große Sprünge gibt es wenn, dann meist nur mit Pathtracing. Und das läuft auf egal welcher Karte aktuell noch immer ziemlich bescheiden.

Und es ist ja nicht so, als ob Raytracing nicht wieder neue Probleme mitbringen würde...

Zu behaupten, die Bildschärfe von FSR/DLSS sei unwichtig, hieße, die offensichtlichen Fortschritte beider Technologien zu leugnen. Sowohl FSR 4.0 als auch DLSS 4.0 sind weniger scharf als FSR 4.1 und DLSS 4.5 – was ja ihr wichtigstes Merkmal ist – und bieten zudem eine deutlich höhere grafische Detailgenauigkeit.



Die Zeit des „reinen Rasterings“ ist vorbei, und genau das zeigen die neuen Technologien, die auf die Leistungssteigerung durch Raytracing ausgerichtet sind.

Es ist eine unbestreitbare Tatsache, dass „Ray Regeneration“ und „Radian Cache“ Technologien sind, die im Raytracing eingesetzt werden, um eine visuelle Verbesserung sowie eine höhere Leistung zu erzielen.
 
Hier stand Mist.
 
Zuletzt bearbeitet:
Sapphire Forum
Zurück
Oben