Der RDNA 4 Gerüchte-Thread

Rock Lee

Commander
Registriert
Apr. 2011
Beiträge
2.916
Da ich trotz ausgiebigem Nutzen der Suchfunktion hier noch nichts zu dieser Thematik gefunden habe, erlaubte ich mir mal einen neuen Thread aufzumachen.

Denn es gibt erstmals handfeste Lebenszeichen von RDNA 4 durch Linuxtreibereinträge. PCGH oder der Gute @SVΞN
hat das Ganze meiner Meinung in einem Artikel gut zusammengefasst.
https://www.pcgameshardware.de/Graf...0-mit-RDNA-4-und-Navi-44-und-Navi-48-1434598/
Ich versuche das Ganze einzuordnen und mir daraus ein eigenes Bild abzuleiten, was man mit RDNA 4 erwarten kann und was nicht.

Warum handelt es sich bei den Linux-Einträgen um RDNA4 und nicht um etwas anderes?

Die Nomenklatur der Grafiktreibereinträge ist bei AMD schon seit jeher fortlaufend:
  • GFX101x stand für RDNA 1
  • GFX103x stand für RDNA 2 (hier sieht man die starke Ähnlichkeit zu den ersten RDNA Architekturen)
  • GFX11xx war RDNA 3
  • GFX12XX sind die neuen Einträge und stehen daher mit hoher Sicherheit für RDNA 4
Was sagt uns die Anzahl der Einträge über RDNA 4?

Insgesamt gibt es lediglich zwei Einträge, was für zwei unterschiedliche GPUs steht. Dies ist gleichzeitig ein Indikator, dass die bisherigen Gerüchte wahr sein könnten.

Wie sahen die bisherigen Gerüchte aus?

Die ersten Gerüchte, die zu Navi4x-Chips mit RDNA 4 Architektur erschienen sprachen von einem "Monster" mit einer Vielzahl an verschiedenen Chiplets. So eine Art Gallionsfigur. Sehr groß, Sehr viel Performance und Sehr Sehr teuer!
https://www.pcgameshardware.de/AMD-...00-Aufbau-Navi-4C-13-bis-20-Chiplets-1426723/
Andere Quellen sprachen bei Navi41 von einem Chip mit 3 "GCX" Chiplets, wovon jedes 48 Compute Units (CUs) besitzen würde. Insgesamt käme dieser Chip also auf 144CUs. Ein zusätzlich deutlich erhöhter Takt hätte den Chip wahrscheinlich zwischen 75%-100% schneller als eine 7900 XTX gemacht (eigene Schätzung).
https://wccftech.com/amd-rdna4-rumo...flops-gpu-gddr7-3-5-ghz-clock-rates-and-more/
Das war Ende 2022. Nun ein Jahr später hat sich die Lage komplett verändert.
Wer schon auf den Link zu Navi 4C geklickt hat, sieht, dass aktuell davon ausgegangen wird, dass alle High-End Navi4x-Chips gecancelt wurden und nun lediglich die Chips "Navi 44" und "Navi 48" übrig geblieben sind.
Dies deckt sich nun mit den beiden Treibereinträgen, welche von lediglich zwei GPUs sprechen.

Wie sehen diese zwei GPUs aus?

Die einzigen harten Fakten sind die beiden Treibereinträge. Der Rest spielt sich komplett in der Gerüchteküche ab. Daher sind jegliche Spezifikationen und Angaben zur Leistung mit Vorsicht zu genießen. Dennoch: Wenn die Gerüchte stimmen, dass es vorher mehr Navi4x Chips gab und nun nur noch zwei übrig geblieben sind, könnten sich die vermeintlichen Spezifikationen ebenso als "wahr" ergeben.

Der Youtube-Kanal Redgaming-Tech sagt zwei möglich Konfigurationen voraus:
Navi 48 (Option 1): 32 WGPs(= 64 CUs), 48MB Infinity Cache, 192-Bit GDDR7 Mem-Interface, 16x PCIe 5
Navi 44 (Option 1): 20 WGPs(= 40 CUs), 32MB Infinity Cache, 128-Bit GDDR7 Mem-Interface, 8x PCIe 5

Navi 48 (Option 2): 32 WGPs(= 64 CUs), 32MB Infinity Cache, 128-Bit GDDR7 Mem-Interface, 8x PCIe 5
Navi 44 (Option 2): 20 WGPs(= 40 CUs), 24MB Infinity Cache, 96-Bit GDDR7 Mem-Interface, 8x PCIe 5

Welche Konfiguration ist wahrscheinlicher? Ich persönlich tendiere stark zu Option 1, nicht weil ich nicht glaube, dass AMD theoretisch auch die gewünschte Performance einer 64CU-GPU auch grade so mit 128-bit-Speicherinterface erreichen könnte. Ich glaube jedoch, dass man die VRAM-Bestückung auch zu einem Selling-Point machen möchte. Denn:
Mit GGDR7 sind zum ersten mal Chips mit 24-Gbit, also 3 Gigabyte, Kapazität möglich.
https://www.hardwareluxx.de/index.php/news/hardware/arbeitsspeicher/61498-ab-2024-verfügbar-samsung-stellt-gddr7-speicher-vor.html
D.h. je nach Speicherinterface wären folgende Kapazitäten möglich:
  • 192-bit, 18 Gigabyte GDDR7,
  • 128-bit, 12 Gigabyte GDDR7
  • 96-bit, 9 Gigabyte GDDR7
12 und 9 Gigabyte bei Option 2 wären angesichts der jeweils aktuell spekulierten Performance (dazu später mehr) im Jahr 2024 einfach zu wenig. Selbst im Einsteiger-Bereich hat die RTX 4060 und die Radeon 7600 bewiesen, dass die Zeit der 8 Gigabyte-Karten vorbei ist. Das macht das eine Gigabyte mehr bei Navi 44 den Kohl auch nicht mehr fett.

Beide Dies sollen wohl auch monolithisch sein. Da ist sich die Gerüchteküche derzeit einig. Als Fertigungsverfahren kommt TSMCs N4P-Prozess in Frage, welcher auf einem verbesserten 5nm-Verfahren basiert. N3E kommt wohl eher nicht in Frage, weil die Kapazitäten begrenzt sind und es sich anhand der Spezifikationen um Midrange-Chips handelt. Ich persönlich denke, dass 3nm-Verfahren eher für AI gebucht und tatsächlich auch ausgebucht wird.

Ich werde also bei meiner weiteren Analyse stets von der Konfiguration der "Option 1" ausgehen. Dies als Hinweis.

Kommen wir nun zu einer spannenden Frage mit der sich bisher noch keiner beschäftigt hat:

Wie groß werden die Chips jeweils sein?
Kurze, langweilige Antwort: Wir wissen es nicht.

Lange Antwort: Wir können anhand diverser Annahmen, Fakten und Ableitungen einen ungefähren Größenrahmen errechnen.
Dazu müssen wir die spekulierten Spezifikationen unter "Option 1" erstmal als gegeben betrachten, sonst kommen wir nicht weiter.
Dann müssen wir eine weitere Annahme treffen, nämlich, dass AMD keine zusätzlichen Hardwareeinheiten verbaut deren Funktion wir nicht kennen können, welche aber eine signifikante Auswirkung auf die Chipgröße haben werden (zB ein Raytracing Co-Prozessor o.ä. /Coreteks:mussweg:)
Wir gehen also davon aus, dass der grundlegende Aufbau der Chips ungefähr gleich bleibt. Vielleicht hat AMD die ein oder andere zusätzliche Hardwareeinheit verbaut, was jedoch durch Platzoptimierung auf dem Chip wieder ausgeglichen wird.
Als nächstes schauen wir uns daher ein paar Spezifikationen von RDNA3-Chips aus der Vergangenheit an:
  • Navi 32 (Chiplet-basiert): Die Size 346 mm²,GCD Size200mm² 5nm,MCD Size36.6 mm² x4 (146mm²), 60 CUs, 256-bit, 6nm
  • Navi 33 (monolithisch): Die Size 204 mm², 32CUs, 128-bit 6nm
Jetzt haben wir mit Navi 48 aber einen monolithischen Chip in 4nm, so dass wir uns langsam rantasten müssen.
Zu erst einmal muss man schauen, welche Flächenvorteile N4P gegenüber N5 so bringt:
https://pr.tsmc.com/english/news/2874
6% area improvement sind nicht wirklich viel an dieser Stelle.

Dann schauen wir uns an wo man mittlerweile überhaupt noch Fläche einspart. Dazu folgende Grafik aus diesem Link:
https://www.techpowerup.com/301071/amd-explains-the-economics-behind-chiplets-for-gpus
Tb1SfC0z6FJvqH5A[1].jpg

Die linke Grafik zeigt im Grunde die Vorteile von Chiplets. Man stellt I/O und Memory lieber in einem günstigeren Prozess als Chiplets her, da dies im Vergleich zu Logik, also zB Shadereinheiten, ab 5nm eh kaum skaliert.
D.h. wir dürfen gar nicht stumpf 6% von der Gesamtgröße eines Chips abziehen, selbst wenn dieser ein reiner Die-Shrink eines monolithischen Chips von N5 in N4P wäre, sondern es ist weniger.

Ein Nachteil von Chiplets ist wiederum, dass man mehr Fläche benötigt, weil die Chiplets untereinander kommunizieren müssen. Daher braucht es mehr I/O, was bei 4 Chiplets ungefähr einen Flächennachteil von 10% entspricht. Wer etwas schwerere Kost mag, kann dies hier gerne nachlesen.
Anhand von Die-Shots von Navi31 schätze ich den Logik-Anteil beim GCD vom Navi32 200mm² bei grob 67%. D.h. er wächst bei Navi 48 mit 6,6% mehr CUs lediglich um 4,4% also ca. 209 mm². Den shrinken wir nun wieder um 4% (6*2/3)aufgrund des N4P-Prozesses und kommen wieder auf ~200mm² (Danke AMD:freak:). Dazu kommen noch 3 Chiplets (nicht 4 weil nur 192-bit, statt 256-bit) a 36,6mm² also zusätzlich 110mm². Das passt auch vom Infinity-Cache sehr schön, da Navi 48 passend zum Namen 48MB Infinity Cache haben soll und jedes Chiplet 16MB Cache hat. Der Shrink beim Memory von 6nm(aka 7nm) auf 4nm ist vernachlässigbar. Es geht noch etwas nach unten, aber viel wird es nicht sein. Gehen wir mal gnädig von 2% Flächeneinsparung aus. Dann sind wir bei ~107mm².
Das mit dem GCD zusammen ergibt ein hypothetischen Chiplet Navi48 von ~307mm². Jetzt machen wir diesen monolithisch und ziehen den Flächenmalus von 10% ab und landen bei ~276mm². In einer +-10%-Toleranz hat Navi 48 also ungefähr eine Größe zwischen 250-300mm².

Mit einer ähnlichen Rechnung komme ich beim 40CU Navi 44 übrigens auf knapp unter 200mm² (wenn man noch das PCIe x8-Interface rausrechnet). Schätze ich so 190mm².

Welche Performance wird aktuell spekuliert?

Hier ist sich die Gerüchteküche übrigens nicht ganz einig.
"Moores Law is dead" spricht bei Navi 48 von "schlägt knapp eine 7900 XT", während RedGamingTech von "ungefähr gleich mit einer 7900GRE" ausgeht.
Letzteres glaube ich jedoch nicht, denn das wäre klar eine Enttäuschung. Die 7900GRE ist ungefähr 8% schneller als eine 7800XT. Und Navi 48 hat aber lt. den Gerüchten 6,6% mehr Shader als die 7800XT, was im Grunde genommen heissen würde, dass die Weiterentwicklung trotz monolithischem Die = Null wäre.
Persönlich erwarte ich deutlich mehr Takt von RDNA 4, so dass man in der Theorie auch mit klar weniger Shadern durchaus das Level einer nochmals 23% schnelleren 7900XT erreichen könnte.
Für einen 276mm² großen Die wäre das schon recht ordentlich.
Navi 44 sehe ich übrigens analog zu dieser Leistungskategorie ungefähr auf dem Level einer 7700XT (vielleicht leicht schneller), auch wenn es zu der Performance noch gar keine Gerüchte gibt.

Von welchen Preisen darf man ausgehen?

Sicherlich die schwierigste Frage, da sich AMD oft je nach eigenem Performancelevel an Nvidias Preisstrategie orientiert.
Ich sage daher nur welches Preislevel man THEORETISCH erwarten könnte anhand der Die-Größen.

TSMCs N4 ist ein 5nm-Budgetprozess ähnlich wie N6 zu N7. Daher kann man durchaus erwarten, dass die Preise irgendwo zwischen N6 und N5 liegen per mm². Yield ist in einem dermaßen ausgereiftem Prozess mittlerweile kein Thema.
Bei Navi 44 mit seinen 190mm² könnte man im Vollausbau ungefähr bei 299 USD MSRP landen. Etwas kleiner dafür im teureren Prozess als der 204mm² große Navi 33 welchen es für 269 USD MSRP gab.
Bei Navi 48 könnte ich mir eine aggressivere Preisstrategie als bei einer 7800XT vorstellen. 399 USD halte ich hier für möglich (wenn man das gleiche Preis/mm² wie bei Navi 44 nimmt), gehe aber eher von 429 USD aus.

Namen?

Sind Schall und Rauch, aber wenn ich auf die Preise schaue, dann sieht das für mich nach 8700XT (Navi 48) und 8600XT (Navi 44) aus.


Was denkt ihr zu den bisherigen Gerüchten? Wird es unter RDNA 4 wirklich kein High-End geben?
 
  • Gefällt mir
Reaktionen: Tzk und SVΞN
Als vor 3 Jahren der Grafikkartenmarkt mitsamt RTX3000 und RX6000 vom Mining zerstört wurde und die Gerüchteküche vorallem durch die Twitter Heinis komplett absurd wurde, hab ich aufgehört irgendwas davon ernst zu nehmen.
Ich interessiere mich noch halbwegs dafür, also schaue ich vielleicht einmal im Monat auf 3dcenter vorbei, weil die dort die neuesten Kreationen aus der Küche recht gut einsortieren:
https://www.3dcenter.org/news/amd-rdna4
(übrigens auch für Nvidia und Intel + AMD Prozessoren)

Ansonsten tun Nvidia und AMD eben das worauf sie Bock haben -> möglichst viel von unserem Geld bekommen.
Als ob irgendjemand von uns daran etwas ändern könnte. Dafür ist es auch vollkommen uninteressant wie ein Produkt heißt oder über welche Spezifikationen man spekuliert.
Am Ende ist nur folgendes wichtig:
1. Ist das Produkt lieferbar?
2. Ist Preis/Leistung gut? (im Bezug auf etwaige Konkurrenzprodukte)
 
  • Gefällt mir
Reaktionen: NerdmitHerz
Rock Lee schrieb:
12 und 9 Gigabyte bei Option 2 wären angesichts der jeweils aktuell spekulierten Performance (dazu später mehr) im Jahr 2024 einfach zu wenig.
Sollte durch die deutlich höhere GDDR7 Geschwindigkeit doch mehr als ausgelichen werden, oder?
Zumindest in der Theorie oder liege ich da mit meinem gefährlichen Halbwissen falsch?
 
Die höhere Geschwindikeit von GDDR7 gleicht zwar ein schmales Speicherinterface aus, aber wenn der Speicher vollläuft, ist er voll und die Grafikkarte muss die Daten in den in den regulären Arbeitsspeicher parken, was massiv Performance kostet.
Sieht man beispielsweise selbst in 1080p bei Titeln "wie the Last of Us", welches bei 8GB-Karte zu katastrophalen 1%-Percentile Frames führt.
https://www.techspot.com/review/2656-the-last-of-us-gpu-benchmark/
 
Rock Lee schrieb:
Sieht man beispielsweise selbst in 1080p bei Titeln "wie the Last of Us", welches bei 8GB-Karte zu katastrophalen 1%-Percentile Frames führt.
Ich glaube zum einen wurden die Vram Fresser Diablo4 und Last of Us nach Launch dahingehend recht gut gefixt und zum anderen muss man sich fragen wer mit einer RTX3070 auf 48fps spielt.
Oder stellt die betroffene Person dann nicht von Ultra auf Hoch runter, hat 60-70fps und keine ruckelnden low% mehr?

Btw, natürlich finde ich den Vram Geiz von Nvidia nervig, aber man sollte es auch objektiv unter realistischen Settings betrachten.
 
Zurück
Oben