Ist eine RTX 5090 ganz anders aufgebaut als eine RTX 5050 bis RTX 5080?

RealMax123

Lieutenant
Registriert
Mai 2025
Beiträge
642
Angeregt durch die Diskussion um etwaige Produktionsverknappungen oder Produktionumstellungen von Nvidia hab ich mir mal wieder auf Wikipedia die technischen Infos zur RTX 5000 Serie genauer angeschaut:

forum1010.jpg


Demnach scheint es auch wenn fünf Chipgrössen genannt sind, insgesamt aber vier Chipgössen zu geben. Drei für den Mainstreambereich von RTX 5050 bis RTX 5080 und einen für die RTX 5090. Aber es fällt auf das kein GB204 ewähnt ist, wobe es abe sein könnte das es denn dennoch gibt, bzw. mit dem Super Refresh kommt.

RTX 5090: 12 (wirklich?) GPCs für den GB202
Mainstream Gross: 7 GPCs für den GB203 (alle 7 aktiv)
Mainstream Mittel: 5 GPCs für den GB204 (alle 5 aktiv) und GB205 (4/5 aktiv)
Mainstream Klein: 3 GPCs für den GB206 (alle 3 aktiv) und GB207 (2/3 aktiv)

Und von jeder dieser Chipgrössen scheint es bei den Mainstreamchips jeweils eine Vollausbau-Variante mit jeweils 12 SMs und RT-Kernen pro GPC zu geben, sowie eine Reduzierte-Variante mit jeweils 10 SMs und RT-Kernen pro GPC.

Damit liesen sich dann folgende Mainstream-Modelle erklären:

GB207R: 2x10 mit 20 SMs und RT-Kernen, 2560 ALUs: RTX 5050
GB207
: 2x12 mit 24 SMs und RT-Kernen, 3072 ALUs: bislang noch nicht verwendet, evtl. RTX 5050 Super
GB206R
: 3x10 mit 30 SMs und RT-Kernen, 3840 ALUs: RTX 5060
GB206
: 3x12 mit 36 SMs und RT-Kernen, 4608 ALUs: RTX 5060 Ti

GB205R
: 4x10 mit 40 SMs und RT-Kernen, 5120 ALUs: bislang noch nicht verwendet, evtl. RTX 5060 Ti Super
GB205
: 4x12 mit 48 SMs und RT-Kernen, 6144 ALUs: RTX 5070
GB204R
: 5x10 mit 50 SMs und RT-Kernen, 6400 ALUs: angeblich geplante RTX 5070 Super
GB204
: 5x12 mit 60 SMs und RT-Kernen, 7680 ALUs: bislang noch nicht verwendet, evtl. RTX 5075 oder auch später als RTX 5070 Ti und RTX 5070 Ti Super (Augleich durch höheren Takt)

GB203R
: 7x10 mit 70 SMs und RT-Kernen, 8960 ALUs: RTX 5070 Ti
GB203
: 7x12 mit 84 SMs und RT-Kernen, 10752 ALUs: RTX 5080

Allerdings die RTX 5090 nicht ins Konzept! Denn die soll ja 170 SMs und RT-Kerne haben.

Mit 12 GPCs wäre das demnach aber garnicht möglich. Sondern dann bräuchte es schon 15 oder 16 GPCs. 15x12 wären 180 und 16x12 wären 192.

Es gäbe aber auch noch zwei andere Möglichkeiten:

In jedem GPC stecken nicht max. 12 sondern max. 16 SMs und RT-Kerne. Das würde dann aber im Umkehrschluss heissen das bei den RTX 5050 bis RTX 5080 Mainstreammodellen nicht 10/12 oder 12/12 genutzt würden sondern nur 10/16 oder 12/16. Das wäre dann aber eine extrem schlechte Ausnutzung, Vorallem bei der RTX 5050 wären das dann ja nur 2x10 von 3x16 = 41,7% und bei der RTX 5070 nur 4x12 von 5x16 = 60%. Das kann ich mir auch nicht vorstellen.

Die letzte Möglichkeit wäre noch das der GB202 für die RTX 5090 eine ganz andere Architektur hat mit 16 SMs und RT-Kernen pro GPC, während die GB207 bis GB203 für die RTX 5050 bis RTX 5080 nur 12 SMs und RT-Kerne pro GPC hätten.

Und dann gibt es noch die ROPs, wo ich immer noch nicht verstehen was die ROPs genau sind. Denn die Proportionalität zu GPCs, SMs und RT-Kernen ist zwar ungefähr gegegeben, aber nicht exakt.
 
  • Gefällt mir
Reaktionen: herrStreusalz
Nein, technisch sind beides weiterhin klassische Monolithen und keine Chiplets wie im Serverbereich. Die 5090 ist aber mit ihrem riesigen 512 Bit Speicherinterface ein ganz anderes Kaliber und quasi wie zwei 5080er auf einem Stück Silizium.
 
Ich würde mich an deiner Stelle nicht zu sehr an den GPCs festklammern. Die sind halt etwas anders ausgelegt, aber direkt darunter sind per SM alle Chips gleich gestaltet, von GB202 bis zum GB207 runter.

Aus den Whitepaper:
Each full GB202 chip contains 192 SMs, and each SM includes128 CUDA Cores, one Blackwell Fourth-Generation RT Core, four Blackwell Fifth-Generation Tensor Cores, 4 Texture Units, a 256 KB Register File, and 128 KB of L1/Shared
Der GPC wird in der Beschreibung hier nichtmals erwähnt, da technisch für die Architektur nicht von großer Bedeutung.

RealMax123 schrieb:
Allerdings die RTX 5090 nicht ins Konzept! Denn die soll ja 170 SMs und RT-Kerne haben.
Nicht nur die. Der SM/GPC Count schwankt ständig.

GB202: 16 SM/GPC
GB203: 12 SM/GPC
GB205: 10 SM/GPC
GB206: 12 SM/GPC
GB207: 10 SM/GPC
Ergänzung ()

RealMax123 schrieb:
Und dann gibt es noch die ROPs, wo ich immer noch nicht verstehen was die ROPs genau sind.
Hattest du dir den Wikipedia Artikel dazu schonmal durchgelesen?
https://en.wikipedia.org/wiki/Render_output_unit
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: herrStreusalz und RealMax123
Rickmer schrieb:
Nicht nur die. Der SM/GPC Count schwankt ständig.

GB202: 16 SM/GPC
GB203: 12 SM/GPC
GB205: 10 SM/GPC
GB206: 12 SM/GPC
GB207: 10 SM/GPC
Abseits des GB202 könnte man das dadurch erklären das es perfekte Chips wo alle 12 SMs und RTCs nutzbar sind gibt, und eine B-Sortierung mit leicht teildefekten oder in perfekten Chips wo dann nur 10 von 12 vorhandenen SMs und RTCs genutzt werden, gibt.

Aber der GB202 mit 16 SMs und RTCs sprengt das Schema total.

Denn eine 12 von 16 oder sogar eine 10 von 16 Nutzung wäre schön ziemlich mau.
 
  • Gefällt mir
Reaktionen: herrStreusalz
Hier ist eine ziemlich gute Erklärung zu den abgeschalteten Einheiten des GB202 für die Verwendung in der RTX 5090:
 
RealMax123 schrieb:
Abseits des GB202 könnte man das dadurch erklären das es perfekte Chips wo alle 12 SMs und RTCs nutzbar sind gibt
Nein, weil das Whitepaper beschreibt was vor Teildeaktivierung physisch maximal vorhanden ist
 
  • Gefällt mir
Reaktionen: RealMax123
Zurück
Oben