Nvidia Blackwell: RTX 5000 mit bis zu 512 Bit zwischen Fantasie und Wirklichkeit

Update Jan-Frederik Timm
317 Kommentare
Nvidia Blackwell: RTX 5000 mit bis zu 512 Bit zwischen Fantasie und Wirklichkeit

Der für die von ihm verbreiteten Nvidia-Gaming-GPU-Gerüchte bekannte X-Nutzer kopite7kimi sieht bisher keine Hinweise darauf, dass Nvidia die Blackwell-GPUs der RTX-5000-Generation mit einem breiteren Speicherinterface als den aktuellen 384 Bit der AD102-GPU ausstatten wird. Auch darunter soll es „nicht sehr anders“ zugehen.

Aktuell keine Hinweise auf 512 Bit

Die Fantasie eines bis zu 512 Bit breiten Interfaces sei ihm zwar noch nicht genommen worden, doch nach aktuellem Kenntnisstand wird es mit der nächsten Generation GeForce RTX bei maximal 384 Bit bleiben.

320 Bit: Bei RTX 4000 nicht genutzt

Dass es darunter „nicht sehr anders“ zugehen wird, lässt für die kleineren GPUs zwar Spielraum für Abweichungen vom aktuellen Schema, was 256 Bit für AD103, 192 Bit für AD104 und 128 Bit für AD106 sowie AD107 bedeutet, handfeste Details liefern kann kopite7kimi aber noch nicht – kein Wunder, dürfte Nvidia selbst doch noch keine finale Entscheidung zur konkreten Konfiguration der GPUs, die wiederum feststehen sollten, getroffen haben. Prominent von Nvidia genutzt wurde in der RTX-3000-Generation beispielsweise auch 320 Bit im Falle der GeForce RTX 3080.

Käme für RTX 5000 weiterhin GDDR6(X) zum Einsatz, würden unveränderte Speicherinterfaces bedeuten, dass auch die Speicherkapazitäten nicht angepasst werden könnten – denn ein oder zwei (per „Clamp Shell“ angebundene) Speichermodule müssten weiterhin über ein 32 Bit breites Interface an die GPU angeschlossen werden und GDDR6(X)-Module sind maximal 2 GB groß. Derzeit nutzt Nvidia nur bei der GeForce RTX 4060 Ti 16 GB den Clamp-Shell-Ansatz, der sofort zu einer Verdopplung der Speicherkapazität führt, von der portfolioweit jedoch nicht auszugehen ist.

Mit GDDR7 sind ab 2025 trotzdem höhere Kapazitäten drin

Beim kürzlich verabschiedeten GDDR7, dessen Einsatz für GeForce RTX 5000 gesichert ist, sollen ab 2025 allerdings auch 3 GB große Speicherchips verfügbar sein. Damit würden sich an unverändert breiten Speicher-Interfaces um 50 Prozent höhere Kapazitäten ergeben.

Micron-Roadmap mit HBM3, GDDR7 und 32-Gbit-DRAM
Micron-Roadmap mit HBM3, GDDR7 und 32-Gbit-DRAM (Bild: Micron)
Nvidia GeForce RTX 4000 – Spezifikationen
RTX 4090 RTX 4080 Super RTX 4080 RTX 4070 Ti Super RTX 4070 Ti RTX 4070 Super RTX 4070 RTX 4060 Ti RTX 4060
Architektur Ada Lovelace
GPU AD102 AD103 AD104 AD106 AD107
Fertigung TSMC 4N
Transistoren 76,3 Mrd. 45,9 Mrd. 35,8 Mrd. 22,9 Mrd. 18,9 Mrd.
Chipgröße 609 mm² 379 mm² 295 mm² 188 mm² 159 mm²
SM 128 80 76 66 60 56 46 34 24
FP32-ALUs 16.384 10.240 9.728 8.448 7.680 7.168 5.888 4.352 3.072
RT-Kerne 128, 3rd Gen 80, 3rd Gen 76, 3rd Gen 66, 3rd Gen 60, 3rd Gen 56, 3rd Gen 46, 3nd Gen 34, 3nd Gen 24, 3rd Gen
KI-Kerne 512, 4th Gen 320, 4th Gen 304, 4th Gen 264, 4th Gen 240, 4th Gen 224, 4th Gen 184, 4th Gen 136, 4th Gen 96, 4th Gen
Base-Takt 2.230 MHz 2.295 MHz 2.210 MHz 2.340 MHz 2.310 MHz 1.980 MHz 1.920 MHz 2.310 MHz 1.830 MHz
Boost-Takt 2.520 MHz 2.550 MHz 2.510 MHz 2.610 MHz 2.610 MHz 2.475 MHz 2.535 MHz 2.460 MHz
FP32-Leistung 82,6 TFLOPS 52,2 TFLOPS 48,8 TFLOPS 44,1 TFLOPS 40,1 TFLOPS 35,5 TFLOPS 29,1 TFLOPS 22,1 TFLOPS 15,1 TFLOPS
FP16-Leistung 82,6 TFLOPS 52,2 TFLOPS 48,8 TFLOPS 44,1 TFLOPS 40,1 TFLOPS 35,5 TFLOPS 29,1 TFLOPS 22,1 TFLOPS 15,1 TFLOPS
FP16-Leistung über Tensor 330 TFLOPS 209 TFLOPS 195 TFLOPS 176 TFLOPS 160 TFLOPS 142 TFLOPS 117 TFLOPS 88 TFLOPS 61 TFLOPS
Textureinheiten 512 320 304 264 240 224 184 136 96
ROPs 176 112 96 80 64 48
L2-Cache 73.728 KB 65.536 KB 49.152 KB 36.864 KB 32.768 KB 24.576 KB
Speicher 24 GB GDDR6X 16 GB GDDR6X 12 GB GDDR6X 8 GB GDDR6
 -durchsatz 21 Gbps 23 Gbps 22,4 Gbps 21 Gbps 18 Gbps 17 Gbps
 -interface 384 Bit 256 Bit 192 Bit 128 Bit
 -bandbreite 1.008 GB/s 736 GB/s 717 GB/s 672 GB/s 504 GB/s 288 GB/s 272 GB/s
Slot-Anbindung PCIe 4.0 ×16 PCIe 4.0 ×8
Video-Engine 2 × NVENC (8th Gen)
1 × NVDEC (5th Gen)
1 × NVENC (8th Gen)
1 × NVDEC (5th Gen)
TDP 450 Watt 320 Watt 285 Watt 220 Watt 200 Watt 160 Watt 115 Watt
Update

Vor zwei Tagen verbannte kopite7kimi Gaming-Blackwell mit 512 Bit breitem Speicherinterface ins Reich der Fantasie, nun soll diese Fantasie doch der Wirklichkeit entsprechen: Der große Chip für GeForce RTX „GB202“ soll doch über ein 512 Bit breites Speicherinterface verfügen. Zudem ist von Speicherchips mit 28 Gbit/s die Rede. Das würde eine sehr hohe Speicherbandbreite von knapp 1,8 TB/s bedeuten.

Analog der teils im Tagesrythmus widersprüchliche Mutmaßungen hervorbringenden Gerüchteküche im Vorfeld zu GeForce RTX 4000 im Jahr 2022 dürfte es auch in diesem Jahr nicht leicht sein, Gerüchte mit Substanz zum richtigen Zeitpunkt aufzugreifen. ComputerBase wird versuchen nicht jedem Informationshappen nachzujagen, aber nichtdestoweniger über die Geschehnisse in der Gerüchteküche zu berichten.