Nvidia Blackwell: RTX 5000 mit bis zu 512 Bit zwischen Fantasie und Wirklichkeit

Update 9.3.2024 10:55 Uhr

Der für die von ihm verbreiteten Nvidia-Gaming-GPU-Gerüchte bekannte X-Nutzer kopite7kimi sieht bisher keine Hinweise darauf, dass Nvidia die Blackwell-GPUs der RTX-5000-Generation mit einem breiteren Speicherinterface als den aktuellen 384 Bit der AD102-GPU ausstatten wird. Auch darunter soll es „nicht sehr anders“ zugehen.

Aktuell keine Hinweise auf 512 Bit

Die Fantasie eines bis zu 512 Bit breiten Interfaces sei ihm zwar noch nicht genommen worden, doch nach aktuellem Kenntnisstand wird es mit der nächsten Generation GeForce RTX bei maximal 384 Bit bleiben.

Although I still have fantasies about 512 bit, the memory interface configuration of GB20x is not much different from that of AD10x.
— kopite7kimi (@kopite7kimi) March 9, 2024

320 Bit: Bei RTX 4000 nicht genutzt

Dass es darunter „nicht sehr anders“ zugehen wird, lässt für die kleineren GPUs zwar Spielraum für Abweichungen vom aktuellen Schema, was 256 Bit für AD103, 192 Bit für AD104 und 128 Bit für AD106 sowie AD107 bedeutet, handfeste Details liefern kann kopite7kimi aber noch nicht – kein Wunder, dürfte Nvidia selbst doch noch keine finale Entscheidung zur konkreten Konfiguration der GPUs, die wiederum feststehen sollten, getroffen haben. Prominent von Nvidia genutzt wurde in der RTX-3000-Generation beispielsweise auch 320 Bit im Falle der GeForce RTX 3080.

Käme für RTX 5000 weiterhin GDDR6(X) zum Einsatz, würden unveränderte Speicherinterfaces bedeuten, dass auch die Speicherkapazitäten nicht angepasst werden könnten – denn ein oder zwei (per „Clamp Shell“ angebundene) Speichermodule müssten weiterhin über ein 32 Bit breites Interface an die GPU angeschlossen werden und GDDR6(X)-Module sind maximal 2 GB groß. Derzeit nutzt Nvidia nur bei der GeForce RTX 4060 Ti 16 GB den Clamp-Shell-Ansatz, der sofort zu einer Verdopplung der Speicherkapazität führt, von der portfolioweit jedoch nicht auszugehen ist.

Mit GDDR7 sind ab 2025 trotzdem höhere Kapazitäten drin

Beim kürzlich verabschiedeten GDDR7, dessen Einsatz für GeForce RTX 5000 gesichert ist, sollen ab 2025 allerdings auch 3 GB große Speicherchips verfügbar sein. Damit würden sich an unverändert breiten Speicher-Interfaces um 50 Prozent höhere Kapazitäten ergeben.

Micron-Roadmap mit HBM3, GDDR7 und 32-Gbit-DRAM (Bild: Micron)

Nvidia GeForce RTX 4000 – Spezifikationen

	RTX 4090	RTX 4080 Super	RTX 4080	RTX 4070 Ti Super	RTX 4070 Ti	RTX 4070 Super	RTX 4070	RTX 4060 Ti	RTX 4060
Architektur	Ada Lovelace
GPU	AD102	AD103			AD104			AD106	AD107
Fertigung	TSMC 4N
Transistoren	76,3 Mrd.	45,9 Mrd.			35,8 Mrd.			22,9 Mrd.	18,9 Mrd.
Chipgröße	609 mm²	379 mm²			295 mm²			188 mm²	159 mm²
SM	128	80	76	66	60	56	46	34	24
FP32-ALUs	16.384	10.240	9.728	8.448	7.680	7.168	5.888	4.352	3.072
RT-Kerne	128, 3rd Gen	80, 3rd Gen	76, 3rd Gen	66, 3rd Gen	60, 3rd Gen	56, 3rd Gen	46, 3nd Gen	34, 3nd Gen	24, 3rd Gen
KI-Kerne	512, 4th Gen	320, 4th Gen	304, 4th Gen	264, 4th Gen	240, 4th Gen	224, 4th Gen	184, 4th Gen	136, 4th Gen	96, 4th Gen
Base-Takt	2.230 MHz	2.295 MHz	2.210 MHz	2.340 MHz	2.310 MHz	1.980 MHz	1.920 MHz	2.310 MHz	1.830 MHz
Boost-Takt	2.520 MHz	2.550 MHz	2.510 MHz	2.610 MHz	2.610 MHz	2.475 MHz		2.535 MHz	2.460 MHz
FP32-Leistung	82,6 TFLOPS	52,2 TFLOPS	48,8 TFLOPS	44,1 TFLOPS	40,1 TFLOPS	35,5 TFLOPS	29,1 TFLOPS	22,1 TFLOPS	15,1 TFLOPS
FP16-Leistung	82,6 TFLOPS	52,2 TFLOPS	48,8 TFLOPS	44,1 TFLOPS	40,1 TFLOPS	35,5 TFLOPS	29,1 TFLOPS	22,1 TFLOPS	15,1 TFLOPS
FP16-Leistung über Tensor	330 TFLOPS	209 TFLOPS	195 TFLOPS	176 TFLOPS	160 TFLOPS	142 TFLOPS	117 TFLOPS	88 TFLOPS	61 TFLOPS
Textureinheiten	512	320	304	264	240	224	184	136	96
ROPs	176	112		96	80		64	48
L2-Cache	73.728 KB	65.536 KB		49.152 KB			36.864 KB	32.768 KB	24.576 KB
Speicher	24 GB GDDR6X	16 GB GDDR6X			12 GB GDDR6X			8 GB GDDR6
-durchsatz	21 Gbps	23 Gbps	22,4 Gbps	21 Gbps				18 Gbps	17 Gbps
-interface	384 Bit	256 Bit			192 Bit			128 Bit
-bandbreite	1.008 GB/s	736 GB/s	717 GB/s	672 GB/s	504 GB/s			288 GB/s	272 GB/s
Slot-Anbindung	PCIe 4.0 ×16							PCIe 4.0 ×8
Video-Engine	2 × NVENC (8th Gen) 1 × NVDEC (5th Gen)					1 × NVENC (8th Gen) 1 × NVDEC (5th Gen)
TDP	450 Watt	320 Watt		285 Watt		220 Watt	200 Watt	160 Watt	115 Watt

Update 11.03.2024 08:52 Uhr

Vor zwei Tagen verbannte kopite7kimi Gaming-Blackwell mit 512 Bit breitem Speicherinterface ins Reich der Fantasie, nun soll diese Fantasie doch der Wirklichkeit entsprechen: Der große Chip für GeForce RTX „GB202“ soll doch über ein 512 Bit breites Speicherinterface verfügen. Zudem ist von Speicherchips mit 28 Gbit/s die Rede. Das würde eine sehr hohe Speicherbandbreite von knapp 1,8 TB/s bedeuten.

I think my persistence is correct. So the difference is that GB202 is 512-bit and AD102 is 384-bit.
— kopite7kimi (@kopite7kimi) March 11, 2024

Analog der teils im Tagesrythmus widersprüchliche Mutmaßungen hervorbringenden Gerüchteküche im Vorfeld zu GeForce RTX 4000 im Jahr 2022 dürfte es auch in diesem Jahr nicht leicht sein, Gerüchte mit Substanz zum richtigen Zeitpunkt aufzugreifen. ComputerBase wird versuchen nicht jedem Informationshappen nachzujagen, aber nichtdestoweniger über die Geschehnisse in der Gerüchteküche zu berichten.

CB-Funk Podcast #170: FSR 4 für RDNA 2+3 und 300-Euro-Grafikkarten im Vergleich mit Fabian und Jan-Frederik