GeForce RTX 4090D: Nvidia stellt das neue China-Topmodell offiziell vor

Fabian Vecellio del Monego
157 Kommentare
GeForce RTX 4090D: Nvidia stellt das neue China-Topmodell offiziell vor

Mit dem Inkrafttreten neuer Handelsrestriktionen der USA darf Nvidia nicht nur einige professionelle Lösungen, sondern auch die Gaming-Grafikkarte GeForce RTX 4090 seit Mitte November nicht mehr in China verkaufen. Jetzt tritt die bereits kolportierte RTX 4090D mit stärker kastrierter AD102-GPU in die Fußstapfen des Topmodells.

Eine kleinere RTX 4090 für China

Dass die offizielle Ankündigung wahrscheinlich am 28. Dezember erfolgen würde, das hatte die Gerüchteküche bereits vorhergesagt. Bislang ungeklärt war aber, inwiefern sich die GeForce RTX 4090D (D = „Dragon“) von der „klassischen“ GeForce RTX 4090 (Test), wie sie hierzulande weiter erhältlich ist und sein wird, unterscheidet. Zeitweise war im Gespräch, dass es lediglich bei der Speicherbandbreite – also der Anbindung zwischen Grafikprozessor und Grafikspeicher – und respektive oder bei den für KI-Berechnungen besonders relevanten Tensor Cores Einschnitte geben wird.

Neun Prozent weniger Kerne und ohne OC

Die jetzt von Nvidia veröffentlichten Spezifikationen zeichnen aber ein anderes Bild: Die Speicherbandbreite von 1.008 GB/s bleibt erhalten, der AD102-250 büßt aber im Vergleich zum AD102-300 insgesamt 14 Streaming-Multiprozessoren und damit 1.792 FP32-Ausführungseinheiten ein; das entspricht knapp 9 Prozent. Im Zuge dessen gehen auch 56 Tensor Cores verloren, sodass die GeForce RTX 4090D letztlich 114 SMs mit 14.592 FP32-ALUs und 456 Tensor Cores bietet. Die von Nvidia spezifizierte Leistungsaufnahme sinkt von 450 auf 425 Watt, obschon auch die GeForce RTX 4090 diesen Wert bei normaler Gaming-Last ohnehin nur sehr selten auszuschöpfen weiß.

Spezifikationen und Gerüchte zu GeForce RTX 40 im Überblick
RTX 4090 RTX 4090D*** RTX 4080 Super* RTX 4080** RTX 4070 Ti Super* RTX 4070 Ti** RTX 4070 Super* RTX 4070 RTX 4060 Ti RTX 4060
Architektur Ada Lovelace
GPU AD102 AD103 AD104 AD106 AD107
Fertigung TSMC 4N
Transistoren 76,3 Mrd. 45,9 Mrd. 35,8 Mrd. 22,9 Mrd. 18,9 Mrd.
Chipgröße 609 mm² 379 mm² 295 mm² 188 mm² 159 mm²
SM 128 114 80 76 66 60 56 46 34 24
FP32-ALUs 16.384 14.592 10.240 9.728 8.448 7.680 7.168 5.888 4.352 3.072
RT-Kerne 128, 3rd Gen 114, 3rd Gen 80, 3rd Gen 76, 3rd Gen 66, 3rd Gen 60, 3rd Gen 56, 3rd Gen 46, 3nd Gen 34, 3nd Gen 24, 3rd Gen
Tensor-Kerne 512, 4th Gen 456, 4th Gen 320, 4th Gen 304, 4th Gen 264, 4th Gen 240, 4th Gen 224, 4th Gen 184, 4th Gen 136, 4th Gen 96, 4th Gen
Base-Takt 2.230 MHz 2.280 MHz ? 2.210 MHz ? 2.310 MHz ? 1.920 MHz 2.310 MHz 1.830 MHz
Boost-Takt 2.520 MHz 2.510 MHz 2.610 MHz 2.475 MHz 2.535 MHz 2.460 MHz
FP32-Rechenleistung 82,6 TFLOPS ~75 TFLOPS 48,8 TFLOPS 40,1 TFLOPS 29,1 TFLOPS 22,1 TFLOPS 15,1 TFLOPS
FP16-Rechenleistung 82,6 TFLOPS ~75 TFLOPS 48,8 TFLOPS 40,1 TFLOPS 29,1 TFLOPS 22,1 TFLOPS 15,1 TFLOPS
FP16 über Tensor 330 TFLOPS ~300 TFLOPS 195 TFLOPS 160 TFLOPS 117 TFLOPS 88,3 TFLOPS 60,5 TFLOPS
Textureinheiten 512 456 320 304 264 240 224 184 136 96
ROPs 176 ? 112 ? 80 ? 64 48
L2-Cache 73.728 KB 65.536 KB 49.152 KB 36.864 KB 32.768 KB 24.576 KB
Speicher 24 GB GDDR6X 16 GB GDDR6X 12 GB GDDR6X 8 GB GDDR6
Speicherdurchsatz 21 Gbps 22,4–24 Gbps 22,4 Gbps 21 –22,4 Gbps 21 Gbps 18 Gbps 17 Gbps
Speicherinterface 384 Bit 256 Bit 192 Bit 128 Bit
Speicherbandbreite 1.008 GB/s ? 717 GB/s ? 504 GB/s 288 GB/s 272 GB/s
Slot-Anbindung PCIe 4.0 ×16 PCIe ×8
Video-Engine 2 × NVENC (8th Gen)
1 × NVDEC (5th Gen)
? 1 × NVENC (8th Gen)
1 × NVDEC (5th Gen)
TDP 450 Watt 425 Watt 320 Watt 285 Watt 225 Watt 200 Watt 160 Watt 115 Watt
Marktstart Okt. 2022 Dez. 2023 Jan. 2024 Nov. 2022 Jan. 2024 Jan. 2023 Jan. 2024 Apr. 2023 Mai 2023 Juni 2023
UVP 1.799 Euro 999–1.199 USD 1.329 Euro 799–849 USD 899 Euro 599–649 USD 659 Euro 439 Euro 329 Euro
*Angaben nicht offiziell bestätigt    **Produktion wird angeblich zeitnah eingestellt    ***Modell nur für den chinesischen Markt

Erwähnenswert ist zudem, dass Nvidia den Base-Takt zwar ein wenig anhebt, den Boost-Takt aber bei 2.520 MHz belässt – und ein Übertakten der GeForce RTX 4090D soll Gerüchten zufolge nicht möglich sein. Darauf deutet auch hin, dass Boardpartner bislang zwar schon zahlreiche Custom-Designs der „neuen“ Grafikkarte vorgestellt haben – die abseits der GPU weitestgehend denen der GeForce RTX 4090 entsprechen –, davon aber keines werkseitig übertaktet ist oder mit OC-Funktionen beworben wird. Offen bleibt derweil, ob Nvidia bei der RTX 4090D vielleicht auch den 73 MB großen L2-Cache und die ROPs beschnitten hat; davon ist aber nicht auszugehen.

Der Preis bleibt gleich, die Gaming-Leistung ähnlich

Benchmarks zur neuen Grafikkarte gibt es noch nicht. Unter Berücksichtigung der vergleichsweise schwachen Skalierung der GeForce RTX 4090 zur RTX 4080 – fast 70 Prozent mehr Kerne bringen selbst in UHD im Durchschnitt nur 33 Prozent mehr FPS – ist allerdings nicht davon auszugehen, dass 9 Prozent weniger Ausführungseinheiten voll auf die Leistung durchschlagen werden. Stattdessen ist damit zu rechnen, dass eine GeForce RTX 4090D in Spielen je nach verbauter CPU gleichwertig oder nur wenig schwächer abschneiden wird als eine „normale“ RTX 4090. Dass der Preis für chinesische Kunden laut Nvidia unverändert bleiben soll, mag daher nicht verwundern.