3DCenter berichtet über angeblichen VRAM Fehler der 970

gmc · 23. Januar 2015

Nai schrieb:
Die kaputten Laufzeiten kommen bei dir daher, dass ich nur CUDA-Code für Titan und aufwärts in der Exe beigelgt habe.

Bei Fermi zeigt es auch zu hoch an. Was sagst du eigentlich zum unterschiedlichen VRAM Verhalten auf den letzten 500 MB? Die letzten 4 chunks sind arg langsam, gerade mal auf DDR3 Niveau.

Fragesteller · 23. Januar 2015

Die letzten 4 chunks sind arg langsam, gerade mal auf DDR3 Niveau

Das ist der 3,5GB Bug der 970er

gmc · 23. Januar 2015

Ja das ist klar. Ich meine woran liegt das, lässt sich das genauer auslesen mit CUDA?

hübie · 23. Januar 2015

Liest niemand meine Antworten?

OiOlli · 23. Januar 2015

Ist der Fehler jetzt sicher?

hübie · 23. Januar 2015

Sicher ist gar nichts. Da nVidia auch mit die schlechtesten Dokus erstellt die frei zugänglich sind kann man da auch nichts eingrenzen.
Ich habe zwar die Möglichkeit an detaillierte Unterlagen zu kommen, aber es ist mir den Aufwand nicht wert und außerdem bin ich kein Programmierer um das dann gezielt herauszufinden

gmc · 23. Januar 2015

Sind 3840 Mibyte 4000MB oder wie funktioniert die Rechnung?

sethdiabolos · 24. Januar 2015

Da 1 MiByte ja 1024Kilobyte sein müssten kann man ja 3840x1,024 rechnen. Dann kommt man effektiv auf 3932MB. Bin mir aber nicht 100% sicher obs so richtig ist.

t3chn0 · 24. Januar 2015

Nai, du bist berühmt! =D.... dein Benchmark wurde bei Linus gezeigt....!

gmc · 24. Januar 2015

SethDiabolos schrieb:
Da 1 MiByte ja 1024Kilobyte sein müssten kann man ja 3840x1,024 rechnen. Dann kommt man effektiv auf 3932MB. Bin mir aber nicht 100% sicher obs so richtig ist.

Fehlt dann nicht ein Chunk bei der Berechnung? Müsste doch dann bis Chunk 30 gehen um die vollen 4096MB auszunutzen oder?

t3chn0 schrieb:
Nai, du bist berühmt! =D.... dein Benchmark wurde bei Linus gezeigt....!

Auch noch mit meinem GTX 970 Resultat. Ja mittlerweile sind englische Foren auf das Nai Programm aufmerksam geworden.

Nai · 24. Januar 2015

AW: 3DCenter berichtet über angeblichen VRAM Fehler der 970
Nai, du bist berühmt! =D.... dein Benchmark wurde bei Linus gezeigt....!

Und das obwohl ich das Benchmark extrem einfach gestaltet und ohne viel Aufwand in 30 Minuten geschrieben habe. Unter anderem deshalb stehe ich ihn relativ kritisch gegenüber (siehe vorherige Posts). Bedauerlicherweise übernehmen viele Leute das Benchmark unreflektiert und ohne Erläuterungen.

Ich glaube die Geister die ich rief werde ich nicht mehr los. . .
Wie gut, dass ein Account ist, den eh niemand kennt

Sind 3840 Mibyte 4000MB oder wie funktioniert die Rechnung?

Der Speicherplatz deiner GPU ist auch in MiByte angegeben, sogar wenn man meist nur MByte liest.

Bei Fermi zeigt es auch zu hoch an. Was sagst du eigentlich zum unterschiedlichen VRAM Verhalten auf den letzten 500 MB? Die letzten 4 chunks sind arg langsam, gerade mal auf DDR3 Niveau.

Diese "kaputten Laufzeiten" war auf die angezeigte Speicherbandbreite von 234234234324234 Gigabyte/s bei Fermis bezogen. Die sind bei dem Benchmark mit nem Fermi entstanden, weil ich vergessen habe die Benchmarkprogramme für die Karten der Fermi-Generation beizulgen. Das habe ich in neueren Versionen gefixt.

Und was ich dazu denke, habe ich schon einmal geschrieben. Eventuell schreibe ich es nachher etwas ausführlicher (bin gerade zu müde um mich zu konzentrieren und gehe deshalb jetzt schlafen), wenn ich ausgeschlafen bin (das sollte in 12 Stunden heute Abend sein).

Fehlt dann nicht ein Chunk bei der Berechnung? Müsste doch dann bis Chunk 30 gehen um die vollen 4096MB auszunutzen oder?

Das Benchmark alloziert so viel Speicher bis die CUDA-Fehlermeldung kommt, dass die Allokation wegen zu wenig Speicher fehlgeschlagen ist. Daher kommt der Unterschied zu stande. Ich könnte das noch einmal verbessern, indem ich dem Benchmark einprogrammiere, dass es dann für den letzten Chunk weniger Speicherplatz allozieren sollte. Das war mir dann aber zu viel Aufwand für so ne "Kleinigkeit"

BlauX · 24. Januar 2015

Telefone sind schon was feines. Hat sich das ja gelohnt gestern Nacht. Kein bock mehr auf diese deutsche Presse hier.

SuddenDeathStgt · 24. Januar 2015

Ich glaube die Geister die ich rief werde ich nicht mehr los. . .

Holt schon mal das trockene Holz & "verbrennt IHN" ....Duck & weg u. sorry für das Witzle ...

Dai6oro · 24. Januar 2015

Die ersten Hardwaremagazine sind jetzt auch an dem Thema dran:

http://www.guru3d.com/news-story/does-the-geforce-gtx-970-have-a-memory-allocation-bug.html
http://www.extremetech.com/extreme/198214-198214

Lübke82 · 24. Januar 2015

Kann denn mal keiner Watch Dogs auf Ultra HD mit Ultradetails anschalten und schauen wie hoch die Speicherlast ist? Mit meiner GTX 980 bin ich über 3,9 GB. Etwas Platz muss ja immer dasein wegen Datenauslagerung nehm ich mal an.

BlauX · 24. Januar 2015

Lies nochmal. Darum gehts nicht. Es geht um die Bandbreite die bei der 970 über 3,5Gb zusammen kracht, und NICHT darum, dass die 4GB nicht belegt werden können.

ViennaDC · 24. Januar 2015

Das wurde von Nvidia sicher mit Absicht gemacht sonst wäre die 980er noch unattraktiver!
Denn Treiber versucht bei 970er Karten die Spiele immer unter die 3,5GB zu drücken.
Bei mir bricht ab 3.3GB die Framerate ein.

expresscafe · 24. Januar 2015

Ich habe bei mir folgendes Resultat, was deutlich schlechter ausfällt als bei anderen:

Nai's Benchmark
Allocating Memory . . .
Chunk Size = 128 MiByte
Drücken Sie eine beliebige Taste . . .
Allocated 30 Chunks
Allocated 3840 MiByte
Benchmarking DRAM
Drücken Sie eine beliebige Taste . . .
DRAM-Bandwidth of Chunk no. 0 (0 MiByte to 128 MiByte): 154 GByte/s
DRAM-Bandwidth of Chunk no. 1 (128 MiByte to 256 MiByte): 154 GByte/s
DRAM-Bandwidth of Chunk no. 2 (256 MiByte to 384 MiByte): 154 GByte/s
DRAM-Bandwidth of Chunk no. 3 (384 MiByte to 512 MiByte): 154 GByte/s
DRAM-Bandwidth of Chunk no. 4 (512 MiByte to 640 MiByte): 148 GByte/s
DRAM-Bandwidth of Chunk no. 5 (640 MiByte to 768 MiByte): 154 GByte/s
DRAM-Bandwidth of Chunk no. 6 (768 MiByte to 896 MiByte): 148 GByte/s
DRAM-Bandwidth of Chunk no. 7 (896 MiByte to 1024 MiByte): 154 GByte/s
DRAM-Bandwidth of Chunk no. 8 (1024 MiByte to 1152 MiByte): 148 GByte/s
DRAM-Bandwidth of Chunk no. 9 (1152 MiByte to 1280 MiByte): 154 GByte/s
DRAM-Bandwidth of Chunk no. 10 (1280 MiByte to 1408 MiByte): 154 GByte/s
DRAM-Bandwidth of Chunk no. 11 (1408 MiByte to 1536 MiByte): 150 GByte/s
DRAM-Bandwidth of Chunk no. 12 (1536 MiByte to 1664 MiByte): 154 GByte/s
DRAM-Bandwidth of Chunk no. 13 (1664 MiByte to 1792 MiByte): 149 GByte/s
DRAM-Bandwidth of Chunk no. 14 (1792 MiByte to 1920 MiByte): 154 GByte/s
DRAM-Bandwidth of Chunk no. 15 (1920 MiByte to 2048 MiByte): 148 GByte/s
DRAM-Bandwidth of Chunk no. 16 (2048 MiByte to 2176 MiByte): 154 GByte/s
DRAM-Bandwidth of Chunk no. 17 (2176 MiByte to 2304 MiByte): 148 GByte/s
DRAM-Bandwidth of Chunk no. 18 (2304 MiByte to 2432 MiByte): 154 GByte/s
DRAM-Bandwidth of Chunk no. 19 (2432 MiByte to 2560 MiByte): 148 GByte/s
DRAM-Bandwidth of Chunk no. 20 (2560 MiByte to 2688 MiByte): 22 GByte/s
DRAM-Bandwidth of Chunk no. 21 (2688 MiByte to 2816 MiByte): 22 GByte/s
DRAM-Bandwidth of Chunk no. 22 (2816 MiByte to 2944 MiByte): 148 GByte/s
DRAM-Bandwidth of Chunk no. 23 (2944 MiByte to 3072 MiByte): 27 GByte/s
DRAM-Bandwidth of Chunk no. 24 (3072 MiByte to 3200 MiByte): 27 GByte/s
DRAM-Bandwidth of Chunk no. 25 (3200 MiByte to 3328 MiByte): 46 GByte/s
DRAM-Bandwidth of Chunk no. 26 (3328 MiByte to 3456 MiByte): 154 GByte/s
DRAM-Bandwidth of Chunk no. 27 (3456 MiByte to 3584 MiByte): 29 GByte/s
DRAM-Bandwidth of Chunk no. 28 (3584 MiByte to 3712 MiByte): 16 GByte/s
DRAM-Bandwidth of Chunk no. 29 (3712 MiByte to 3840 MiByte): 29 GByte/s
Drücken Sie eine beliebige Taste . . .
Benchmarking L2-Cache
Drücken Sie eine beliebige Taste . . .
L2-Cache-Bandwidth of Chunk no. 0 (0 MiByte to 128 MiByte): 360 GByte/s
L2-Cache-Bandwidth of Chunk no. 1 (128 MiByte to 256 MiByte): 371 GByte/s
L2-Cache-Bandwidth of Chunk no. 2 (256 MiByte to 384 MiByte): 360 GByte/s
L2-Cache-Bandwidth of Chunk no. 3 (384 MiByte to 512 MiByte): 360 GByte/s
L2-Cache-Bandwidth of Chunk no. 4 (512 MiByte to 640 MiByte): 371 GByte/s
L2-Cache-Bandwidth of Chunk no. 5 (640 MiByte to 768 MiByte): 360 GByte/s
L2-Cache-Bandwidth of Chunk no. 6 (768 MiByte to 896 MiByte): 360 GByte/s
L2-Cache-Bandwidth of Chunk no. 7 (896 MiByte to 1024 MiByte): 371 GByte/s
L2-Cache-Bandwidth of Chunk no. 8 (1024 MiByte to 1152 MiByte): 360 GByte/s
L2-Cache-Bandwidth of Chunk no. 9 (1152 MiByte to 1280 MiByte): 360 GByte/s
L2-Cache-Bandwidth of Chunk no. 10 (1280 MiByte to 1408 MiByte): 371 GByte/s
L2-Cache-Bandwidth of Chunk no. 11 (1408 MiByte to 1536 MiByte): 371 GByte/s
L2-Cache-Bandwidth of Chunk no. 12 (1536 MiByte to 1664 MiByte): 359 GByte/s
L2-Cache-Bandwidth of Chunk no. 13 (1664 MiByte to 1792 MiByte): 363 GByte/s
L2-Cache-Bandwidth of Chunk no. 14 (1792 MiByte to 1920 MiByte): 371 GByte/s
L2-Cache-Bandwidth of Chunk no. 15 (1920 MiByte to 2048 MiByte): 359 GByte/s
L2-Cache-Bandwidth of Chunk no. 16 (2048 MiByte to 2176 MiByte): 360 GByte/s
L2-Cache-Bandwidth of Chunk no. 17 (2176 MiByte to 2304 MiByte): 370 GByte/s
L2-Cache-Bandwidth of Chunk no. 18 (2304 MiByte to 2432 MiByte): 399 GByte/s
L2-Cache-Bandwidth of Chunk no. 19 (2432 MiByte to 2560 MiByte): 402 GByte/s
L2-Cache-Bandwidth of Chunk no. 20 (2560 MiByte to 2688 MiByte): 66 GByte/s
L2-Cache-Bandwidth of Chunk no. 21 (2688 MiByte to 2816 MiByte): 66 GByte/s
L2-Cache-Bandwidth of Chunk no. 22 (2816 MiByte to 2944 MiByte): 399 GByte/s
L2-Cache-Bandwidth of Chunk no. 23 (2944 MiByte to 3072 MiByte): 80 GByte/s
L2-Cache-Bandwidth of Chunk no. 24 (3072 MiByte to 3200 MiByte): 81 GByte/s
L2-Cache-Bandwidth of Chunk no. 25 (3200 MiByte to 3328 MiByte): 135 GByte/s
L2-Cache-Bandwidth of Chunk no. 26 (3328 MiByte to 3456 MiByte): 428 GByte/s
L2-Cache-Bandwidth of Chunk no. 27 (3456 MiByte to 3584 MiByte): 31 GByte/s
L2-Cache-Bandwidth of Chunk no. 28 (3584 MiByte to 3712 MiByte): 16 GByte/s
L2-Cache-Bandwidth of Chunk no. 29 (3712 MiByte to 3840 MiByte): 427 GByte/s
Drücken Sie eine beliebige Taste . . .

Man beachte, dass ich selbst zwischen 2,5GByte und 2,8GByte drastische einbußen habe.

Habe eine Gigabyte Gaming G1 GTX970

t3chn0 · 24. Januar 2015

Oh, das ist sehr interessant und auch sehr ungewöhnlich.

Könntest du mal den Rest deines Systems nennen? Auch OS und Treiber Version etc.

gmc · 24. Januar 2015

Nai schrieb:
Und das obwohl ich das Benchmark extrem einfach gestaltet und ohne viel Aufwand in 30 Minuten geschrieben habe. Unter anderem deshalb stehe ich ihn relativ kritisch gegenüber (siehe vorherige Posts). Bedauerlicherweise übernehmen viele Leute das Benchmark unreflektiert und ohne Erläuterungen.
Ich glaube die Geister die ich rief werde ich nicht mehr los. . .
Wie gut, dass ein Account ist, den eh niemand kennt

Im Guru3d Forum hat jemand deinen Code für gut empfunden und ihn leicht modifiziert. Sieht also gut aus. Die meisten kapieren nur nicht, dass man für Benchmarks ohne WDDM Einfluss mit seiner iGPU hoch booten muss.

3DCenter berichtet über angeblichen VRAM Fehler der 970

Ensign

Commander

Ensign

Lt. Commander

Commander

Lt. Commander

Ensign

Commodore

Admiral

Anhänge

Ensign

Lt. Commander

BlauX

Gast

Banned

Admiral

Lübke82

Gast

BlauX

Gast

Lt. Junior Grade

Cadet 1st Year

Admiral

Ensign

Ähnliche Themen