Probleme mit Nvme SSD

xJAMESx

Lt. Commander
Registriert
Feb. 2011
Beiträge
1.593
Hallo Zusammen!

Komplettes Setup:
AMD 7800x3d
Gigabyte B650 AORUS Pro AX
Corsair Dominator DDR5-6000 C36
EVGA RTX 3080
Seasonic Prime PX-1000w

SSDs:
NVME1: C: Samsung SSD 980 PRO 1TB (nvme slot 1)
SATA: D: Crucial_CT525MX300SSD1
SATA: E: SanDisk SSD PLUS 1000GB
NVME3: F: Samsung SSD 980 PRO 1TB (nvme slot 2)
NVME2: leer

Seit einigen Tagen habe ich immer wieder das Problem mit abstürzen.
Es scheint als wenn die Festplatte F (unterer nvme Slot) kurz nicht erkannt wird und weg ist.

Folgende Fehler sehe ich im Event Viewer:
A TCG Command has returned an error.
Desc: AuthenticateSession
Param1: 0x1
Param2: 0x60000001C
Param3: 0x900000006
Param4: 0x0
Status: 0x12

Bei einem Auslagerungsvorgang wurde ein Fehler festgestellt. Betroffen ist Gerät \Device\Harddisk2\DR2.
Die Daten konnten nicht in das Transaktionsprotokoll verschoben werden. Die Daten sind möglicherweise beschädigt: Volume-ID: F:, Gerätename: \Device\HarddiskVolume2.

Fehlerstatus: Ein nicht vorhandenes Gerät wurde angegeben.

Geräte-GUID: {a89762fd-fb55-ebbc-8b0c-3c992859821d}
Gerätehersteller:
Gerätemodell: Samsung SSD 980 PRO 1TB
Geräterevision: 5B2QGXA7
Seriennummer des Geräts: 0025_38B8_11C2_58EC.
Bustyp: NVMe

Seriennummer des Adapters: S5GXNF1R826800T _0006


Zuerst war eine ca 5 Jahre alte Crucial Nvme in Nvme Slot 2 verbaut.
Dachte erst das die SSD den Geist aufgibt, habe dann die neue SSD F: eingebaut und die alte Crucial ausgebaut.
Die Platte F: war im 2. Nvme Slot verbaut. Fehler ist wieder aufgetreten.
Ich dachte also, das das Problem an dem nvme slot 2 lag, habe also die neue SSD F: in den 3. Slot verbaut.

Selber Fehler ist wieder aufgetreten.

Was denkt ihr was hier das Problem sein könnte?

Memtest86+ lief durch und prime ebenfalls keine fehler nach mehreren Stunden.
 
Zuletzt bearbeitet:
xJAMESx schrieb:
Memtest86+ lief durch und prime ebenfalls keine fehler nach mehreren Stunden.
Und was sagen die SMART-Werte der Platten?
Ist doch viel wichtiger.
 
Sind im Anhang
 

Anhänge

  • 1702584778953.png
    1702584778953.png
    44,2 KB · Aufrufe: 94
  • 1702584787600.png
    1702584787600.png
    53,8 KB · Aufrufe: 94
  • 1702584797092.png
    1702584797092.png
    53,8 KB · Aufrufe: 83
  • 1702584803622.png
    1702584803622.png
    44 KB · Aufrufe: 93
  • Gefällt mir
Reaktionen: Skudrinka
Die SSDs sehen gesund aus.
Gu könntest noch die Seriennummern aus den Screenshots entfernen.



Du könntest die betroffene NVMe-SSD im UEFI auf "PCIe Gen 3.0" fixieren. Vielleicht hilft das.

Gibt's evtl. einen Umschalter im UEFI für den 3. M.2-Slot?
Bei einigen Mainboards werden die "M.2" PCIe-Ports mit den "normalen" PCIe-Ports geteilt.
 
Tanzmusikus schrieb:
Die SSDs sehen gesund aus.
Gu könntest noch die Seriennummern aus den Screenshots entfernen.



Du könntest die betroffene NVMe-SSD im UEFI auf "PCIe Gen 3.0" fixieren. Vielleicht hilft das.

Gibt's evtl. einen Umschalter im UEFI für den 3. Slot?
Bei einigen Mainboards werden die "M.2" PCIe-Ports mit den "normalen" PCIe-Ports geteilt.
Also das System lief Monatelang stabil. Hatte anfangs andere Crashes, aber seit gut 2 Monaten ruhe weil ich den Ram auf 5800Mhz runter getaktet habe.
Diese SSD Probleme kamen aus dem nichts. BIOS Update hat leider auch keine Verbesserung gebracht.
Kenne dieses verhalten eigentlich von sterbenden SSD's. Aber die neue hat in beiden Slots das selbe verhalten.

Ich würde auf einen Mainboard defekt tippen, wollte aber mal nachfragen ob jemand evtl schonmal ähnliches hatte.
Mainboard wäre ja kein Problem, da RMA (System ist von Anfang des Jahres.)
 
xJAMESx schrieb:
Ich würde auf einen Mainboard defekt tippen
Könnte sein.

Hattest Du nach dem UEFI-Update die UEFI-Defaults geladen?

Deaktiviere mal testweise das XMP für deinen RAM.
 
Befindet sich ein Gerät im PCIe-Slot 4 (der ist nämlich "shared" mit dem M.2-Port "M2C_SB")?

Nutzt Du momentan UEFI-Version F20a oder F8?
 

Anhänge

  • Bildschirmfoto vom 2023-12-14 21-48-18.png
    Bildschirmfoto vom 2023-12-14 21-48-18.png
    51,2 KB · Aufrufe: 46
Zuletzt bearbeitet:
Dann ist das PCIe-Kabel defekt - bitte austauschen! :hammer_alt:

:D . . . S c h e r z !!



Vielleicht braucht der SB-Chipsatz einfach ein bisschen mehr Spannung ..?
Wenn's aber beim CPU-PCIe-M.2 auch vorkommt, dann kämen ja CPU, MB, NVMe oder RAM in Frage.
Manchmal reichen da schon Haarrisse im PCB des Boards für Fehler aus.

Teste mal die Ideen aus meinen vorigen Posts #4 & #6 aus bevor Du vielleicht aufgibst & das Board zurücksendest!



Aktueller AMD Chipsatz-Treiber ist installiert?

"PCIEX4"-Port (siehe Screenshot gaaanz unten) ist unbenutzt?

Irgendwelcher OC-Kram im UEFI aktiv?

Irgendein/e Gigabyte-App/Tool im System installiert?

Wie sieht's mit Linux aus - funktionieren damit alle Datenträger?

Unter Windows:
SFC /SCANNOW in die Kommando-Zeile (CMD) mit Admin-Rechten eingeben & Fehler reparieren lassen.
 

Anhänge

  • Bildschirmfoto vom 2023-12-14 22-27-41.png
    Bildschirmfoto vom 2023-12-14 22-27-41.png
    57,1 KB · Aufrufe: 47
Zuletzt bearbeitet:
Wie gesagt, das Problem tritt mal alle 1-2 Tage, mal alle 4 Tage auf.
Immer nur beim Zocken von der SSD.

sfc /scannow, sowie die Windows Datenträger Fehlerbehebung liefen auch schon.
Ich kann das leider nicht nachstellen, grad mehrmals Crystaldiskmark laufen gelassen sieht alles ok aus auch keine Crashes oder Fehler.
Temp der SSD ist auch fine (53°).

Mein System ist neu installiert vor ca 3 Monaten. Habe keine Gigabyte Tools drauf.
Ein anderer PCI Port wird nicht genutzt, nur GPU.

Keinerlei OC aktiv (nur EXPO) auf 5800Mhz.
Chipset Treiber sind auch aktuell.


Mittlerweile kann ich nicht mal mehr die Temperatur und sonst irgendwas von der SSD auslesen :-D
1702591055880.png

Trotz last mit Crystalmark
Ergänzung ()

Also gerade ist der Rechner auch gecrasht mit bluescreen, obwohl das Game auf C lag.
Leider ohne Abbild.

Also fassen wir zusammen:
Memtest läuft fehlerfrei durch.
Prime95 läuft ebenfalls mehrere Stunden mit Fehlerfrei durch.

Bei last auf den NVMe's crasht das System.

Was würdet ihr machen? Neues Board kaufen und ggf. zurück schicken, falls es nicht das Problem war?
Oder eher auf Ram setzen?

Ich teste gerade das alte BIOS F7 sowie die PCIx4 lanes auf gen3.

Update: Gerade gecrasht...
Das Problem verschlimmert sich definitiv. Sobald last auf einer der beides SSD's sind crasht das System.
 
Zuletzt bearbeitet:
Es scheinen wirklich nur die unteren beiden nvme Slots betroffen zu sein.
Crystaldiskmark auf C: -> keine Probleme
Mache ich das auf F: (NVME_C oder NVME_B) crasht das system.
NVME_A und _B hängen beide an der CPU lane, keine Ahnung wieso der Slot läuft. Aber NVME_B nicht

Es macht auch kein unterschied welche nvme verbaut ist. Sobald eine nvme unten drin steckt crasht alles bei last.

Ich hab genug ausprobiert und getestet um ein SSD defekt auszuschließen, inklusive diese nvme in einem anderen Rechner getestet.

Bevor ich jetzt weiter Stundenlang auf Fehlersuche gehe, hole ich mir lieber ein neues board + ram und starte eine RMA für Board + Ram. Der ram ist ja auch nicht mehr wirklich brauchbar, da expo profil überschrieben.
 
  • Gefällt mir
Reaktionen: Tanzmusikus
Ich würde auf jeden Fall alles updaten, was noch nicht gemacht wurde.
  • UEFI/BIOS
  • Chipsatztreiber
  • AHCI-Treiber
  • Firmware aller SSDs und NVMEs

Dazu im BIOS alle PCIe-Schalter von AUTO auf die Werte der angeschlossenen Komponenten (Graka / NVME) auf 4.0.

Dass ein MB-Defekt vorliegt, ist eher unwahrscheinlich.
Da die Platte in Slot 2 und 3 crasht, die ja unterschiedlich angesteuert werden (2 über CPU, 3 über Chipsatz) und der Fehler bevorzugt in Spielen kam, vermute ich, dass es an der Wärmeentwicklung der Grafikkarte liegt. Beide Ports liegen ja direkt im "Abgasstrahl".

Teste doch mal mit Framelimit (max. FPS im Treiber auf GPU-Load 70% im Game).
Die Karte rennt dann nicht voll und bleibt deutlich Kühler.
 
  • Gefällt mir
Reaktionen: Tanzmusikus
Sandolo schrieb:
Ich würde auf jeden Fall alles updaten, was noch nicht gemacht wurde.
  • UEFI/BIOS
  • Chipsatztreiber
  • AHCI-Treiber
  • Firmware aller SSDs und NVMEs

Dazu im BIOS alle PCIe-Schalter von AUTO auf die Werte der angeschlossenen Komponenten (Graka / NVME) auf 4.0.

Dass ein MB-Defekt vorliegt, ist eher unwahrscheinlich.
Da die Platte in Slot 2 und 3 crasht, die ja unterschiedlich angesteuert werden (2 über CPU, 3 über Chipsatz) und der Fehler bevorzugt in Spielen kam, vermute ich, dass es an der Wärmeentwicklung der Grafikkarte liegt. Beide Ports liegen ja direkt im "Abgasstrahl".

Teste doch mal mit Framelimit (max. FPS im Treiber auf GPU-Load 70% im Game).
Die Karte rennt dann nicht voll und bleibt deutlich Kühler.
Alles schon updated ohne erfolge :-/
Ich kann das Problem auch auf dem Desktop nachstellen mit Crystaldiskmark. Ohne GPU Last.
BTW: Ich zocke WoW, meine GPU hängt da irgendwie bei 40% rum, lüfter aus.
 
Zurück
Oben