Probleme mit Nvme SSD

xJAMESx · 14. Dezember 2023

Hallo Zusammen!

Komplettes Setup:
AMD 7800x3d
Gigabyte B650 AORUS Pro AX
Corsair Dominator DDR5-6000 C36
EVGA RTX 3080
Seasonic Prime PX-1000w

SSDs:
NVME1: C: Samsung SSD 980 PRO 1TB (nvme slot 1)
SATA: D: Crucial_CT525MX300SSD1
SATA: E: SanDisk SSD PLUS 1000GB
NVME3: F: Samsung SSD 980 PRO 1TB (nvme slot 2)
NVME2: leer

Seit einigen Tagen habe ich immer wieder das Problem mit abstürzen.
Es scheint als wenn die Festplatte F (unterer nvme Slot) kurz nicht erkannt wird und weg ist.

Folgende Fehler sehe ich im Event Viewer:

A TCG Command has returned an error.
Desc: AuthenticateSession
Param1: 0x1
Param2: 0x60000001C
Param3: 0x900000006
Param4: 0x0
Status: 0x12

Bei einem Auslagerungsvorgang wurde ein Fehler festgestellt. Betroffen ist Gerät \Device\Harddisk2\DR2.

Die Daten konnten nicht in das Transaktionsprotokoll verschoben werden. Die Daten sind möglicherweise beschädigt: Volume-ID: F:, Gerätename: \Device\HarddiskVolume2.

Fehlerstatus: Ein nicht vorhandenes Gerät wurde angegeben.

Geräte-GUID: {a89762fd-fb55-ebbc-8b0c-3c992859821d}
Gerätehersteller:
Gerätemodell: Samsung SSD 980 PRO 1TB
Geräterevision: 5B2QGXA7
Seriennummer des Geräts: 0025_38B8_11C2_58EC.
Bustyp: NVMe

Seriennummer des Adapters: S5GXNF1R826800T _0006

Zuerst war eine ca 5 Jahre alte Crucial Nvme in Nvme Slot 2 verbaut.
Dachte erst das die SSD den Geist aufgibt, habe dann die neue SSD F: eingebaut und die alte Crucial ausgebaut.
Die Platte F: war im 2. Nvme Slot verbaut. Fehler ist wieder aufgetreten.
Ich dachte also, das das Problem an dem nvme slot 2 lag, habe also die neue SSD F: in den 3. Slot verbaut.

Selber Fehler ist wieder aufgetreten.

Was denkt ihr was hier das Problem sein könnte?

Memtest86+ lief durch und prime ebenfalls keine fehler nach mehreren Stunden.

Skudrinka · 14. Dezember 2023

xJAMESx schrieb:
Memtest86+ lief durch und prime ebenfalls keine fehler nach mehreren Stunden.

Und was sagen die SMART-Werte der Platten?
Ist doch viel wichtiger.

xJAMESx · 14. Dezember 2023

Sind im Anhang

Tanzmusikus · 14. Dezember 2023

Die SSDs sehen gesund aus.
Gu könntest noch die Seriennummern aus den Screenshots entfernen.

Du könntest die betroffene NVMe-SSD im UEFI auf "PCIe Gen 3.0" fixieren. Vielleicht hilft das.

Gibt's evtl. einen Umschalter im UEFI für den 3. M.2-Slot?
Bei einigen Mainboards werden die "M.2" PCIe-Ports mit den "normalen" PCIe-Ports geteilt.

xJAMESx · 14. Dezember 2023

Tanzmusikus schrieb:
Die SSDs sehen gesund aus.
Gu könntest noch die Seriennummern aus den Screenshots entfernen.

Du könntest die betroffene NVMe-SSD im UEFI auf "PCIe Gen 3.0" fixieren. Vielleicht hilft das.

Gibt's evtl. einen Umschalter im UEFI für den 3. Slot?
Bei einigen Mainboards werden die "M.2" PCIe-Ports mit den "normalen" PCIe-Ports geteilt.

Also das System lief Monatelang stabil. Hatte anfangs andere Crashes, aber seit gut 2 Monaten ruhe weil ich den Ram auf 5800Mhz runter getaktet habe.
Diese SSD Probleme kamen aus dem nichts. BIOS Update hat leider auch keine Verbesserung gebracht.
Kenne dieses verhalten eigentlich von sterbenden SSD's. Aber die neue hat in beiden Slots das selbe verhalten.

Ich würde auf einen Mainboard defekt tippen, wollte aber mal nachfragen ob jemand evtl schonmal ähnliches hatte.
Mainboard wäre ja kein Problem, da RMA (System ist von Anfang des Jahres.)

Tanzmusikus · 14. Dezember 2023

xJAMESx schrieb:
Ich würde auf einen Mainboard defekt tippen

Könnte sein.

Hattest Du nach dem UEFI-Update die UEFI-Defaults geladen?

Deaktiviere mal testweise das XMP für deinen RAM.

xJAMESx · 14. Dezember 2023

Ich kann das Problem leider nicht gezielt nachstellen. Das passiert manchmal nach 3-4 Tagen und manchmal 1x am Tag. Immer nur beim zocken auf der Platte F:

Tanzmusikus · 14. Dezember 2023

Befindet sich ein Gerät im PCIe-Slot 4 (der ist nämlich "shared" mit dem M.2-Port "M2C_SB")?

Nutzt Du momentan UEFI-Version F20a oder F8?

xJAMESx · 14. Dezember 2023

In beiden rot markierten Slots ist das Problem aufgetreten.

Ich nutze aktuell das F8 BIOS ja.

Tanzmusikus · 14. Dezember 2023

Dann ist das PCIe-Kabel defekt - bitte austauschen!

. . . S c h e r z !!

Vielleicht braucht der SB-Chipsatz einfach ein bisschen mehr Spannung ..?
Wenn's aber beim CPU-PCIe-M.2 auch vorkommt, dann kämen ja CPU, MB, NVMe oder RAM in Frage.
Manchmal reichen da schon Haarrisse im PCB des Boards für Fehler aus.

Teste mal die Ideen aus meinen vorigen Posts #4 & #6 aus bevor Du vielleicht aufgibst & das Board zurücksendest!

Aktueller AMD Chipsatz-Treiber ist installiert?

"PCIEX4"-Port (siehe Screenshot gaaanz unten) ist unbenutzt?

Irgendwelcher OC-Kram im UEFI aktiv?

Irgendein/e Gigabyte-App/Tool im System installiert?

Wie sieht's mit Linux aus - funktionieren damit alle Datenträger?

Unter Windows:
SFC /SCANNOW in die Kommando-Zeile (CMD) mit Admin-Rechten eingeben & Fehler reparieren lassen.

xJAMESx · 14. Dezember 2023

Wie gesagt, das Problem tritt mal alle 1-2 Tage, mal alle 4 Tage auf.
Immer nur beim Zocken von der SSD.

sfc /scannow, sowie die Windows Datenträger Fehlerbehebung liefen auch schon.
Ich kann das leider nicht nachstellen, grad mehrmals Crystaldiskmark laufen gelassen sieht alles ok aus auch keine Crashes oder Fehler.
Temp der SSD ist auch fine (53°).

Mein System ist neu installiert vor ca 3 Monaten. Habe keine Gigabyte Tools drauf.
Ein anderer PCI Port wird nicht genutzt, nur GPU.

Keinerlei OC aktiv (nur EXPO) auf 5800Mhz.
Chipset Treiber sind auch aktuell.

Mittlerweile kann ich nicht mal mehr die Temperatur und sonst irgendwas von der SSD auslesen :-D

Trotz last mit Crystalmark

Ergänzung (14. Dezember 2023)

Also gerade ist der Rechner auch gecrasht mit bluescreen, obwohl das Game auf C lag.
Leider ohne Abbild.

Also fassen wir zusammen:
Memtest läuft fehlerfrei durch.
Prime95 läuft ebenfalls mehrere Stunden mit Fehlerfrei durch.

Bei last auf den NVMe's crasht das System.

Was würdet ihr machen? Neues Board kaufen und ggf. zurück schicken, falls es nicht das Problem war?
Oder eher auf Ram setzen?

Ich teste gerade das alte BIOS F7 sowie die PCIx4 lanes auf gen3.

Update: Gerade gecrasht...
Das Problem verschlimmert sich definitiv. Sobald last auf einer der beides SSD's sind crasht das System.

Drewkev · 15. Dezember 2023

xJAMESx schrieb:
Aber die neue hat in beiden Slots das selbe verhalten.
[...]
Immer nur beim zocken auf der Platte F:

Aber wie konntest du dann die SSD selbst ausschließen?

xJAMESx · 15. Dezember 2023

Zuerst war eine Crucial 500gb verbaut, wurde dann durch eine neue 980 Pro getauscht, selbes verhalten.

Drewkev · 15. Dezember 2023

@xJAMESx
Vielleicht liegt's ja am Windows selbst? Eine Neuinstallation kann sicher nicht schaden.

xJAMESx · 15. Dezember 2023

Vor gut 2 Monaten schon gemacht :-)

Drewkev · 15. Dezember 2023

@xJAMESx
Aber wurde davor oder danach die SSD getauscht?

xJAMESx · 15. Dezember 2023

Es scheinen wirklich nur die unteren beiden nvme Slots betroffen zu sein.
Crystaldiskmark auf C: -> keine Probleme
Mache ich das auf F: (NVME_C oder NVME_B) crasht das system.
NVME_A und _B hängen beide an der CPU lane, keine Ahnung wieso der Slot läuft. Aber NVME_B nicht

Es macht auch kein unterschied welche nvme verbaut ist. Sobald eine nvme unten drin steckt crasht alles bei last.

Ich hab genug ausprobiert und getestet um ein SSD defekt auszuschließen, inklusive diese nvme in einem anderen Rechner getestet.

Bevor ich jetzt weiter Stundenlang auf Fehlersuche gehe, hole ich mir lieber ein neues board + ram und starte eine RMA für Board + Ram. Der ram ist ja auch nicht mehr wirklich brauchbar, da expo profil überschrieben.

Sandolo · 15. Dezember 2023

Ich würde auf jeden Fall alles updaten, was noch nicht gemacht wurde.

UEFI/BIOS
Chipsatztreiber
AHCI-Treiber
Firmware aller SSDs und NVMEs

Dazu im BIOS alle PCIe-Schalter von AUTO auf die Werte der angeschlossenen Komponenten (Graka / NVME) auf 4.0.

Dass ein MB-Defekt vorliegt, ist eher unwahrscheinlich.
Da die Platte in Slot 2 und 3 crasht, die ja unterschiedlich angesteuert werden (2 über CPU, 3 über Chipsatz) und der Fehler bevorzugt in Spielen kam, vermute ich, dass es an der Wärmeentwicklung der Grafikkarte liegt. Beide Ports liegen ja direkt im "Abgasstrahl".

Teste doch mal mit Framelimit (max. FPS im Treiber auf GPU-Load 70% im Game).
Die Karte rennt dann nicht voll und bleibt deutlich Kühler.

Drewkev · 15. Dezember 2023

xJAMESx schrieb:
Der ram ist ja auch nicht mehr wirklich brauchbar, da expo profil überschrieben.

Das ist so nicht ganz richtig.

xJAMESx · 15. Dezember 2023

Sandolo schrieb:
Ich würde auf jeden Fall alles updaten, was noch nicht gemacht wurde.

UEFI/BIOS

Chipsatztreiber

AHCI-Treiber

Firmware aller SSDs und NVMEs

Dazu im BIOS alle PCIe-Schalter von AUTO auf die Werte der angeschlossenen Komponenten (Graka / NVME) auf 4.0.

Dass ein MB-Defekt vorliegt, ist eher unwahrscheinlich.
Da die Platte in Slot 2 und 3 crasht, die ja unterschiedlich angesteuert werden (2 über CPU, 3 über Chipsatz) und der Fehler bevorzugt in Spielen kam, vermute ich, dass es an der Wärmeentwicklung der Grafikkarte liegt. Beide Ports liegen ja direkt im "Abgasstrahl".

Teste doch mal mit Framelimit (max. FPS im Treiber auf GPU-Load 70% im Game).
Die Karte rennt dann nicht voll und bleibt deutlich Kühler.

Alles schon updated ohne erfolge :-/
Ich kann das Problem auch auf dem Desktop nachstellen mit Crystaldiskmark. Ohne GPU Last.
BTW: Ich zocke WoW, meine GPU hängt da irgendwie bei 40% rum, lüfter aus.

Probleme mit Nvme SSD

Lt. Commander

Fleet Admiral

Lt. Commander

Anhänge

Fleet Admiral

Lt. Commander

Fleet Admiral

Lt. Commander

Fleet Admiral

Anhänge

Lt. Commander

Fleet Admiral

Anhänge

Lt. Commander

Geizkragen

Lt. Commander

Geizkragen

Lt. Commander

Geizkragen

Lt. Commander

Lt. Junior Grade

Geizkragen

Lt. Commander

Ähnliche Themen

Passend zum Thema