Homeserver Sata/Mainboard Probleme

dbrun

Newbie
Registriert
Jan. 2021
Beiträge
4
Hallo,
ich habe ein Problem, zu dem ich mir eine zweite Meinung einholen will:
Kurz zur Ausgangssituation:
Ein Homeserver mit ASRock J4105 Mainboard/CPU Kombi. Dieses Mainboard hat 4 Onboard-Sata Ports, welche von 2 verschiedenen Sata-Controllern angesteuert werden.

Bisher hatte ich auf dem Server Proxmox installiert und einen der beiden Sata-Controller an eine Openmediavault-Vm durchgereicht, sodass OMV direkt auf die angeschlossenen Festplatten zugreifen konnte. Dies funktionierte auch wunderbar, mit einer Festplatte. Vor kurzem habe ich eine zweite Festplatte eingebaut, die für Backups genutzt werden sollte.
Doch nun fingen die Probleme an: Wenn zwischen den beiden Festplatten Daten kopiert werden oder generell auf eine der Festplatten zugegriffen wird "friert" eine der Platten immer nach kurzer Zeit ein (Solange das System im Leerlauf ist, erscheinen keine Fehler)
Dabei erscheinen in OMV folgende Fehlermeldungen (Ausschnitt):
Jan 21 15:25:47 omv kernel: [16247.225867] ata5.00: exception Emask 0x60 SAct 0xf0000 SErr 0x800 action 0x6 frozen Jan 21 15:25:47 omv kernel: [16247.244959] ata5.00: irq_stat 0x20000000, host bus error Jan 21 15:25:47 omv kernel: [16247.262168] ata5: SError: { HostInt } Jan 21 15:25:47 omv kernel: [16247.279090] ata5.00: failed command: WRITE FPDMA QUEUED Jan 21 15:25:47 omv kernel: [16247.296082] ata5.00: cmd 61/08:80:80:38:c6/00:00:e8:00:00/40 tag 16 ncq dma 4096 out Jan 21 15:25:47 omv kernel: [16247.331079] ata5.00: status: { DRDY } Jan 21 15:25:47 omv kernel: [16247.348325] ata5.00: failed command: READ FPDMA QUEUED Jan 21 15:25:47 omv kernel: [16247.365687] ata5.00: cmd 60/e0:88:c0:89:2d/01:00:60:00:00/40 tag 17 ncq dma 245760 in Jan 21 15:25:48 omv kernel: [16247.401164] ata5.00: status: { DRDY } Jan 21 15:25:48 omv kernel: [16247.419031] ata5.00: failed command: READ FPDMA QUEUED Jan 21 15:25:48 omv kernel: [16247.437002] ata5.00: cmd 60/00:90:a0:8b:2d/01:00:60:00:00/40 tag 18 ncq dma 131072 in Jan 21 15:25:48 omv kernel: [16247.473373] ata5.00: status: { DRDY } Jan 21 15:25:48 omv kernel: [16247.491329] ata5.00: failed command: READ FPDMA QUEUED Jan 21 15:25:48 omv kernel: [16247.509348] ata5.00: cmd 60/a8:98:00:e0:2d/02:00:60:00:00/40 tag 19 ncq dma 348160 in Jan 21 15:25:48 omv kernel: [16247.546423] ata5.00: status: { DRDY } Jan 21 15:25:48 omv kernel: [16247.564862] ata5: hard resetting link Jan 21 15:25:48 omv kernel: [16248.041877] ata5: SATA link up 3.0 Gbps (SStatus 123 SControl 300) Jan 21 15:25:48 omv kernel: [16248.043803] ata5.00: configured for UDMA/133 Jan 21 15:25:48 omv kernel: [16248.098776] ata5: EH complete Jan 21 15:25:48 omv kernel: [16248.129866] ata5.00: exception Emask 0x60 SAct 0x1c00000 SErr 0x800 action 0x6 frozen Jan 21 15:25:48 omv kernel: [16248.148087] ata5.00: irq_stat 0x20000000, host bus error Jan 21 15:25:48 omv kernel: [16248.166530] ata5: SError: { HostInt } Jan 21 15:25:48 omv kernel: [16248.184659] ata5.00: failed command: READ FPDMA QUEUED Jan 21 15:25:48 omv kernel: [16248.202799] ata5.00: cmd 60/08:b0:c0:89:2d/00:00:60:00:00/40 tag 22 ncq dma 4096 in Jan 21 15:25:48 omv kernel: [16248.239826] ata5.00: status: { DRDY } Jan 21 15:25:48 omv kernel: [16248.258111] ata5.00: failed command: READ FPDMA QUEUED Jan 21 15:25:48 omv kernel: [16248.276476] ata5.00: cmd 60/08:b8:00:e0:2d/00:00:60:00:00/40 tag 23 ncq dma 4096 in Jan 21 15:25:48 omv kernel: [16248.314600] ata5.00: status: { DRDY } Jan 21 15:25:48 omv kernel: [16248.333513] ata5.00: failed command: WRITE FPDMA QUEUED Jan 21 15:25:48 omv kernel: [16248.352413] ata5.00: cmd 61/08:c0:80:38:c6/00:00:e8:00:00/40 tag 24 ncq dma 4096 out Jan 21 15:25:49 omv kernel: [16248.390627] ata5.00: status: { DRDY } Jan 21 15:25:49 omv kernel: [16248.409748] ata5: hard resetting link Jan 21 15:25:49 omv kernel: [16248.885880] ata5: SATA link up 3.0 Gbps (SStatus 123 SControl 300) Jan 21 15:25:49 omv kernel: [16248.887605] ata5.00: configured for UDMA/133 Jan 21 15:25:49 omv kernel: [16248.887636] ata5: EH complete Jan 21 15:25:49 omv kernel: [16248.901825] ata5.00: exception Emask 0x60 SAct 0x3800 SErr 0x800 action 0x6 frozen Jan 21 15:25:49 omv kernel: [16248.921607] ata5.00: irq_stat 0x20000000, host bus error Jan 21 15:25:49 omv kernel: [16248.941179] ata5: SError: { HostInt } Jan 21 15:25:49 omv kernel: [16248.960480] ata5.00: failed command: WRITE FPDMA QUEUED Jan 21 15:25:49 omv kernel: [16248.979766] ata5.00: cmd 61/08:58:80:38:c6/00:00:e8:00:00/40 tag 11 ncq dma 4096 out Jan 21 15:25:49 omv kernel: [16249.018760] ata5.00: status: { DRDY } Jan 21 15:25:49 omv kernel: [16249.038379] ata5.00: failed command: READ FPDMA QUEUED Jan 21 15:25:49 omv kernel: [16249.057959] ata5.00: cmd 60/08:60:00:e0:2d/00:00:60:00:00/40 tag 12 ncq dma 4096 in Jan 21 15:25:49 omv kernel: [16249.097538] ata5.00: status: { DRDY } Jan 21 15:25:49 omv kernel: [16249.117018] ata5.00: failed command: READ FPDMA QUEUED Jan 21 15:25:49 omv kernel: [16249.136298] ata5.00: cmd 60/08:68:c0:89:2d/00:00:60:00:00/40 tag 13 ncq dma 4096 in Jan 21 15:25:49 omv kernel: [16249.175377] ata5.00: status: { DRDY } Jan 21 15:25:49 omv kernel: [16249.194687] ata5: hard resetting link Jan 21 15:25:50 omv kernel: [16249.669883] ata5: SATA link up 3.0 Gbps (SStatus 123 SControl 300) Jan 21 15:25:50 omv kernel: [16249.671963] ata5.00: configured for UDMA/133 Jan 21 15:25:50 omv kernel: [16249.671978] ata5: EH complete Jan 21 15:25:50 omv kernel: [16249.689859] ata5.00: exception Emask 0x60 SAct 0x7 SErr 0x800 action 0x6 frozen Jan 21 15:25:50 omv kernel: [16249.709599] ata5.00: irq_stat 0x20000000, host bus error Jan 21 15:25:50 omv kernel: [16249.729096] ata5: SError: { HostInt } Jan 21 15:25:50 omv kernel: [16249.748372] ata5.00: failed command: READ FPDMA QUEUED Jan 21 15:25:50 omv kernel: [16249.767572] ata5.00: cmd 60/08:00:c0:89:2d/00:00:60:00:00/40 tag 0 ncq dma 4096 in Jan 21 15:25:50 omv kernel: [16249.806391] ata5.00: status: { DRDY } Jan 21 15:25:50 omv kernel: [16249.825644] ata5.00: failed command: READ FPDMA QUEUED Jan 21 15:25:50 omv kernel: [16249.844821] ata5.00: cmd 60/08:08:00:e0:2d/00:00:60:00:00/40 tag 1 ncq dma 4096 in Jan 21 15:25:50 omv kernel: [16249.883661] ata5.00: status: { DRDY } Jan 21 15:25:50 omv kernel: [16249.902952] ata5.00: failed command: WRITE FPDMA QUEUED Jan 21 15:25:50 omv kernel: [16249.922192] ata5.00: cmd 61/08:10:80:38:c6/00:00:e8:00:00/40 tag 2 ncq dma 4096 out Jan 21 15:25:50 omv kernel: [16249.961093] ata5.00: status: { DRDY } Jan 21 15:25:50 omv kernel: [16249.980084] ata5: hard resetting link Jan 21 15:25:51 omv kernel: [16250.453892] ata5: SATA link up 3.0 Gbps (SStatus 123 SControl 300) Jan 21 15:25:51 omv kernel: [16250.456036] ata5.00: configured for UDMA/133 Jan 21 15:25:51 omv kernel: [16250.456050] ata5: EH complete Jan 21 15:25:51 omv kernel: [16250.469859] ata5.00: exception Emask 0x60 SAct 0x700000 SErr 0x800 action 0x6 frozen Jan 21 15:25:51 omv kernel: [16250.489754] ata5.00: irq_stat 0x20000000, host bus error Jan 21 15:25:51 omv kernel: [16250.509772] ata5: SError: { HostInt } Jan 21 15:25:51 omv kernel: [16250.529421] ata5.00: failed command: WRITE FPDMA QUEUED Jan 21 15:25:51 omv kernel: [16250.549091] ata5.00: cmd 61/08:a0:80:38:c6/00:00:e8:00:00/40 tag 20 ncq dma 4096 out Jan 21 15:25:51 omv kernel: [16250.589074] ata5.00: status: { DRDY } Jan 21 15:25:51 omv kernel: [16250.608857] ata5.00: failed command: READ FPDMA QUEUED Jan 21 15:25:51 omv kernel: [16250.628696] ata5.00: cmd 60/08:a8:00:e0:2d/00:00:60:00:00/40 tag 21 ncq dma 4096 in Jan 21 15:25:51 omv kernel: [16250.668655] ata5.00: status: { DRDY } Jan 21 15:25:51 omv kernel: [16250.688408] ata5.00: failed command: READ FPDMA QUEUED Jan 21 15:25:51 omv kernel: [16250.708199] ata5.00: cmd 60/08:b0:c0:89:2d/00:00:60:00:00/40 tag 22 ncq dma 4096 in Jan 21 15:25:51 omv kernel: [16250.748086] ata5.00: status: { DRDY } Jan 21 15:25:51 omv kernel: [16250.767762] ata5: hard resetting link Jan 21 15:25:51 omv kernel: [16251.241843] ata5: SATA link up 3.0 Gbps (SStatus 123 SControl 300) Jan 21 15:25:51 omv kernel: [16251.243470] ata5.00: configured for UDMA/133 Jan 21 15:25:51 omv kernel: [16251.243484] ata5: EH complete Jan 21 15:25:51 omv kernel: [16251.258163] ata5.00: exception Emask 0x60 SAct 0xe00 SErr 0x800 action 0x6 frozen Jan 21 15:25:51 omv kernel: [16251.278304] ata5.00: irq_stat 0x20000000, host bus error Jan 21 15:25:51 omv kernel: [16251.298075] ata5: SError: { HostInt } Jan 21 15:25:51 omv kernel: [16251.317651] ata5.00: failed command: READ FPDMA QUEUED Jan 21 15:25:51 omv kernel: [16251.337187] ata5.00: cmd 60/08:48:c0:89:2d/00:00:60:00:00/40 tag 9 ncq dma 4096 in Jan 21 15:25:52 omv kernel: [16251.376949] ata5.00: status: { DRDY } Jan 21 15:25:52 omv kernel: [16251.396618] ata5.00: failed command: READ FPDMA QUEUED Jan 21 15:25:52 omv kernel: [16251.416331] ata5.00: cmd 60/08:50:00:e0:2d/00:00:60:00:00/40 tag 10 ncq dma 4096 in Jan 21 15:25:52 omv kernel: [16251.456044] ata5.00: status: { DRDY } Jan 21 15:25:52 omv kernel: [16251.475718] ata5.00: failed command: WRITE FPDMA QUEUED Jan 21 15:25:52 omv kernel: [16251.495472] ata5.00: cmd 61/08:58:80:38:c6/00:00:e8:00:00/40 tag 11 ncq dma 4096 out Jan 21 15:25:52 omv kernel: [16251.535244] ata5.00: status: { DRDY } Jan 21 15:25:52 omv kernel: [16251.554924] ata5: hard resetting link Jan 21 15:25:52 omv kernel: [16252.029898] ata5: SATA link up 3.0 Gbps (SStatus 123 SControl 300) Jan 21 15:25:52 omv kernel: [16252.031478] ata5.00: configured for UDMA/133 Jan 21 15:25:52 omv kernel: [16252.071034] ata5: EH complete

Wenn ich die OMV Maschine neustarte, funtioniert es für kurze Zeit wieder, aber danach erscheinen diese Fehler erneut.
Was ich schon versucht habe:
  • Pico-PSU Netzteil durch ein normales ATX Netzteil ersetzt (um eventuelle Stromversorgungsprobleme auszuschließen)
  • Eine PCIe Sata Erweiterungskarte eingebaut und an diese die Festplatten angeschlossen (und an die OMV VM durchgereicht)
  • Eine Festplatte an die Erweiterungskarte und eine an den Internen Sata Controller
  • Sata Kabel getauscht
All diese Maßnahmen führten zu keiner Verbesserung

Heute habe ich versucht über ein Linux Mint 19 Live ISO (Auch Ubuntu 16.04 probiert) vom USB Stick zu starten, die Festplatten einzubinden und zwischen ihnen Daten zu kopieren. Mit dem Ergebnis, dass das System nach einigen 10GB an bereits übertragenen Daten komplett einfriert und auf keine Eingaben mehr reagiert. Somit liegt es auch nicht an der Virualisierung in Proxmox

Für mich sieht das so aus, als hätte das Mainboard selbst irgendein Problem.
Was meint ihr dazu?

LG
dbrun
 
Zusätzlich eingebaute Platte fehlerhaft?
 
dbrun schrieb:
Dabei erscheinen in OMV folgende Fehlermeldungen
Sieht schwer nach nem Hardwareproblem aus. Entweder die Verbindung zur betreffenden Platte ist nicht ok oder die Platte selbst hat einen "Schuss" weg weg.

dbrun schrieb:
Bisher hatte ich auf dem Server Proxmox installiert und einen der beiden Sata-Controller an eine Openmediavault-Vm durchgereicht, sodass OMV direkt auf die angeschlossenen Festplatten zugreifen konnte.
Von hinten in die Brust durchs Auge. Ok. Wers mag. :-)
 
Das habe ich vergessen zu erwähnen: Die zweite Platte ist neu und somit ist es denke ich relativ unwahrscheinlich, dass diese defekt geliefert wurde. Die Smart Werte beider Platten zeigen auch keine Auffälligkeiten. Ich habe auch schonmal probiert statt der neu gekauften Platte eine andere (schon etwas ältere) Platte einzubauen, gleiches Ergebnis. In anderen Systemen funktioniert diese ältere Platte problemlos.
Was ich noch nicht probiert habe ist die Platte, welche von Anfang an drinnen ist testweise zu ersetzen. Wobei mir das auch unlogisch erscheint, weil diese, wenn nur sie eingebaut ist auch ohne Probleme funktioniert. Aber das werde ich morgen mal probieren
 
dbrun schrieb:
Die zweite Platte ist neu und somit ist es denke ich relativ unwahrscheinlich, dass diese defekt geliefert wurde.
Naja. Entweder gehen Platten gleich zu Anfang kaputt oder es dauert erst mal ne Weile.
Abgesehen davon hatte ich ja auch noch die Verbindung ins Spiel gebracht. Vielleicht ist ja irgendwas mit dem SATA-Kabel.

Ansonsten bleibt noch ein Softwareproblem. Man könnte mit nem Live-System mal gegenchecken und die Platten überprüfen. Wenn das funktioniert, ist an Deiner Installation irgendwas kaputt.
Wie gesagt. Ich find' das mit den "Platten durchreichen" auch nicht besonders glücklich. Damit provoziert man auch gerne mal Probleme.
 
Das mit dem Live System habe ja oben geschrieben. Wie gesagt friert hierbei das gesamte System ein.

dbrun schrieb:
Heute habe ich versucht über ein Linux Mint 19 Live ISO (Auch Ubuntu 16.04 probiert) vom USB Stick zu starten, die Festplatten einzubinden und zwischen ihnen Daten zu kopieren. Mit dem Ergebnis, dass das System nach einigen 10GB an bereits übertragenen Daten komplett einfriert und auf keine Eingaben mehr reagiert. Somit liegt es auch nicht an der Virualisierung in Proxmox
Beim Live System habe ich auch die Platten zwischen den verschiedenen Sata Controllern hin und hergesteckt. Immer derselbe Effekt.

Was mich auch verwundert (unabhängig vom Live System) : Proxmox selbst startet von einer SSD im selben System. Auf dieser Systemplatte erscheinen jedoch keinerlei Fehler.
Mir kam hierbei auch in den Gedanken, dass die 12v Spannung des netzteils ein Problem hat, weil die SSD selbst an diese ja nicht abgeschlossen ist. Aber das netzteil habe ich wie gesagt schon getauscht
 
dbrun schrieb:
Das mit dem Live System habe ja oben geschrieben.
Hatte ich komplett übersehen. Mein Fehler.
Das würde ja den Verdacht auf ein Hardwareproblem erhärten.

dbrun schrieb:
Proxmox selbst startet von einer SSD im selben System. Auf dieser Systemplatte erscheinen jedoch keinerlei Fehler.
Naja. Warum sollte auch auf der Systemplatte Fehler auftreten. Aber vielleicht hab ich wieder etwas falsch verstanden. Ich hatte es so verstanden, das es mit der neuen Platte (die im Log ja auch als ata5 geführt wird) Probleme gibt.

dbrun schrieb:
Aber das netzteil habe ich wie gesagt schon getauscht
Es wäre auch ungewöhnlich (wenngleich möglich), wenn Spannungsprobleme nur diese eine Platte betreffen würden (aber vielleicht hab ich "eine Platte" auch falsch verstanden).
Am Controller sollte es aber auch nicht liegen, weil umgestöpselt hast Du ja auch schon.

Insofern hab ich spontan jetzt erst mal keine Idee.
 
Also ich habe heute nochmal etwas herumprobiert:
Ich habe die ältere Platte mal entfernt und durch eine andere ersetzt, die ich noch rumliegen hatte. Beim kopieren von Daten zwischen dieser und der neu gekauften Platte zeigten sich keine Probleme.
Weiterhin habe ich aber die ältere Platte zusammen mit der neuen an einen Anderen Computer gesteckt und von diesem aus versucht, Daten hin und herzukopieren. Ich habe einige 100GB kopiert und keinen einzigen Fehler erhalten! Die alte Platte scheint also intakt zu sein.
Also irgendwie hat der Homeserver mit der alten Platte ein Problem.
Also nochmal zu den Fehlern: Ich hatte ja oben nur einen Ausschnitt kopiert, ich glaube die Fehlermeldungen traten teilweise sogar auf der neuen und auf der alten Platte auf, aber anscheinend nur solange die Alte Platte eingesteckt ist.
 
Zurück
Oben