Raid-1 unter Debian 7.5 ohne Last schon extrem langsam

Mickey61 · 1. September 2014

Hallo Gemeinde,

vor wenigen Tagen bekam unsere Webseite einen neuen Server. Umzug der Seiten etc lief problemlos ab, aber von Anfang an fiel auf, dass selbst nur wenige User Online bereits eine hohe Auslastung des Servers (i7-3770, 32 GB, 2*3 TB in Raid-1, 1 SSD) verursachten. Im Vergleich zum bisherigen Server schafften selbst die hundertfache Menge User keine solche Last!

Last bei wenigen Usern schon avg 4-5, nach Auslagern der MySQL-Daten auf die SSD 2-3.

atop zeigt: md0 0% busy, die dazu gehörigen sdb und sdc 50-100% busy bei 1-1.5 MB/s Write. Die Platten sind synchron, die Hardware wurde vom Support getestet und für in Ordnung befunden. Die SSD erzeugt mit der Hauptlast durch die MySQL-Daten 0% busy.

Hat jemand eine Idee, woran der hohe busy-Status kommen kann? Logisch, dass durch die I/O-Belastung die CPU-Kerne ausgelastet werden, aber es ist kein dafür verantwortlicher Prozess zu finden. Der Apache begnügt sich mit 1-2%, der MySQL mit manchmal 4-5%, alles andere ist ruhig.

Die Scripte und Software sind identisch konfiguriert wie auf dem alten Server, der trotz kleinerer Hardware bei 100+ Usern noch genug Reserven besass.

Vielen Dank für jeden Tipp und falls weitere Infos gebraucht werden, einfach fragen.

Michael

Im Titel sollte es "Debian 7.6" heissen

Rumo · 1. September 2014

Da kann man nur raten.

Irgendwas interessantes im dmesg?

cat /proc/mdstat? Läuft da noch ein Sync?

smartctl -a?

Bei ext4 könnte auch noch lazy*init Schreibzugriffe verursachen, aber damit man davon was merkt, muss dann trotzdem bei den Platten was im argen liegen...

MySQL falsch konfiguriert? Viel RAM nutzt nichts wenn MySQL ihn nicht nutzen darf. Dann wäre md0 bzw. die Datenbank allerdings busy...

yummycandy · 1. September 2014

Das gute alte hdparm liefert auch noch eventuelle Hilfswerte.

Mickey61 · 1. September 2014

Ergänzung (1. September 2014)

Ich bin's nochmal...

nachdem ich immer mehr mich auf die Suche nach evtl. für das Verhalten zuständige Prozesse machte, fiel mir u.a. auf, dass der Apache lt. atop zeitweise 160+ MB/10s in das Raid schreibt, was ich mir ja garnicht erklären kann.

Weiss jemand irgendein Tool, mit dem man herausfinden kann, welcher Prozess was in welche Dateien schreibt?

Grüße, Michael

Ergänzung (1. September 2014)

Inzwischen bin ich schon einen Schritt weiter: Das Journaling des ext4-Raids scheint der Übeltäter zu sein. Mit noatime, nodiratime, commit=60 konnte die Last schon auf ein Drittel reduziert werden. Dennoch sehe ich das als reine Workarounds an.

Mickey61 · 3. September 2014

AW: Raid-1 unter Debian 7.6 ohne Last schon extrem langsam

Was ich inzwischen auch noch herausgefunden habe: An 512 / 4k liegt es auch nicht. Bei allen Platten und allen Partitionen wird "aligned" beim Check ausgegeben. Partitioniert wurde mit gpt. Stehe dem Ganzen also imer noch recht ratlos gegenüber.

Rumo · 3. September 2014

AW: Raid-1 unter Debian 7.6 ohne Last schon extrem langsam

Mickey61 schrieb:
Bei allen Platten und allen Partitionen wird "aligned" beim Check ausgegeben.

Das wird auch gerne mal ausgegeben wenn es nicht aligned ist... wenn die Platte nicht sagt welche Sektorgrößen sie tatsächlich hat, kann die Software da auch nichts checken. Schau einfach daß die Partitionen auf MiB-Grenzen (mehrfache von 2048 x 512b-Sektoren) starten, das passt für alle Geräte.

Aber es scheint doch eher so zu sein daß bei dir irgendwas ziemlich viel schreibt (Apache?)

Du kannst dir ja mal btrace / blktrace anschauen...

Mickey61 · 3. September 2014

AW: Raid-1 unter Debian 7.6 ohne Last schon extrem langsam

Rumo schrieb:
D

Aber es scheint doch eher so zu sein daß bei dir irgendwas ziemlich viel schreibt (Apache?)

Du kannst dir ja mal btrace / blktrace anschauen...

Grad mal zum Stand der Dinge:

Nachdem ich ja vorher schon MySQL auf die SSD verlegt hatte, habe ich das mit den Apache-Logs (ausser der der virtual-hosts) auch gemacht und zu guter Letzt den Disk-Cache verdoppelt und den Intervall zum Flushen hochgesetzt. Interessanterweise lief heute Morgen ein Sync der zweiten Platte im Raid, wobei dieser eher mühelos 80 MB/s schaffte. Als das beendet war, ging die Load des Servers von nominal erst 8, später 4 (MySQL-Umstellung), dann 2 (Logs), dann 1 (sync) auf jetzt erwartete < 0.1 zurück.

Wäre jetzt eigentlich nur interessant zu wissen, was das für ein Hexenwerk ist... btrace zeigt auf den HDD kaum Aktivität, auf der SSD die erwartete Hauptaktivität durch den MySQL und sonst nichts auffallendes.

Jetzt werde ich (mit Ausnahme des Disk-Caches, da ja absolut genug RAM vorhanden ist) alles zurück bilden und schauen, ob der Effekt wieder eintritt. Wenn nicht, dann fange ich an kleine Geister im Server an zu glauben

Suche

Raid-1 unter Debian 7.5 ohne Last schon extrem langsam

Mickey61

Newbie

Rumo

Gast

yummycandy

Commodore

Mickey61

Newbie

Mickey61

Newbie

Rumo

Gast

Mickey61

Newbie

Ähnliche Themen

Passend zum Thema

Engpässe und steigende Preise KI-Boom macht nicht vor Festplatten halt

WD Red Pro Auch Western Digital hat nun 24 TB fürs NAS in petto

Western Digital Aufspaltung des Unternehmens läuft nach Plan