HBA (evtl. RAID)-Controller gesucht

rchr

Lt. Commander
Registriert
Okt. 2006
Beiträge
1.319
Hallo Leute,

Ich habe hier einen Homeserver mit folgender Konfig:
Intel Celeron G550
Gigabyte GA-Z77X-D3H
8GB Kingston ValueRam
Intel 1000CT NIC

Darin verbaut sind 13 Festplatten.
Eine direkt am Board angeschlossen als Systemlaufwerk, die anderen 12 hängen an Promise Fasttrak-RAID-Controllern (1x TX8660 und 1x TX4660) die im HBA-Modus laufen.
Zu Beginn hatte ich den Tx4660 im oberen PCIe-Slot und den Tx8660 im unteren eingesteckt. Ich erhielt dann sporadisch beim Booten eine Fehlermeldung vom Tx4660, dass ein Hardware-Problem aufgetaucht sei und er die Platten nicht erkenne. Ich habe dann versuchsweise einfach mal die Plätze der Controller getauscht und hatte ab da nie mehr Probleme. Bis jetzt.
Jetzt (also etwa 7 Monate nach dem Zusammenbau des Systems) fängt der Tx8660 an rumzuzicken und gibt mir beim Booten die gleiche Fehlermeldung aus.
Ab und an stürzt der Server auch im Betrieb ab (resp. macht ohne Vorankündigung einen Neustart, als hätte es einen kurzen Stromunterbruch gegeben).

Ich habe jetzt etwas recherchiert und es soll wohl nicht allzu oft passieren, dass sich die Fasttrak-Controller nicht so gut mit Gigabyte-Boards verstehen.

Eventuell wäre es daher nicht die schlechteste Lösung, einen neuen Controller einzubauen, damit dann endlich Ruhe ist?

Also ich brauche Anschlüsse für 12 Festplatten. Die Anschlüsse müssen nicht auf einer einzelnen Karte sein (momentan habe ich ja auch 2 drinnen), es könnten also auch wieder ein 4x und ein 8x-Controller sein (oder ein Controller plus eine Expander-Card).
Die Festplatten haben alle SATA-Anschluss, momentan arbeite ich mit SFF8087-Kabel, resp. Anschlüssen (die ich eigentlich auch gerne drinlassen würde, um nicht alles komplett zerlegen zu müssen).
Und was ich ganz gerne hätte, wäre eine gute Überwachungssoftware, die mir noch etwas mehr über die Platten verraten kann als die reinen SMART-Werte.
Die Software von Promise zeigt z.B. auch wenn eine Festplatte etwas lange brauchte um zu reagieren, etc. womit ich schon so manche defekte Festplatte erkennen und frühzeitig tauschen konnte.
RAID-Funktionalität ist eigentlich nicht gefragt. Die Karte wird so oder so wieder nur als HBA betrieben, der Rest erledigt Windows Home Server 2011.

Was könnt ihr mir da passendes empfehlen?

Vielen Dank und liebe Grüsse

Christoph
 
Das mag jetzt komisch klingen, aber was für ein Netzteil hast du?
13 Platten saugen nicht gerade wenig, gerade beim Starten sogar ziemlich viel.
 
Ich finde das keine komische Frage. Wäre ja gut möglich...
Also NT ist ein SeaSonic S12II-380Bronce, also 380W. Ich dachte, das sollte reichen. Der Leistungsmonitor meiner USV bescheinigt dem Server nicht mal 200W Verbrauch bei Volllast (ja, nicht sehr genau, ich weiss, aber immerhin ein Anhaltspunkt)...

Gruss

Christoph
 
Lässt du die Platten verzögert anlaufen? Mein 500W Silverstone war damals schon mit deutlich weniger Platten beim Kaltstart überfordert, allerdings steckte auch noch ein Pentium D drin. Dein NT ist schon etwas älter, wenn ich mich nicht irre, da könnten die Neustarts im Betrieb auch herrühren.
 
@herrhannes
Dann war das 500W Silverstone vermutlich im Arsch. Ich hatte in meinem Server teilweise 15 Platten mit nem Asus OEM 250W NT am laufen. Die sind alle problemlos gleichzeitig gestartet. Nachdem das olle 250W entsorgt war kam ein 300W Cougar A300 rein und das hat ebenfalls keine Probleme gemacht. (Und da hingen noch ein oller Athlon X2 mit 95W TDP, Board, 2 Controller und anderes Zeug hinten dran.)

Ein 380W Seasonic ist mehr als geeignet die Platten zu betreiben.

@christoph.ruest
Die Kiste dürfte im Idle nicht mehr als 90W brauchen. Das ist der Wert den meine Kiste hat und die ist ähnlich ausgestattet.

Falls du wirklich nur einen HBA suchst dann kann man den wohl empfehlen: http://geizhals.de/lsi-sas-9201-16i-lsi00244-a800984.html

Vorteil wäre das für geplante Erweiterungen auch Anschlüsse bereitstehen.

Das Neustartproblem könnte natürlich auf Inkompatibilitäten mit den Controllern zurückzuführen sein. Wenn die so Zicken machen sogar plausibel. Läuft der Server denn ansonsten stabil?
 
15 Platten dürften aber schon die absolute Kotzgrenze des NT gewesen sein, wenn nicht darüber.
Und wie gesagt ist bei einem System, das mittem im Betrieb einfach ausgeht, auch nicht gerade auszuschließen, dass das NT nicht mehr ganz in Ordnung ist ;)
 
@herrhannes:
Die Platten laufen alle zusammen an. Nacheinander geht nur mit passender Backplane und SAS, das ich beides nicht habe.
Aber Stromverbrauch beim Start würde ja die plötzlichen Reboots nicht erklären und die Fehlermeldung kommt fast immer nach solch einem Reboot...

@humptidumpti:
Danke für die Empfehlung! Ja, der Server läuft sonst stabil.
Nur diese Karte ist schon recht teuer und 16 Anschlüsse brauche ich nicht. Die 13 Platten (davon müssen 12 an den HBA) füllen das Gehäuse vollständig. Da gibt es keine Erweiterung mehr. Und die von dir empfohlene Karte ist in der Schweiz leider so gut wie nicht erhältlich...

Gruss

Christoph

Edit:
Ich bin mir inzwischen sehr sicher, dass das Problem vom Controller kommt.
Ich habe im Internet etwas gesucht und Dutzende "Leidensgenossen" gefunden.
Es ist immer das gleiche Spiel mit der gleichen Fehlermeldung und es ist immer entweder eine Controller-Karte von Promise oder ein Mainboard mit aufgelötetem Controller von genau dieser Firma.....

Edit2:
Eventuell könnte es in Richtung kalte Lötstelle oder so gehen.
Der Fehler ist in den letzten Tagen (Hitzetage) extrem häufig (bis zu 10x pro Tag) aufgetreten.
Das Gehäuse hat zwar ordentlich Durchzug (von vorne saugen 3x80mm durch die Backplanes an, von oben blasen 2x140mm durch das Dach rein, hinten bläst 1x120 raus und das NT saugt sich seine Frischluft selber über den Boden an und bläst sie hinten wieder raus), im Büro (wo der Server steht) hatte es in den letzten Tagen aber doch so 27 bis 29 Grad Raumtemperatur. Heute kam die Abkühlung (20 Grad Raumtemperatur) und der Server lief den ganzen Tag ohne ein mal zu mucken, obwohl ich ihn (extra zu testzwecken) ziemlich gestresst und hohen Load auf den Festplatten erzeugt habe...

Trotzdem werde ich einen anderen Controller verbauen. Nach reichlich nachlesen möchte ich mich an deine Empfehlung mit dem LSI halten. Nur leider scheint der in der Schweiz nicht wirklich lieferbar zu sein. Ich habe ihn nur bei einem der "üblichen Verdächtigen" gefunden und der will sich damit wohl eine goldene Nase verdienen....
 
Zuletzt bearbeitet:
So, es geht weiter....

Ich fürchte, es könnte doch das NT sein.
Also gestern ist die Kiste wieder 2 mal abgeschmiert. Ich wollte dann einfach mal noch Ram und CPU testen und habe von Ultimate Boot CD gebooted und Memtest 86+ laufen lassen. Nach etwa 12 Stunden Dauerlauf hat sich die Kiste ausgeschaltet und ist dann neu gestartet.

Um ganz sicher zu gehen habe ich dann beide FastTrak-Controller entfernt. Wieder Memtest 86+, dieses Mal reboot nach nicht mal 2 Stunden. Dieses Mal ist der Server aus geblieben. Ich wollte ihn wieder starten, aber er hat nicht reagiert. Also Stromstecker raus, 10 Sekunden gewartet, Strom wieder rein. Die Lüfter sind angelaufen, sonst nichts. Nach etwa 3 Minuten ist er dann spontan wieder angegangen und hat gebooted.

Dann also ohne FastTrak-Controller gebooted (Windows Home server) und Prime 95 laufen lassen. Nach etwa 90min wieder reboot.

Noch ein letztes Mal booten (wieder mit FastTrak-Controller zur Überprüfung der Leistungsaufnahme). Der Leistungsmonitor der USV bescheinigt dem Server einen Leerlaufverbrauch (ruhender Desktop aber alle Festplatten eingeschaltet) von 130 Watt. Dann wollte ich das System etwas auslasten um den Verbrauch unter Last zu testen. Aber bevor ich dazu kam, hat er wieder ausgeschaltet.

Ich habe jetzt ein neues Netzteil UND den LSI-Controller bestellt. Für die FastTrak-Controller gibt es schon seit Jahren keine aktuelle Firmware mehr. Und die haben mich schon wegen vielen anderen Kleinigkeiten genervt. Im Datenblatt steht, sie würden die SMART-Daten auslesen. Man kann die Daten aber nirgends anschauen. Im Datenblatt steht, sie würden staggered spin-up unterstützen. Tun sie aber nicht. Im Datenblatt wird noch vieles versprochen, was sie nicht halten.
Für den LSi (9201-16i) gibt es eine ganz aktuelle Firmware sowie ein aktuelles Verwaltungsprogramm für den Computer. Ausserdem sind die LSI-Controller wohl "Enterprise"-Qualität, währenddem die FastTrak "Home Office and Dekstop" Ware sind (sogar vom Hersteller so bezeichnet).

Ausserdem habe ich den Händler wegen des defekten NTs angeschrieben. Das hat noch über ein halbes Jahr Garantie.

Morgen sollten die Teile ankommen.

Gruss

Christoph
 
Aufgrund der Resonanz zu sowie Beteiligung an diesem Thema, gehe ich davon aus, dass es eigentlich niemanden hier interessiert....
Trotzdem schreibe ich noch einen letzten kleinen Beitrag zu diesem Thema, denn vielleicht hat ja wieder mal jemand das gleiche Problem wie ich hatte und sucht sich dann auch (so wie ich) auf Google einen Wolf, ohne etwas Gescheites zu finden.

Also das Netzteil ist inzwischen ausgetauscht, der LSI 9201-16i eingebaut.
Jetzt funktioniert wieder alles tadellos.
Der Server läuft jetzt schon ein paar Stunden auf voller Last und macht keinerlei Mucken. Keine Fehlermeldung, kein Absturz. Alles wunderbar stabil und sehr schnelle Transferraten auf den Platten.

Gruss

Christoph
 
Es interessiert schon. Aussergewöhnlich das sich ein NT Defekt so äussert das die Kiste mit Last startet aber im Idle irgendwann die Biege macht. Der Controller ist natürlich gut mit firmware updates und Software versorgt. Das ist ja was recht aktuelles im Gegensatz zu deinen Promise Dingern.
 
Ok, da niemand mehr etwas geschrieben hat und es fast keine Hits mehr gab, dachte ich, dass Thema wäre abgehakt.

Ja, für die Promise-Controller ist die letzte Firmware von November 2011.
Für den LSI ist das letzte Update gerade mal ein paar Monate her...

Das mit dem NT fand ich auch sehr interessant. Das Teil hat sich eigendlich immer im Idle verabschiedet. Unter Last starten ging gut und auch Torture-Tests (z.B. Prime) hat es ziemlich lange mitgemacht.
Das neue NT hat aber noch einen Vorteil: Ich habe mich für eines mit voll-modularem Kabelmanagement (Seasonic SS-650KM3) entschieden, obwohl es im Idle nur etwa 25% und unter Vollast etwa 35% ausgelastet ist. Aber so konnte ich mit 4 Kabeln (1x Board, 1x 4-Pin CPU, 1x Backplane 1 + Lüfter, 1x Backplane 2 + Backplane 3 + DVD) den ganzen Server versorgen und damit extrem viel Kabelsalat verhindern. Trotz nicht hörbarer Kühlung bleibt es im Betrieb absolut kühl, was wohl nicht zuletzt ein Verdienst von 80+ Gold ist....

Gruss

Christoph
 
So, inzwischen also 4 Tage Betrieb mit dem neuen NT und dem neuen Controller.
Bisher läuft alles absolut problemlos und stabil. Es gab keinen einzigen Absturz mehr in der Zeit.

Die Frischzellenkur scheint also gewirkt zu haben :)

Gruss

Christoph
 
Zurück
Oben