Chia plotting bricht ab PC stürzt ab und farming bricht ab

-=Azrael=- schrieb:
Welche Chia Version nutzt du?
Ich schaue immer die aktuellste Version, kurz nach dem Erscheinen, zu installieren.
Ist aktuell aktuell.
-=Azrael=- schrieb:
Madmax oder Gigahorse(ebenfalls von MadMax)?
Ich nutze madmax
-=Azrael=- schrieb:
Der MadMax Plotter wird nicht weiter gepflegt, zumal schon seit letztem Jahr komprimierte Plots draußen sind.

Entweder per Gigahorse komprimierte Plots erstellen, da bist du an die Software gebunden(closed source) und drückst die 0.25 Chia an MadMax ab.
Hab ich gar nicht mitbekommen, dass madmax nicht mehr gepflegt wird.
Und auf die Idee einen anderen Plotter zu benutzen kam ich tatsächlich noch nicht.

Lässt sich mit Gigahorse auch über Powershell plotten?
Hast Du mir eine Befehlszeile? Bei madmax hab ich immer mit -k5 -r32 geplottet.
Wie oft werden die 0.25 xch abgezogen?
Bei jedem Gewinn eines Plots, der über Gigahorse erstellt wurde, oder regelmässig?
-=Azrael=- schrieb:
Oder per Bladebit Cuda (offizieller Chia Plotter) Plots erstellen. Für Bladebit brauchst du aber min. 128GB RAM. Gigahorse setzt glaub ich min 64GB vorraus.
NOSSD wäre auch ne Option, ist aber ebenfalls closed source und ich würde es mir zweimal überlegen ob ich die Software in mein Netz lassen würde.

Wie sind die 40 HDDs in den Icybox Cases angebunden? Per USB?
Die HDDs sind zu je 10 Stück in 4 Boxen.
3 Boxen an USB 2, da es der Controller USB 3 Controller nicht verpackt, und eine an USB-C 3.
-=Azrael=- schrieb:
Bei so vielen HDDs würde ich eher auf ein HBA + JBOD gehen.
Sind die IcyBoxen nicht eine Art JBOD?
-=Azrael=- schrieb:
Mal die 40 externen HDDs weggelassen und geprüft ob der Node dann durchläuft?
Ich glaube das hab ich schon erfolglos versucht, werde es aber nochmal testen.
-=Azrael=- schrieb:
Mal in den Chia Log geschaut?
Ja, sieht seit kurzem katastrophal aus. Mit den Meisten Infos daraus fang ich nichts an.
Muss ich morgen, wenn ich wieder Zuhause bin Mal hochladen.
Vielleicht kann das ja jemand entschlüsseln, und es löst die Probleme.




Ich finde es auch ganz komisch, dass das Farming immer wieder abbricht.
Mal zeigt die GUI keine Plots mehr an, Mal steht an allen Ecken und Enden Fehler.
 
deadletters schrieb:
Lässt sich mit Gigahorse auch über Powershell plotten?
Kann ich dir nicht sagen, gehe aber davon aus.
Gigahorse ist komplett closed source, damit erstellte Plots kann man nur mit der Gigahorse Software(Plotter&Farmer) nutzen.

Bladebit Cuda ist direkt von Chia, setzte wie gesagt min. 128GB RAM und eine NV GPU vorraus.

Je nach Kompressions Level und Anzahl der Plots ist dann auch eine GPU für Farming nötig, gilt sowohl für Gigahorse, Bladebit und NOSSD. Demnächst wird der Filter angepasst, also quasi die Diff.


deadletters schrieb:
Wie oft werden die 0.25 xch abgezogen?
Ist Prozentual, kann aber sein das man z.B. 7 Blöcke hintereinander findet und die 0.25 XCH gehen dann jeweils an MadMax oder er bekommt nichts. Weitere Infos hier: https://github.com/madMAx43v3r/chia-gigahorse
deadletters schrieb:
Sind die IcyBoxen nicht eine Art JBOD?
Eher sowas wie ein 1 bis 4HE 19" Rackcase in dem nur HDDs sind. wie z.B. ein Seagate EXOS E 4U106.
Gibt genug Rackcases auf Ebay & Co.

Bezüglich des Chia Logs, da sind nur Warning/Error Zeilen interessant, der Großteil wird nur Info sein, kommt natürlich drauf an, wie man das Log Level eingestellt hat.
deadletters schrieb:
3 Boxen an USB 2, da es der Controller USB 3 Controller nicht verpackt, und eine an USB-C 3.

Das könnte schon die Ursache sein, wie bereits gesagt, bei so vielen HDDs und Plots geht man eher auf HBAs und 19" JBODs.
 
-=Azrael=- schrieb:
Bladebit Cuda ist direkt von Chia, setzte wie gesagt min. 128GB RAM und eine NV GPU vorraus.
Habe ich ausprobiert, läuft auch mit meinen 64GB RAM, lastet mir allerdings die Systemplatte zu 100% aus. Müsste ich da den virtuellen Arbeitsspeicher auf eine der plotting Nvmes schieben?
-=Azrael=- schrieb:
Je nach Kompressions Level und Anzahl der Plots ist dann auch eine GPU für Farming nötig, gilt sowohl für Gigahorse, Bladebit und NOSSD. Demnächst wird der Filter angepasst, also quasi die Diff.
Bladebit discplot lässt aktuell leider keine Kompression zu, laut Ausgabe aufgrund eines Bugs.

Chia Proof of Space habe ich inzwischen auch ausprobiert, mit vollen 32 Threads und 20GB RAM als Buffer, schiesst mir den PC auch mit Bluescreen ab.

-=Azrael=- schrieb:
Eher sowas wie ein 1 bis 4HE 19" Rackcase in dem nur HDDs sind. wie z.B. ein Seagate EXOS E 4U106.
Gibt genug Rackcases auf Ebay & Co.

Das könnte schon die Ursache sein, wie bereits gesagt, bei so vielen HDDs und Plots geht man eher auf HBAs und 19" JBODs.
Dazu fehlt mir bisher leider das KnowHow, und ich bräuchte jemand an der Seite, der mich genau anleitet.

Aktuell laufen 2 Bladebit Dsicplots parallel, danach zieh ich die IcyBoxen ab, und teste Madmax erneut.

-=Azrael=- schrieb:
Bezüglich des Chia Logs, da sind nur Warning/Error Zeilen interessant, der Großteil wird nur Info sein, kommt natürlich drauf an, wie man das Log Level eingestellt hat.
Von Warning/Error gibt es viel.Hab den Log angehängt.
Ergänzung ()

OK, Bladbit discplot hat nach einer Stunde abgebrochen:

Table 3
STDERR:

STDERR: Fatal Error:

STDERR: Failed to read from 'y1_0' work file with error 0 (0x0).
Ergänzung ()

Alle externen HDDs weg, madmax bricht nach dem 1. Schritt ab
 

Anhänge

  • debug.txt
    7 MB · Aufrufe: 35
Zuletzt bearbeitet:
Chia Proof of Space 2 Plots parallel mit je 32 Threads + 10000 Buffer ohne externe HDDs = Bluescreen
Ergänzung ()

Stellen mklins ein Problem dar?
ich hab den . chia Ordner per mklink von C auf D verlegt.
 
Zuletzt bearbeitet:
OK, Bidblate cuda ist durch gelaufen, ABER: nur ein Plot parallel möglich, UND: 1 Plot = 1,5h
 
Dein Log ist voll mit Src oder Size Fehlern. Entweder die Quelle(Src) wird nicht gefunden oder die Plots Size wird nicht korrekt übermittelt.

Wahrscheinlich hängt sich dann hier Chia komplett auf und verursacht dann ein Bluescreen.

Nutzt du einen extra USB Controller oder nutzt du alles vom Mainboard?

Ein HBA+JBOD ist jetzt keine Raketen Technik, der HBA hat die Anschlüsse für den JBOD halt hinten und wird so mit dem JBOD verbunden, der JBOD wiederum hat ne Backplane für die HDDs und übernimmt die Stromversorgung.
Musst halt nur wissen wieviel du ausgeben willst.

1,5h für einen Plot? Mein 3700x +128GB RAM +RTX3060Ti +2TB SSD(PCIe 4) macht Plots alle 7 Minuten unter Ubuntu.
 
Die Src Fehler entstehen wenn die Festplatten nicht angeschlossen sind.
Die Size-Fehler sind neu.

Ich hab auch schon config.yaml gelöscht, neu erstellen lassen, dann erstmal ohne Pfadangaben geplottet -> Bluescreen

USB läuft rein über's Mainboard. Sind ja insgesamt auch nur 4 Kabel. 3 an USB 2, und eines an USB-C 3.

Hab ja nur 64GB und nur eine RTX2070.
Mein Befehl war: chia.exe plotters bladebit cudaplot -n 1 -t F:\chiatemp -d R:\ -r0 --compress 5 --disk-128



Nochmal versucht mit madmax - Bluescreen:
DPC watchdog violation

was soll ich tun um weiter zu kommen?

Welchen Befehl soll ich zum Plotten versuchen?
Ergänzung ()

ich hab in genau der Konstellation schon 8 Plots parallel kreiert, und jetzt läuft nicht mal mehr einer. das ist echt frustrierend.
ich plotte mir die nvmes tot, aber es kommt nichts bei raus.
hin und wieder laufen mal 1-2 plots über madmax durch, aber dann wieder Essig
 
Zuletzt bearbeitet:
Ich denke nicht das es an den Plottern liegt, entweder OS zurücksetzen oder mal Windows frisch installieren.
Ggf. hast du ein Hardware Problem.
 
welche Hardware?

denn mit Windows ganz neu hab ich es ja schon versucht

RAM ist noch recht neu, hab ich austauschen lassen, da die RGB-Steuerung bei einem Riegel nicht mehr funktioniert hat, und in HWMonitor die Bezeichnung nur noch aus kryptischen Zeichen bestand.

Wie finde ich raus woran es liegt?

Im Verdacht hab ich dennoch den RAM, aber es gibt bei Prime95 kein Problem. Den Ramtest von Windows hab ich auch schon ohne Probleme laufen lassen.
 
Zuletzt bearbeitet:
deadletters schrieb:
denn mit Windows ganz neu hab ich es ja schon versucht
Mhm ok.
deadletters schrieb:
Im Verdacht hab ich dennoch den RAM, aber es gibt bei Prime95 kein Problem. Den Ramtest von Windows hab ich auch schon ohne Probleme laufen lassen.
Dann lass mal memtest laufen, findest du hier bei CB in den Downloads.

Ich hatte ein ähnliches Problem bei meinem Plotter.
Ich hab Vollbestückung auf einem X570 Mainboard, der RAM ist allerdings laut G.Skill nur mit 2 Modulen und der angegeben MHz kompatibel.
Selbst die Autoeinstellungen liefen nicht ok, da zwei Werte, CL und CAS, falsch eingestellt wurden.
Erst nachdem ich alles manuell eingestellt hatte, lief das System unter Windows und Linux stabil.
Bin aber unter Ubuntu geblieben, da Linux auch beim CUDA plotten schneller ist.

Mein Node läuft z.B. in einer Win11 VM unter Proxmox(neben anderen VMs) und C5 Plots ohne Probleme.
 
Memtest muss ich die Tage schauen.

Hab jetzt die Riegel Mal umgesteckt von A2+B2 auf A1+B1. Daraufhin startete der Rechner nicht mehr. Erst nachdem ich wieder umgesteckt hat startete das System nach einiger Zeit wieder.
Ist das normal?
 
Ist mir bekannt, ging nur nicht davon aus, dass dann A1+B1 quasi deaktiviert sind.

Memtest86 hat inzwischen den 3. Durchlauf ohne Fehler absolviert.


Mir kam eben der Gedanke:
Das Mainboard hat 4 Nvme Slots und 6 SATA Anschlüsse.
Einer der Nvme Anschlüsse nutzt die gleiche Schnittstelle wie zwei der SATA Anschlüsse.
Das heisst Entscheidung zwischen vier Nvme + 4x SATA oder 3 Nvme + 6x SATA. Ich hab aktuell zweites.
Ist zwar weit hergeholt, aber ich werde sobald ich dazu komme, die internen HDDs abstecken, und testen, wir sich das System dann verhält.
 
Zuletzt bearbeitet:
Normalerweise ist dann einfach der M.2 deaktiviert, da die PCIe Lanes nicht mehr zur Verfügung stehen.
UEFI/BIOS ist auch aktuell?
 
Memtest86 ist problemlos ohne Fehler durchgelaufen.

BIOS aktuell.

Ich habe alle HDDs abgesteckt, macht kein Unterschied.

Hab nochmal die Arbeitsspeicher einzeln probiert.
Jetzt wird es noch komisch:
Arbeitsspeicher 1 in Slot A2 generiert in 2 parallel laufenden Prozessen jeweils 11 Dateien. Also 22 Dateien nacheinander immer 2 gleichzeitig.
Arbeitsspeicher 2 bricht in Slot A2 Recht bald ab und auf zweiten Versuch PC Absturz.
Arbeitsspeicher 1 in Slot B2 generiert eine Weile, dann PC Absturz.

Ich lasse Arbeitsspeicher 1 gerade nochmal in Slot A2 laufen
 
Absturz Absturz Absturz.

Erneuter Versuch:
Systemplatte auf eine der Plotting-Nvmes gespiegelt, eigentliche System-Nvme raus, erstmal sah es ganz gut aus, aber beim 2. Plot -> Bluescreen.

Was kann ich noch machen/versuchen?
Wie finde ich heraus woran es nun liegt?
 
Zuletzt bearbeitet:
Welche Meldung bekommst du den beim Bluescreen?
Hast du irgendeine Art von overclocking durchgeführt?

Schon mal
sfc /scannow
DISM /Online /Cleanup-Image /CheckHealth
DISM /Online /Cleanup-Image /ScanHealth
DISM /Online /Cleanup-Image /RestoreHealth
durchgeführt?
Alle Treiber aktuell?

Läuft der Node wenn du plots erstellst bzw. läuft der Node überhaupt durch?
 
Es sind unterschiedliche Meldungen.
Jetzt gerade ich glaube auch die häufigste IRQL NOT LESS OR EQUAL
What failed: ntosknl.exe
Hab aber auch schon EXCEPTION ON INVALID STACK und DPC WATCHDOG VIOLATION gesehen.

Nur XMP1 aktiviert. Wie für den RAM vorgesehen. Also eigentlich kein overclocking. Hatte es testweise auch schon abgeschaltet.

-=Azrael=- schrieb:
Ja, immer Mal wieder, vorhin erst, gab Reparaturen.
Führe ich zur Zeit immerwieder aus, wegen den ganzen Abstürzen, da kann jedes Mal irgendwas beschädigt werden.
-=Azrael=- schrieb:
DISM /Online /Cleanup-Image /CheckHealth
Nein
-=Azrael=- schrieb:
DISM /Online /Cleanup-Image /ScanHealth
Nein
-=Azrael=- schrieb:
DISM /Online /Cleanup-Image /RestoreHealth
durchgeführt?
Ja
-=Azrael=- schrieb:
Alle Treiber aktuell?
Ich halte mein komplettes System immer aktuell. Updates mindestens 1x/Woche

Die Node läuft durchweg. Also beim Plotten und sonst auch.
In letzter Zeit kam es aber immerwieder zu Fehlern.
Also Node lief, und zeigte aber im Status und an allen möglichen anderen Stellen "Fehler" an.
Das geschieht nach einer ganzen Weile, wenn der PC einfach nur Farmen soll.
Es kommt auch vor, dass einfach keine Plots mehr vorhanden sind, und ich die Node neu starten muss.
Selbiges bei der parallel laufenden Chives Node (mit der Fehleranzeige ist es das irgendwie etwas anderes, ich glaub die zeigt nicht Fehler an sondern es fehlen dann einfach die Plots, weiss es aber gerade nicht genau).
Ergänzung ()

Es ist auch nicht immer, dass der PC beim Plotten abstürzt, manchmal bricht der Plot auch einfach ab.
Wenn es echt gut läuft laufen auch Mal ein paar Plots durch.
Vor ein paar Tagen sogar 22, also immer 2 parallel, pro Powershell Tab 11.
Meistens wird aber nur ein Plot fertig, und kurz nach Beginn des zweiten gibt's dann den Bluescreen.
Wenn überhaupt einer fertig wird.
Ergänzung ()

Hab mir die Nodes inzwischen in Autostart gelegt, dass wenn der PC abschmiert zumindest das Farmen wieder in Gang kommt, was aber auch nicht garantiert ist, da es sein kann, ich muss die Node neu starten, dass bei den Plots nicht nur der Kreisel kommt.


Meist ist es gerade so, dass wenn ich das Plotten starte, es nach dem ersten Schritt abbricht, und die Befehlseingabe wieder da steht. Nach erneutem anstossen kann es sein die Befehlseingabe erscheint nach kurzem erneut, oder es geht ein Stück weiter, und dann Bluescreen.
 
Zuletzt bearbeitet:
Sind die Energieoptionen entsprechend angepasst, also kein ausschalten der HDD nach Zeitraum X?

Deine RAM Tests liefen ja ok, das einzige was du machen kannst ist Prime95 wo er alles durchtestet.

Wenn das alles nicht hilft....
UEFI Reset oder defaults laden.
Neues Win Installations Medium auf einem anderen Rechner erstellen und Windows erstmal ohne die HDDs installieren.
Nach allen Updates und Treibern , erstmal nur plotten probieren.
 
-=Azrael=- schrieb:
Sind die Energieoptionen entsprechend angepasst, also kein ausschalten der HDD nach Zeitraum X?
Klar
-=Azrael=- schrieb:
Deine RAM Tests liefen ja ok, das einzige was du machen kannst ist Prime95 wo er alles durchtestet.
Ist schon über 2h gelaufen. Ohne Probleme.
-=Azrael=- schrieb:
Wenn das alles nicht hilft....
UEFI Reset oder defaults laden.
Uefi habe ich bereits ein Backflash gemacht, und ohne Erfolg getestet. Danach wieder auf die aktuelle Version.
Nach jedem Flash wird das UEFI zurückgesetzt. Ich habe bei beiden Versionen im Rohzustand getestet. Ohne Erfolg.
-=Azrael=- schrieb:
Neues Win Installations Medium auf einem anderen Rechner erstellen und Windows erstmal ohne die HDDs installieren.
Ich nutze einen Stick mit Ventoy. ISO-Datei auf den Stick geladen, und damit installiert.
-=Azrael=- schrieb:
Nach allen Updates und Treibern , erstmal nur plotten probieren.
Ich habe bereits versucht Windows 11 Pro die normale release Version auf einer der guten Nvmes installiert, alle Treiber und nötigen Tools, sowie alle Updates.
Dann die Chia GUI und plotten.
Der Unterschied war, dass der Bluescreen blau und nicht grün war.


Könnten Symlinks die Probleme verursachen? Ich habe den .Chia und Key-Ordner von C auf D verschoben (ist aber die gleiche Festplatte), und per Symlinks verbunden, um die Datenbank, config und Key-Datei bei einem Systemcrash nicht zu verlieren.
Ich glaube eigentlich nicht, dass das was ausmacht, da ich so bereits einige 100 Plots erstellt habe.

Oder kann die Grafikkarte rein spuken?
 
Zurück
Oben