HowTo AMD Bulldozer Spiele Abstürze, Bluescreens etc. fixen

JanR

Ensign
Dabei seit
Nov. 2011
Beiträge
162
Hi,

es gab wohl ein Mikrocode-Update, das bei diesen BIOS-Updates mitkommt, aber leider schweigt AMD sich ueber die Details aus.

Auf Arbeit haben wir mehrere Personentage in Versuche versenkt, herauszufinden, warum unser FX-6100 bei ganz bestimmten Tests des NAS-Benchmarks der NASA (Parallelrechenbenchmarks) immer genau dann abstuerzt (mit Kernel Panic), wenn wir moduluebergreifend Last erzeugt haben. 2 Threads auf EINEM Modul -> tagelang stabil, zwei Threads auf ZWEI Modulen -> Absturz nach 30 Sekunden bis 20 Stunden.

Wir haben Kerneltraces analysiert, Kerneldebugging gemacht, Codepfade verfolgt, haben sogar schon erwogen, Testcode in den Kernel (Linux) reinzuhacken, um der Sache naeherzukommen, aber nichts davon hat zum Erfolg gefuehrt.

Eher aus Spass haben wir gecheckt, ob es fuer die Kiste ein BIOS-Update gibt - Problem geloest. Das Board ist uebrigens ein ASRock 880GMH/U3S3, also mit dem doch recht alten 880G Chipsatz.

Scheint mir zu obigen Spielen sehr zu passen... die sind ja auch alle multithreaded. Um es noch genauer zu sagen: Unser NAS-Benchmark ist immer dann stehengeblieben, wenn massiv zwischen den Kernen synchronisiert wurde.

Das lag wie anfangs vermutet nicht an einem Fehler direkt an der CPU sondern an den Chipsätzen 970 und 990, der durch ein Update des UEFI (oder ggf. noch BIOS) behoben werden kann.
Genau das glaube ich nicht! In unserem Fall war in dem BIOS-Update ganz sicher auch ein Mikrocode-Update dabei, was ja das interne Verhalten der CPU deutlich beeinflussen kann. Ich glaube eher an ein Problem mit Prozessor, das damit weggepatched wurde.

Viele Gruesse,

Jan
 
Zuletzt bearbeitet:

JanR

Ensign
Dabei seit
Nov. 2011
Beiträge
162
Hi,

bitte nicht den schoenen Thread kaputtmachen! Dieses AMD vs. Intel ist doch absolut nicht zielfuehrend.

Ich habe, als wir oben erwaehntes Problem hatten, ziemlich lange rumgesucht (eher auf linux- und multithreadinglastigen Seiten, eher nicht im Spielebereich) und habe rein nichts gefunden. Von daher finde ich diesen Thread interessant und wichtig, um dieser Sache vielleicht doch noch auf die Spur zu kommen.

Was ich oben vergessen hatte: In unserer Verzweifelung haben wir statt des Linux dann sogar noch FreeBSD installiert (basiert auf einem komplett anderen Kern mit vollkommen anderen SMP-Scheduling)... gleicher Benchmark stuerzte an der gleichen Stelle ab.

Viele Gruesse,

Jan
 
J

jumijumi

Gast
Genau das glaube ich nicht! In unserem Fall war in dem BIOS-Update ganz sicher auch ein Mikrocode-Update dabei, was ja das interne Verhalten der CPU deutlich beeinflussen kann. Ich glaube eher an ein Problem mit Prozessor, das damit weggepatched wurde.
Ich habe dazu etwas sehr Interessantes gefunden.
Die Beschreibung des BIOS/EFI-Updates vom 970 Extreme3:

Das selbe Bild beim 990FX Extreme3.
 
Zuletzt bearbeitet:

JanR

Ensign
Dabei seit
Nov. 2011
Beiträge
162
Hi,

aus irgendwelchen Gruenden sehe ich dein Bild nicht. Kannst du da per Link oder Beschreibung drauf verweisen?

Auf den Updateseiten steht lediglich "Update CPU code.", aber das hatte ich oben ja schon geschrieben. CPU-code ist mit sehr grosser Sicherheit genau das Microcode-Update.

Oder meintest du etwas anderes?

Viele Gruesse,

Jan
 
J

jumijumi

Gast
Anscheinend funktioniert die Verlinkungen zum Bild nicht richtig,
werde ich morgen fixen.
Das war eigentlich ein Screenshot der Patchnotes. Da steht Update CPU Code. Dann muss ich die Hälfte vom HowTo wohl nochmal überarbeiten. grrrrrrr :D
 

JanR

Ensign
Dabei seit
Nov. 2011
Beiträge
162
Hi,

Da steht Update CPU Code. Dann muss ich die Hälfte vom HowTo wohl nochmal überarbeiten.
Hast du denn irgendeine Referenz, die auf Chipsatzprobleme hindeutet?

Zumindest das, was wir auf Arbeit hatten, ist fuer mich sehr eindeutig Prozessor - diese Art von Synchronisation laeuft normalerweise ueber den L3-Cache (und selbst wenn sie es ueber den Speicher taete: Der hat bei AM3+ nichts mit dem Chipsatz zu tun). Wir hatten zudem extra noch mit verschiedenen Groessen der Datensets rumgespielt - war egal.

Darum ist meine Theorie: Microcodeupdate der CPU (das wird ins BIOS geflashed und bei jedem Start dann auf dei CPU geschoben... duerfte auch irgendwo im BKPG dokumentiert sein).

Viele Gruesse,

Jan
 

JanR

Ensign
Dabei seit
Nov. 2011
Beiträge
162
Hi,

so, jetzt sehe ich das Bild.

Wie gesagt, genau das meinte ich im ersten Posting: Da steckt ein Mikrocodeupdate im BIOS-Update mit drin.

Darum und aus den schon genannten Gruenden zu unseren Versuchen glaube ich an ein CPU-Problem.

Viele Gruesse,

Jan
 
Top