Hallo zusammen,
folgendes Setup bereitet mir Kopfzerbrechen:
TR 1950X auf einem Asrock Taichi X399M mit 4 G-Skill Ripjaws (insgesamt 64 GB) (2666 CL15 glaub' ich) und einer Nvidia GTX 1060. Der Prozessor wird von einem Liqtech 360 gekühlt. Persistenten Speicher gibt's mit einer Samsung 960 1TB. (edit: Ergänzung) Strom kommt von 'nem bequiet DarkPower 850 Platinum.
Was ich tun wollte:
Die Idee hinter dem Setup war einen Buildprozess zu beschleunigen für ein bis drei konkrete Projekte, also Compilen von C-Code. Das Projekt hat einige hundert bis vielleicht höchstens tausend .c-Files und kompiliert die erst Mal zu je einem Object bevor am Ende alles gelinkt wird. Nichts besonderes soweit. Die Anzahl an Threads ist einstellbar, ich habe mal 16 und mal 32 gewählt, reißt nicht viel raus, ist auch okay, sind ja nur Threads, keine echten CPU-Kerne.
Womit ich vergleiche/was mich stört:
Der Schritt im Buildprozess der oben genannte Kompilierung ausführt dauert zum Beispiel 13 Minuten. Auf meinem Laptop, den ich vorher dafür verwendet habe dauert er 16 Minuten. Das war ein i7-Quadcore (ich glaube i7-4800MQ, auf jeden Fall was in der Größenordnung) geht das in 16 Minuten.
Okay, es ist schneller geworden, aber ich muss ganz offen sagen ich habe mir einfach einen Faktor "4 minus ein bisschen was" erwartet.
Randanmerkung: Bevor ich im UEFI auf RAM-Profil 1 umgestellt habe ging es noch langsamer (langsamer als das Notebook..), gleichzeitig hatte ich aber den lokalen Speicher im Ryzen Master eingestellt.. Kann also beides geholfen haben. Hat dann aber wohl eine echt starke Auswirkung.
Die Frage:
War meine Annahme falsch wenn ich doch einen so ultra-parallelisierbaren Prozess habe, dass das allerwenigstens mal doppelt so schnell sein sollte oder liegt es doch an irgendeinem Setup-Fehler den ich gemacht habe? Die Temperatur laut hwinfo hängt bei Last dann irgendwo so bei 60° Tdie. Die CPU-Auslastung lt. Taskmanager ist bei 100% (3% pro Prozess, was ja bei 32 virtuellen Kernen evtl. Sinn macht).
Bin für jede (kreative) Erklärung oder Verbesserungsidee dankbar, momentan sitz' ich nämlich recht verständnislos vor der Kiste.
folgendes Setup bereitet mir Kopfzerbrechen:
TR 1950X auf einem Asrock Taichi X399M mit 4 G-Skill Ripjaws (insgesamt 64 GB) (2666 CL15 glaub' ich) und einer Nvidia GTX 1060. Der Prozessor wird von einem Liqtech 360 gekühlt. Persistenten Speicher gibt's mit einer Samsung 960 1TB. (edit: Ergänzung) Strom kommt von 'nem bequiet DarkPower 850 Platinum.
Was ich tun wollte:
Die Idee hinter dem Setup war einen Buildprozess zu beschleunigen für ein bis drei konkrete Projekte, also Compilen von C-Code. Das Projekt hat einige hundert bis vielleicht höchstens tausend .c-Files und kompiliert die erst Mal zu je einem Object bevor am Ende alles gelinkt wird. Nichts besonderes soweit. Die Anzahl an Threads ist einstellbar, ich habe mal 16 und mal 32 gewählt, reißt nicht viel raus, ist auch okay, sind ja nur Threads, keine echten CPU-Kerne.
Womit ich vergleiche/was mich stört:
Der Schritt im Buildprozess der oben genannte Kompilierung ausführt dauert zum Beispiel 13 Minuten. Auf meinem Laptop, den ich vorher dafür verwendet habe dauert er 16 Minuten. Das war ein i7-Quadcore (ich glaube i7-4800MQ, auf jeden Fall was in der Größenordnung) geht das in 16 Minuten.
Okay, es ist schneller geworden, aber ich muss ganz offen sagen ich habe mir einfach einen Faktor "4 minus ein bisschen was" erwartet.
Randanmerkung: Bevor ich im UEFI auf RAM-Profil 1 umgestellt habe ging es noch langsamer (langsamer als das Notebook..), gleichzeitig hatte ich aber den lokalen Speicher im Ryzen Master eingestellt.. Kann also beides geholfen haben. Hat dann aber wohl eine echt starke Auswirkung.
Die Frage:
War meine Annahme falsch wenn ich doch einen so ultra-parallelisierbaren Prozess habe, dass das allerwenigstens mal doppelt so schnell sein sollte oder liegt es doch an irgendeinem Setup-Fehler den ich gemacht habe? Die Temperatur laut hwinfo hängt bei Last dann irgendwo so bei 60° Tdie. Die CPU-Auslastung lt. Taskmanager ist bei 100% (3% pro Prozess, was ja bei 32 virtuellen Kernen evtl. Sinn macht).
Bin für jede (kreative) Erklärung oder Verbesserungsidee dankbar, momentan sitz' ich nämlich recht verständnislos vor der Kiste.
Zuletzt bearbeitet: