Thermische Spannung versus kühle CPU

Luckeie schrieb:
ch habe ja gefragt, weil es das erste Mal war, dass ich von einem Hinweis las, der darauf hin deutete, dass es für die Langlebigkeit besser sein könnte, eine nicht zu gut gekühlte CPU zu haben! Da dadurch der ständige große Temperatursprung und damit größere mechanische Spannungen ausbleiben.

Inwiefern besteht denn bei der Einrichtung der Kühlung überhaupt eine echte Wahlmöglichkeit? Bei einer aktuellen Intel oder AMD Desktop CPU muss der Heatspreader der CPU mögl. kalt gehalten werden, sonst laufen die Temperaturen unter Last in's Limit.

Die Kühlleistung kann bei einem Luftkühler im Sekundenbereich gar nicht geregelt werden, ausser vielleicht bei Wasserkühlung, wo man theoretisch die Pumpe kurz stoppen könnte.

Wenn nun die CPU eine Lastwechsel erfährt, wie soll die Kühlung darauf reagieren? Mit den herkömmlichen Mitteln (BIOS Lüfterkurven nach Temperatur geregelt) wird es schon nicht gelingen, auch nur den Lastwechsel zu erkennen.

Die CPUs sind dafür ausgelegt, über ihre Lebenszeit ständige Temperaturwechsel zu ertragen, da passiert nichts und es gibt auch praktisch keine Möglichkeit, dort gegenzusteuern.
 
  • Gefällt mir
Reaktionen: Baal Netbeck
@cool and silent: Meine praktische Erfahrung mit meinem Rechner ist etwas anders: Ich kann meine Kühlerkurven so konfigurieren, dass ich in Idle unter 40 Grad CPU Temperatur habe oder so, dass es ca. 50 Grad sind. In beiden Fällen rotieren meine Ventilatoren unter Volllast so schnell hoch, das die CPU Temperatur dann bei etwa 60 bis 70 Grad ist.
 
  • Gefällt mir
Reaktionen: cool and silent
Luckeie schrieb:
In beiden Fällen rotieren meine Ventilatoren unter Volllast so schnell hoch, das die CPU Temperatur dann bei etwa 60 bis 70 Grad ist.

Dass die Lüfter unter Volllast schnell hochlaufen, bezweifle ich nicht, aber wie unterscheidest Du Teillast von Volllast? Damit fängt es bei Ryzen 3000 beispielsweise schon an (Temperaturen können bei Teillast höher sein als bei Vollast)

Die Temperatur innerhalb der CPU ist ja alles andere als homogen, wir wissen genau genommen gar nicht, wie sich die Temperatur dort über die Chipfläche genau verteilt. Dann schlägt auch noch der Schedluler zu und verschiebt einen Thread von einem Kern zum nächsten, aber nicht über alle Kerne hinweg. Das sind alles hochdyynamische Prozesse, die nicht durch die eine Temperatur (bzw. eine pro Kern) abgebildet werden, die ein Auslesetool unter Windows berichten wird. Ich bin daher sehr skeptisch, ob sich die von Dir gewünschten Effekte einstellen werden, indem Du die IDLE Temperaturen etwas in die Höhe treibst. Wenigstens dürfte es unschädlich sein :-)

Um welche CPU handelt es sich denn?
 
  • Gefällt mir
Reaktionen: Tonks und Baal Netbeck
@cool and silent: Bei mir läuft ein 3950. Ich will das aber ja eher allgemein verstehen. Ich finde es einfach eine interessante Frage, die sicher für viele Mikroprozessoren relevant ist.
 
  • Gefällt mir
Reaktionen: cool and silent
Luckeie schrieb:
die sicher für viele Mikroprozessoren relevant ist.
Was aber für jeden Microprozessor anders gelagert sein wird.

Um so größer die Chips, um so mehr Probleme hast du mit thermal cycling....daher sind vermutlich Konsolen und GPUs auch stärker von brechenden Lötstellen betroffen.

Bei kleinen Chips, wie den 7nm Chiplets bei Zen2, wirst du eher Probleme mit Hotspot Temperaturen bekommen.

Aber ohne OC sehe ich da irgendwelche Befürchtungen, die CPU könnte frühzeitig sterben als unbegründet an.

Wenn du dir Sorgen machst, dann bau dir ne starke Kühlung ein....sorge für eine gute Gehäusebelüftung, damit Kondensatoren und Co. nicht zu warm laufen.

Bei einem Notebook kannst du auch undervolting machen und die Powerlimits senken.(Anleitung in meiner Signatur)
 
  • Gefällt mir
Reaktionen: cool and silent
Luckeie schrieb:
Bei mir läuft ein 3950. Ich will das aber ja eher allgemein verstehen. Ich finde es einfach eine interessante Frage, die sicher für viele Mikroprozessoren relevant ist.

Akadamisch ist das interessant, da bin ich bei Dir. Ich bezweifle jedoch die praktische Relevanz und die Machbarkeit.

Aufgrund der thermischen Trägheit des Kühlers bezweifle ich auch, dass die Reaktion auf einen Lastwechsel durch Änderung der Lüfterdrehzahlen so gelingen kann, wie Du es beschreibst.. Die Lüfterkurve und die Kühllösung, die das leisten soll, würde mich mal näher interessieren


Baal Netbeck schrieb:
Bei einem Notebook kannst du auch undervolting machen und die Powerlimits senken.(Anleitung in meiner Signatur)

Falls ernsthafte Sorge um die Langlebigkeit der CPU besteht, würde ich auch auf dem Desktopp UV und/oder Power Limits empfehlen. Ich halte die Sorge jedoch für gänzlich unbegründet. Nicht dass ich an eine Garantie auf ewige Haltbarkeit glaube, aber schon rein komerziell ist es einfach egal, wenn die CPU nach 10-20 Jahren den Geist aufgibt. Sie hat dann einen materiellen Wert von unter 100 Euro, völlig egal.

Andere Teile fallen erfahrungsgemäß früher aus, Mainboard, Netzteil, HDD, SSD.
 
  • Gefällt mir
Reaktionen: Baal Netbeck
Luckeie schrieb:
Ich habe ja gefragt, weil es das erste Mal war, dass ich von einem Hinweis las, der darauf hin deutete, dass es für die Langlebigkeit besser sein könnte, eine nicht zu gut gekühlte CPU zu haben!
In welchem Zusammenhang hast du denn überhaupt davon gelesen?

In einem Server oder Supercomputer, der immer irgendwie unter Last ist, kann man da sicherlich irgendwas optmieren.

Aber einen Heim-PC schaltet man ja auch immer wieder aus....da hast du als Minimaltemperatur immer die Raumtemperatur und die maximale Verspannung bei, der höchsten Gesamt-Temperatur....allerdings ist das bei Zen2 praktisch unmöglich zu wissen, da du immer nur einen errechneten Wert aus dutzenden Sensoren zu sehen bekommst.....und der orientiert sich am heißesten Sensor....über die Gesamttemperatur und damit die thermische Ausdehnung des Chips hast du gar keine Informationen.

So sieht die Temperatur bei Teillast höher aus, als bei Vollast, obwohl die Ausdehnung des Chips bei Vollast höher sein sollte.

Am Ende ist es wieder das gleiche....möglichst gut kühlen sorgt dafür, dass der Unterschied von "PC aus" zu "PC heiß" am geringsten ist.

Von 20°C zu 85°C oder zu 75°C wird meiner Einschätzung nach wichtiger sein, als die Schwankungen von 40 auf 85...vor allem wenn die 85 nur ein kleiner Teil des Chips ist.
Ergänzung ()

cool and silent schrieb:
Andere Teile fallen erfahrungsgemäß früher aus, Mainboard, Netzteil, HDD, SSD.
Leider wahr. :(
Mein schönes Asus P5Q-E ist auch gestorben, aber die CPU läuft noch munter weiter...leider jetzt auf einem Asrock billig Board mit ungekühlter 3Phasen Spannungsversorgung.:heul:
Ergänzung ()

Luckeie schrieb:
Ich könnte die Ventilatoren aber auch so einstellen, dass die CPU bei Idle 50 Grad warm ist und dann eben nur 10 Grad wärmer wird.
Blödsinn.

Die Temperaturen springen bei Lastwechseln so extrem hoch, dass du dann mit einer höheren Maximaltemperatur enden wirst...keine Kühlung kann im ms Bereich auf einen Lastwechsel reagieren.
Ergänzung ()

Nilson schrieb:
Nein, Silizium ist ein Warmleiter.
Gut, dass die CPU kein reines Silizium benutzt....so würde keine Schaltung funktionieren.

Die Ladungsträgerkonzentration muss immer durch die intirinsische Leitung dominiert sein, die die Dotierung vorgibt.

Eine CPU reagiert im Grunde wie ein Ohmscher Leiter....nur mit dem Unterschied, dass der Gesamtwiderstand vor allem durch die anliegende CPU Last gegeben ist.....viel Last, bedeuten viele Schaltvorgänge und einen geringen Widerstand....Idle hingegen hat fast alle Transistoren geschlossen und der Widerstand ist riesig.
 
Zuletzt bearbeitet:
@Baal Netbeck: Das war in irgendeinem Forum. Ein User hatte das behauptet. Leider finde ich den Beitrag im Moment nicht mehr. Es ist im Grunde auch egal, denn die mit der Behauptung verbundene grundsetzliche Argumentation ist für mich schlüssig. Darum wollte ich mehr darüber wissen.

Ob 20 zu 85 oder 40 zu 85 ist nur graduell von Bedeutung. Es geht hier um das Prinzip an sich: Sollte man große Sprünge in der Temperatur vermeiden um damit einhergehende beschleunigte Alterung aufgrund größerer mechanischer Beanspruchung zu vermeiden?

Generell - fällt mir gerade wieder auf - ja, manche Halbleiter können sehr lange halten und es ist vielen Leuten egal, ob ihr Mikroprozessor in 5 Jahren noch funktioniert. Aber damit man eigene Schätzungen vornehmen kann, ist es einfach interessant zu wissen, wie lange aktuelle CPUs (im Falle vom 3950 mit 7 nm Strukturen) tatsächlich halten? Ist ja auch immer weniger Material, was da noch für Alterungszwecke zur Verfügung steht.
Ergänzung ()

@cool and silent: Akademisch. Genau. Aber ob es wirklich keine praktische Relevanz hat, kann man ja eigentlich erst wissen, wenn man einmal ein paar belastbare Informationen dazu hat. Und zwar für die aktuellen 7 nm Strukturen und den Chiplet Aufbau. Und dann spielt es doch eine Rolle, was für ein Mikroprozessor es ist. Auch darum möchte ich es gerne wissen.
 
  • Gefällt mir
Reaktionen: cool and silent
Luckeie schrieb:
Ist ja auch immer weniger Material, was da noch für Alterungszwecke zur Verfügung steht.
Das dürfte für das Problem von thermal cycling von Vorteil sein.

Wenn sich der Chip von Raumtemperatur zu Maximaltemperatur um 2% vergrößert und das PCB um 1%....dann hast du weniger Verspannungen an den Lötstellen um so keiner der Chips ist.

Bei 7nm sehe ich eher das Problem von Chip-Degenerierung durch Hotspot Temperaturen und hohe Spannungen.
Um so kleiner die Schaltungen sind, um so weniger Atome machen die Schaltung aus.

Wenn durch hohe Hotspot-Temperaturen(Folge von hohen Spannungen) und hohe lokale Ströme(Folge von hoher CPU Auslastung+Spannung), die Beweglichkeit der Atome deutlich erhöht ist, kann es dazu kommen, dass Dotieratome die Position tauschen und irgendwann die Schaltung schlechter bis gar nicht mehr funktioniert.
Um so weniger Atome die Schaltung ausmachen, um so eher ist sie beeinflusst, wenn einzelne davon "wegwandern".

Ob das in naher Zukunft zu einem Problem werden könnte, kann keiner von uns sagen....Ich gehe davon aus, dass AMD nicht umsonst die Anzahl an Temperatursensoren von "einer zentral über jedem Kern" zu..."einige Dutzend direkt in den Schaltungen" gewechselt ist.....so kontrollieren sie sehr fein die Hotspot Temperaturen und können im ms Bereich darauf reagieren die Hitzeentwicklung zu verringern sobald es aus ihrer Sicht kritisch wird.

Und da wird es im Vorfeld Studien gegeben haben, was kritisch ist, und was nicht.

Ein gutes Gefühl habe ich zwar nicht bei den 1,5V die AMD da in einzelne Kerne pumpt...aber bei Zen2 hat man wenig Wahl....man kann sicherlich den Boost deaktivieren, aber damit deaktiviert man auch die Reaktion der CPU auf Hotspot Temperaturen....und man verliert die single core Leistung die die CPUs bieten.

Es kann gut sein, dass man mit allcore 1,325V mehr Schaden anrichtet, als AMDs Boost mit bis zu 1,5V.
Wäre toll, wenn uns AMD endlich die Kontrolle über die Boost-Taktraten geben würde, anstatt uns nur die Wahlmöglichkeit, Stock, PBO(grausig), oder allcore(eventuell schädlich und schlechtere single core Leistung) zu geben.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: cool and silent
@Luckeie

Das ist Rätselraten im Nebel. Man wird da nichts herausfinden können, selbst wenn die Resourcen vorhanden wären und wir uns heute 100 CPUs beschaffen, die in den nächsten 10 Jahren unterschiedlich belastet und gekühlt werden - in 10 Jahren sind die Herstellungsprozesse dann wieder andere und die Ausfallraten von Gestern erlauben keine Rückschlüsse auf morgen.

Ich würde einfach unverlötete CPUs meiden, das sind die kleineren AMD und Intel CPUs. Der eine, wirklich praxisrelevante Erfahrungswert ist, dass unverlötete CPUs nach einigen Jahren auffällig häufig zu thermischen Problemen neigen.

Alles weitere ist Kaffeesatzleserei.
 
  • Gefällt mir
Reaktionen: Baal Netbeck
Ja schade, dass man da nicht mehr heraus bekommt. Vielen Dank an alle, die sich auf das Thema ernsthaft eingelassen haben und mir fundierte Antworten gegeben haben. Wenn halt nicht genügend Informationen vorhanden sind, kommt man da wohl nicht weiter.
 
  • Gefällt mir
Reaktionen: Baal Netbeck
Luckeie schrieb:
Wenn halt nicht genügend Informationen vorhanden sind, kommt man da wohl nicht weiter.

Ja, Ich fürchte, das geht so weit in Richtung Geschäftsgeheimnisse der Chiphersteller, dass sich da öffentlich nichts finden lässt.

Was mich nebenbei nochmal interessieren würde - wie hätte das mit der Anpassung der Kühlung an einen Lastwechsel von IDLE auf Volllast jemals funktionieren sollen?

Ein Kühler mit 500g Alulamellen speichert rund 400 Joule pro Kelvin, also 400 Wattsekunden. Bei 10K Temperaturdelta auf dem Kühler, die notwendig sind, um die IDLE Tempertur der CPU um 10K anzuheben, muss der Lüfter 4000 Wattsekunden während des Lastwechsels aus dem Kühler abtransportieren. Das entspricht der Wärmemenge, die eine 150 Watt CPU in 30 Sekunden in den Kühler einträgt. Hier stimmen doch ganz offensichtlich die Größenordnungen nicht, und die Idee kann niemals funktionieren. Hinzu kommt noch, dass der Wärmeabtransport passieren muss, während die CPU nach dem Lastwechsel mit voller Kraft den Kühler heizt.
 
  • Gefällt mir
Reaktionen: Baal Netbeck
@cool and silent: Du stellst Fragen! :-) Ich bin mir nicht sicher ob ich Dir da adäquat antworten kann, da ich nicht über so viel Wissen in diesem Bereich verfüge. Ich kann Dir aber meine, vermutlich naive, Sicht der Dinge darstellen: Nachdem ich meinen recht neuen Computer mit dem 3950 einigermaßen am Laufen hatte, begann ich halt mit den Einstellungen für die Ventilatoren im BIOS zu spielen, immer mit dem Gedanken ihn möglichst lautlos kühl zu bekommen. Da hatte ich ihn schon bei Idle auf 50 Grad und später, mit stärker laufenden Ventilatoren, auf ca. 40 Grad. Durch den Tipp von @Tonks hier aus dem Forum habe ich auch noch den Energiesparplan von @sz_cb ausprobiert und kam so auf 35 Grad in Idle.

Wenn nun die Diskussion in diesem Thread irgendwelche Hinweise darauf gebracht hätte, dass die thermische Spannung durch einen großen Temperaturunterschied zwischen Idle und Last tatsächlich ein Problem sein könnte, hätte ich eben die Lüfter wieder so eingestellt, dass die CPU bei Idle auf 50 Grad läuft.

Mehr habe ich mir dabei nicht gedacht!
 
  • Gefällt mir
Reaktionen: cool and silent
@Luckeie @cool and silent @Baal Netbeck

Hmm.
1. Interessiert es das verbaute Material wirklich (nachweislich), ob der Temperaturunterschied 30, 50 oder 70 K ist?
2. Wäre es - falls thermische Spannungen tatsächlich relevant sind - für die Langlebigkeit aller direkt und indirekt involvierter Komponenten nicht sinnvoller, die Temperatur unter Last zu senken, statt sie im Leerlauf anzuheben?
 
sz_cb schrieb:
1. Interessiert es das verbaute Material wirklich (nachweislich), ob der Temperaturunterschied 30, 50 oder 70 K ist?
Dem Material der Chips wird der Temperaturunterschied egal sein....Aber die Chips und das PCB auf das sie aufgelötet sind, haben unterschiedliche Ausdehnungskoeffizienten.....das ist das Problem...nicht das Material an sich.

Naja es gibt halt nachweislich gehäufte Fälle vom großen Chips...bei GPUs und Konsolen, die durch Thermal Cycling gebrochene Lötstellen bekommen haben....Um so größer der Temperaturunterschied, um so heftiger die Verspannung an den Lötstellen.

Daher...ja der Temperaturunterschied zählt, aber es ist bestimmt kein Problem bei einem mini 7nm Chiplet.

Ich habe einfach mal für PCBs mit Kupferkern und 5 Schichten sowei für Siliziumoxid nach den Wärmeausdehungskoeffizienten gesucht....muss ja nur für eine Abschätzung reichen.
Ich habe 100-200ppm/K für ein PCB gefunden und 2,5 für Siliziumoxid....16,5 für Kupfer, was ja im PCB eingebettet ist...sagen wir die Kombination liegt bei 100 ppm/K

Dann sind das bei einem 10mm langen Chiplet und 70K Unterschied:
1,75 mikrometer Längenänderung für das Chiplet und 70Mikrometer für das PCB.

Eine Volta GPU mit 812mm² Die size sollte bei ungefär 28mm länge liegen....nur die Länge betrachtet und nicht die Flächenausdehnung, wären das im Vergleich:
4,9Mikrometer und 196 Mikrometer bei 70K Unterschied.

Einmal müssen sich die äußersten Lötstellen also grob um 95 Mikrometer gedehnt werden(Volta) und einmal nur um 34 Mikrometer(Zen2).
Und um so geringer der Temperaturunterschied, um so weniger Dehnung....da man die Art der Temperaturmessung nicht vergleichen kann, kann man leider keine Aussage treffen, wie weit die 70K überhaupt realistisch sind.....und das PCB wird nicht so heiß werden wie der Chip selbst...aber groß wird der Temperaturunterschied nicht werden....zumindest wird meine Grafikkarte auf der Rückseite durchaus extrem heiß.

Ich habe keine Ahnung, wie man diese Zahlen einschätzen muss, aber ein XBox One Chip liegt mit 19mm Länge ziemlich in der Mitte....und bei der XBox One gab es ja öfter Ausfälle, die man teilweise durch Backen reparieren konnte....und immer wenn Backen funktioniert, dann waren die Lötstellen das Problem.

Hat am Ende vermutlich neben Chipgröße und Maximaltemperatur auch stark mit dem verwendeten PCB, dem verendeten Lötzinn und der Nutzung zu tun, aber die Probleme sind in der Vergangenheit real gewesen.....ich sehe aber keine Probleme für Zen2.
sz_cb schrieb:
2. Wäre es - falls thermische Spannungen tatsächlich relevant sind - für die Langlebigkeit aller direkt und indirekt involvierter Komponenten nicht sinnvoller, die Temperatur unter Last zu senken, statt sie im Leerlauf anzuheben?
Genau das was ich sage.....Maximaltemperatur senken ist für die Haltbarkeit am besten.
 
  • Gefällt mir
Reaktionen: sz_cb
Meine Überlegung war folgende: Die Ausdehnungskoeffizienten gelten ja auch in die andere Richtung. Da müsste einem doch die CPU mitsamt Board quasi stante pede um die Ohren fliegen, wenn man nur partielle Teile davon mit LN2 kühlt.
 
sz_cb schrieb:
Die Ausdehnungskoeffizienten gelten ja auch in die andere Richtung. Da müsste einem doch die CPU mitsamt Board quasi stante pede um die Ohren fliegen, wenn man nur partielle Teile davon mit LN2 kühlt.
Tut es auch manchmal....guck mal Videos von LN2 OC...

In dem Video passiert nichts, aber LN2 OC geht nicht immer gut....
Aber du siehst, wie heftig sich das PCB verbiegt, und früher im Video, wo er den Kühler gerade montiert hat und anfängt LN2 einzufüllen, ist es noch gerade.
 
  • Gefällt mir
Reaktionen: sz_cb
Da liegen aber keine 70 K mehr dazwischen, sondern 200 ;) Aber ok, das veranschaulicht es ganz gut.
 
  • Gefällt mir
Reaktionen: Baal Netbeck
...Wie gesagt...Mikrometer Bereich wenn man es so abschätzt, wie ich es für einen CPU oder GPU Chip gemacht habe....sicherlich nur sehr grob und in ersten Näherung...die echten Zahlen können anders lauten, aber die Größenordnung sollte passen.

Und die Hardware ist ja durchaus resistent...das GPUs oder Konsolen dadurch kaputt gehen ist eher die Ausnahme
...ich wollte eigentlich die ganze Zeit auch gegen solche Bedenken argumentieren, aber physikalisch ist es ein bekanntes Phänomen, das man anerkennen sollte.

Nur ist es hier wie mit so vielen Dingen...man kann sich aus dem Wissen über solche Vorgänge in eine sinnlose Überbewertung hineinsteigern.....manchmal hilft es dann sich die Größenordnungen klar zu machen.
Das habe ich versucht.....allerdings muss ich zugeben, dass ich danach selbst nicht schlauer bin. ;)
Ich habe einfach kein Gefühl dafür, wie viel Elastizität Lötzinn hat....wie oft man das verbiegen kann, bevor es bricht...usw.
Ich glaube aber, dass man aus der Vergangenheit sehen kann, dass es nur Probleme mit größeren Chips gab....dass es durchaus noch deutlich größere Chips wie Volta gibt, die auch irgendwie funktionieren und dass insgesamt die allerwenigsten Probleme hatten.....die Theorie sagt: "Es ist ein Effekt vorhanden....die praktische Erfahrung sagt:"mach dir keine Gedanken drum."

Das ist so wie der Kamineffekt in einem PC Gehäuse....Verglichen mit der Kraft der Gehäuselüfter ist das vernachlässigbar....trotzdem haben Leute Angst das könnte ihre Kühlung versauen, wenn sie Luft unten rauspusten lassen.
 
  • Gefällt mir
Reaktionen: sz_cb
@sz_cb:
sz_cb schrieb:
Wäre es - falls thermische Spannungen tatsächlich relevant sind - für die Langlebigkeit aller direkt und indirekt involvierter Komponenten nicht sinnvoller, die Temperatur unter Last zu senken, statt sie im Leerlauf anzuheben?

Um es ganz deutlich zu machen: Wer hat schon einmal versucht einen dicken Draht in zwei Teile zu brechen? Man nimmt den Draht und biegt ihn immer wieder hin und her und irgendwann bricht er dann. Das ist genau die Vorstellung die ich habe, wenn ein Mikroprozessor immer wieder heiss und kalt wird. Um das zu vermeiden, dachte ich, sollte man die Temperaturdifferenz so klein wie möglich halten und damit eben nicht so tief runter kühlen.
 
Zurück
Oben