Welchen Prozessor ist am besten für einen Rechenknoten?

aabbeeff

Cadet 2nd Year
Registriert
Sep. 2011
Beiträge
19
Hallo zusammen,

ich betreibe als Hobby zwei Rechenknoten, mit denen ich quantenchemische Probleme untersuche. Gegenwärtig arbeite ich großteils mit NWChem. Ich habe nun einen AMD Phenom II X4 965 auf einem der beiden Rechenknoten, den ich gern durch einen neueren Prozessor ersetzen möchte. Ich frage mich jedoch, welcher am besten geeignet ist.

Anforderungen:
  • Die Rechenknoten stehen im Serverraum. Von daher sind für mich Aspekte wie Abwärme, Lautstärke und Stromverbrauch zweitrangig.
  • Am liebsten würde ich mir ein Serverboard kaufen, 4 Sockel mit je einem 12-Kerner versehen und noch 512 MB RAM einbauen. Leider ist das für mich nicht bezahlbar. Wichtig ist mir daher ein gutes Verhältnis von Preis zu Leistung.
  • Da ich ausschließlich Berechnungen anstellen möchte, ist mir die Leistung im Desktopbetrieb und in Spielen völlig egal. Mir geht es nur um reine Rechenleistung.
  • Die eingesetzten Programme sind für paralleles Rechnen entwickelt. Mich interessiert also nur die Gesamtleistung des Prozessors, nicht die Leistung pro Kern/Modul.
  • Ich compiliere alle Programme für das jeweilige System auf dem sie laufen neu. Daher macht es einen deutlichen Unterschied, welche Befehlssätze unterstützt werden.

Nach vielem Lesen habe ich einige Möglichkeiten zusammengetragen und möchte gern eure Meinung wissen.

Option 1: i7-990X
Zweifellos ist dies der schnellste Prozessor den man gegenwärtig bekommen kann, wenn man vom Serverbereich absieht. Von der Leistung her spricht nicht viel gegen ihn, jedoch ist die Unterstützung moderner Befehlsätze nicht gegeben. Außerdem ist der Preis hart an der Schmerzgrenze.

Option 2: i7-2600K
Der 2600K schneidet in den meistens Benchmarks recht gut ab, unterstützt AVX und ist auch günstig zu haben. Insofern bietet er ein gutes Verhältnis aus Preis zu Leistung. Allerdings ist der Vorsprung in den synthetischen Benchmarks, die vermutlich näher an meinem Anwendungsfeld sind, meist nicht sonderlich groß. Allerdings habe ich irgendwo gelesen, er soll bei voller Auslastung mit vielen Threads (also 8 in diesem Fall) Schwächen haben.

Option 3: Phenom II X6 1100T
Von der Leistung her spricht nicht viel für den 1100T. Er ist in nahezu allen Benchmarks abgeschlagen und ihm fehlen einige moderne Befehlssätze. Allerdings bietet er für seinen Preis immernoch eine ordentliche Leistung. Von daher spricht vor allem der Preis für ihn.

Option 4: FX-8150
Hier scheiden sich die Meinungen. Die einen sagen, AMD-FX ist schrott, die anderen meinen, die Software muss nur optimiert sein. Der Test mit C-Ray 1.1 bei HT4U scheint ja die zweite Position zu bestätigen. Jedoch zeigt der FX-8150 bei dem Test von P3D trotz AVX im Linpack kein überzeugendes Ergebnis. Wenn es wirklich eine Frage der Optimierung wäre, dann ist das kein Problem, da ich ja alle Programme für jeden Rechenknoten neu compiliere. Ich bin aber bisher nicht überzeugt, dass dort wirklich die Probleme vom FX-8150 liegen.

Ich persönlich tendiere zu Option 3, weil es die billigste ist. Ich bin mir aber unsicher, wie viel Gewicht optimierte Software nun wirklich hat. Wenn der FX-8150 von AVX und FMA4 profitieren kann, dann wird er vermutlich auch den 2600K schlagen und dabei weniger Kosten. Aber wenn dem nicht so ist, dann würde ich viel Geld für nichts ausgeben. Ich bin auch offen für andere Optionen, sofern sie bezahlbar sind.

Edit: Ich würde ungern mehr als 700€ ausgeben.
 
Zuletzt bearbeitet:
Finger weg von dem Phenom X6!

In deinem Bereich ist eine Intel CPU deutlich (!) überlegen.

Allerdings würde ich eher den i5-2500k anstatt i7-2600k, wenn die Kostenfrage doch nicht unwesentlich ist.
 
Hay,

ohaaaaaaaa, sry jungs mein Fehler hier mal der Warenkorb als Bildchen ^^

2iqhbom.jpg


So bitte.
Allerdings muss ich dazu sagen, das das leicht dein Budget übersteigt, du damit aber aufjedenfall ruhe hast und genug Rechenpower um auch für die nächsten Jahre deine Berechnungen durchführen kannst!
Wie heißt es so schön: Einmal richtg Investiert, ist für die Zukunft Investiert!

MfG
 
Zuletzt bearbeitet:
Wenn xeon dann SB also E3 1230 z.B., der ist auch billiger als ein 2600k und passt auf normale Desktopboards Die restlichen Xeons 2 Sockel und mehr sind noch veraltet und bleiben es bis März nächsten Jahres auch 55.. vorvorletzte Generation 56.. vorletzte Generation.

FX 8150 kann Option sein, aber bisher noch wenig Erfahrungswerte vorhanden. Die Tests liefen bisher primär auf theoretische Spieleperformence mit theoretischer Grafikkartenperformence in 2 Jahren hinaus. Jetzt sind diese Teste im Grunde nichtsagend, da die Grafikkarte immer limitert bei aktuellen Spielen.
 
Hallo und danke für die Antworten. Es scheint ja doch ein eindeutiges Votum in Richtung Serverprozessoren zu geben. An der Stelle bleiben für mich jedoch einige Fragen offen:
  • Kann jemand die Leistungsunterschiede zwischen Xeon und Phenom II quantifizieren?
  • Wären dann auch Opterons eine Alternative? Zumindest im Preis können die ja locker mit den Xeons mithalten.
  • Wie ist es mit dem Arbeitsspeicher? Bei vielen Serverprozessoren steht in den Spezifikationen nur DDR3 1333. Ich meine mich zu erinnern, dass ich bei meinem Phenom II X6 nach dem Wechsel von 1333 auf 1600 irgendwas um 8% Leistungsgewinn hatte. Das mag nicht viel klingen, aber bei Berechnungen, die über Wochen laufen, können das Tage sein. Bei Verteilung auf zwei Rechenknoten kommt man sogar fast an eine Woche ran, wenn man von 30 Tagen Rechenzeit ausgeht. Die Xeons und Opterons sind offensichtlich aber nur für 1333er RAM spezifiziert. Kann man die auch mit 1600er RAM betreiben?
  • Haben Serverprozessoren auch Potential zur Übertaktung? Mein Phenom II X6 läuft z.B. gerade bei 4GHz. Die Prozessoren, die ich in meinem ersten Post erwähnt hatte, haben ja auch noch etwas Luft nach oben.
 
Du solltest Dich in einem Forum informieren, indem andere ähnliche Probleme behandeln.
Ich habe im Bereich wissenschaftliches Rechnen bei Clustern mit wenigen Knoten keine guten Erfahrungen mit Serverprozessoren, das gilt sowohl für Xeon als auch für Opteron. Sie sind meist zugunsten der Energieeffizienz und zur Reduktion der Kühllast niedrig getaktet, d.h. lahm und schweineteuer. Auch die von Benzer vorgeschlagene Dual-CPU-Lösung kann ich nicht empfehlen - das ist eher was für Workstations unter dem Tisch.

Mit nur zwei Knoten und dem genannten Budget würde ich Dir im Moment den Standard i5 empfehlen. Mehr Leistung pro EUR ist im Moment schwer zu bekommen. Falls das Problem halbwegs skaliert, lieber einen dritten oder vierten hinstellen, so dass auch mal einer ausfallen kann.

Es wäre hilfreich, wenn Du weitere Angaben machen könntest, insb. zur Implementierung, Parallelisierung, Bedeutung von RAM vs. Cache bei Deinem Problem, Rechenzeit. Welche Rolle spielt das Netzwerk zwischen den Knoten. Warum kannst Du nicht bei einem Rechenzentrum auf einem Großrechner rechnen?

Viele Grüße
gt
 
Es wäre hilfreich, wenn Du weitere Angaben machen könntest, insb. zur Implementierung, Parallelisierung, Bedeutung von RAM vs. Cache bei Deinem Problem, Rechenzeit. Welche Rolle spielt das Netzwerk zwischen den Knoten. Warum kannst Du nicht bei einem Rechenzentrum auf einem Großrechner rechnen?

Ich versuche auf die Fragen einzugehen, aber einiges weis ich leider nicht.

Implementierung, Parallelisierung, Bedeutung von RAM vs. Cache
Dazu kann ich nur sagen, dass gemessen an den verfügbaren Veröffentlichenungen und den Angaben der Programmierer meine Programme auch auf hunderten von Kernen skalieren. Beim Speicher ist es vom Rechenjob abhängig. Aber meine Erfahrung sagt, dass es um die 2 GB RAM pro Thread sein sollten. Für manche Jobs kommen dann noch etwa 50 GB Scratch pro Thread dazu.

Welche Rolle spielt das Netzwerk
Auch das ist unterschiedlich. Es gibt Jobs, die selbst über 10MBit Ethernet gut skalieren und welche, die ich selbst in meiner jetzigen Konfiguration über Infiniband (SDR, 4X) nicht auf beide Knoten verteilen brauch.

Rechenzentrum auf einem Großrechner
Da gibt es mehrere Probleme. Zum einen hat das Rechenzentrum bei mir an der UNI auch nur recht schwache Prozessoren. Um dort Gewinn zu machen, müsste ich also auf vielen Kernen parallel rechnen. Bis man so einen Job mal gestartet bekommt, muss man sich aber erstmal in die Warteschlage einreihen. Weiterhin sind, wenn man seinen Job einmal laufen hat, die Laufzeiten in Rechenzentren stark begrenzt. Und schließlich muss man dort auch erstmal rechnen dürfen. Laut dem Antragsformular sollte man 2 bis 3 Referenzen angeben. Ich arbeite aber gerade an meiner ersten.

Du solltest Dich in einem Forum informieren, indem andere ähnliche Probleme behandeln.
Hast du da eins im Sinn, welches du empfehlen könntest?
 
nicht zu unterschätzen sind meiner meinung nach die laufenenden kosten. ich würde an deiner stelle auch den stromverbauch mit in die wagschale werfen. wenn du sagst das manche berechnungen wochenlang auf, wäre es mir egal ob ich das ergebnis nun nach 21 oder 20 tagen habe wenn dafür 15€ spare...

da kann man dann auch einen besseren CPU holen. macht sich recht schnell bezahlt.
bsp. bei 0,23€ stromkosten die kwh und 1Jahr, 24 Stunden Täglich

350Watt = 0,350 KW x 0,23€ x 24h x 7(tage) x52(52wochen = 1 Jahr) = 703€
300Watt = 0,300 KW x 0,23€ x 24h x 7(tage) x52(52wochen = 1 Jahr) = 602€

ist bei 50 Watt schon ein unterschied von 100€ bei einem 24/7 System. ist also nicht zu unterschätzen. Dafür bekommt man schon z.b. einen schnelleres modell. wenn viele daten hin und her geschaufelt werden machen SSD's sinn, bzw. ein RAM laufwerk oder raid mit normalen HDD's. kommt auf das bugget an. ein Serversys mit 132GB ram wird schnell teuer ^^
 
aabbeeff schrieb:
Option 4: FX-8150
Hier scheiden sich die Meinungen. Die einen sagen, AMD-FX ist schrott, die anderen meinen, die Software muss nur optimiert sein. Der Test mit C-Ray 1.1 bei HT4U scheint ja die zweite Position zu bestätigen. Jedoch zeigt der FX-8150 bei dem Test von P3D trotz AVX im Linpack kein überzeugendes Ergebnis. Wenn es wirklich eine Frage der Optimierung wäre, dann ist das kein Problem, da ich ja alle Programme für jeden Rechenknoten neu compiliere. Ich bin aber bisher nicht überzeugt, dass dort wirklich die Probleme vom FX-8150 liegen.

Ich persönlich tendiere zu Option 3, weil es die billigste ist. Ich bin mir aber unsicher, wie viel Gewicht optimierte Software nun wirklich hat. Wenn der FX-8150 von AVX und FMA4 profitieren kann, dann wird er vermutlich auch den 2600K schlagen und dabei weniger Kosten. Aber wenn dem nicht so ist, dann würde ich viel Geld für nichts ausgeben. Ich bin auch offen für andere Optionen, sofern sie bezahlbar sind.
In dem Test von LinX-Test von P3DNow funktioniert definitiv kein AVX. Ein i7 2600K erreicht bei LinPack mit AVX fast 100 GFlops!
http://ht4u.net/reviews/2011/intel_sandy_bridge_sockel_1155_quadcore/index18.php
Da die aktuellen Intel-Binarys gesperrt sind, d.h. sie sind nicht auf AMD-CPUs einsetzbar, muss man sich für AMD selbst einen LinPack-Benchmark bauen. D.h. hier kommen vermutlich obendrein sehr alte Binaries zum Einsatz, die noch gar kein AVX unterstützen. Sprich: Bei den dortigen Ergebnissen siehst du keinen Einfluss von AVX.

Grüße
Fabian
 
Sieh dir vielleicht diesen Thread an. Wir hatten so eine ähnliche Diskussion erst vor kurzem. https://www.computerbase.de/forum/threads/max-cpu-leistung-dual-xeon.897989/

Als Fazit dieser Diskussion kann ich mitnehmen, dass es nirgends mehr Roh-Rechenleistung pro Euro gibt als beim 2600K. (eventuell noch übertaktet - ein mildes Übertakten auf 4.2Ghz läuft immer noch 100% stabil und +30% Performance ist merklich flotter)


EDIT: Oder ein i7 980 6x3.33Ghz für knapp 500€. http://geizhals.at/655274 Damit geht auch ordentlich etwas weiter.
Wenn du noch mehr Leistung willst, verlässt du bereits den Bereich eines brauchbaren Leistung-pro-Euro-Verhältnisses.
 
Zuletzt bearbeitet:
Habe jetzt gerade den Bulldozertest in der c´t gelesen. Bulldozer ist bei multithreadbasierten Anwendungen schneller oder gleich schnell wie der 2600k. Wenn Du Deine Software per Hand optimieren kannst und sogar Die Spezialbefehle des Bulldozer nutzen kannst, würde ich jetzt eindeutig den Bulldozer empfehlen. Am besten Du kaufst Dir die Zeitschrift am nächsten Montag um Dir ein Bild zu machen.

Die meisten User in diesem Forum nutzten CPU´s in Spielerechnern und haben einen entsprechenden "Erfahrungshorizont".
 
Wären bei solchen Berechnungen GPUs nicht besser?
Rechnungen auf GPU machen nur Sinn, wenn der notwendige Speicher pro Thread gering ist, weil GPUs zwar in der Lage sind, massiv parallel zu rechnen, aber pro Thread wenig Speicher haben. Mehrere GiB Speicher pro GPU mögen viel klingen, aber geteilt durch Zahl der parallel arbeitenden "Kerne" ist das fast nichts. Das funktioniert wunderbar zum Lösen kryptographischer Aufgaben, für meine Berechnungen aber leider nicht.
 
Ohne jetzt genau zu wissen, wie gut NVChem auf AMD oder Intel läuft, nachdem Du es kompiliert hast, würde ich folgende Idee vorschlagen:
http://geizhals.at/deutschland/?cat=WL-179986

Also zwei Rechner mit 2500K, 8GB RAM und Z68-Mainboard. Dazu ein verlässliches Netzteil, das ausreichend dimensioniert ist und recht effizient ist.
Gehäuse nehme ich an, kannst Du Dir selbst was Zweckmäßiges bauen. Festplatten ggf. dazu kaufen (oder zu Hause "herumfliegende" nutzen), falls Du die Rechner nicht per Netzwerk füttern kannst/willst.

Begründung:
1. Sandybridge liefert die mit Abstand beste PerMHz-Leistung aller aktuellen CPUs. Mit dem vorgeschlagenen Board kannst Du problemlos 4GHz-4,2GHz (boxed Kühler) erreichen (unter Einbußen der Effizienz evtl. noch mehr Taktfrequenz).
2. Der 2600K realisiert die "Kerne 5 bis 8" durch Hyperthreading. Daher würde ich damit rechnen, dass bei Belastung aller Kerne die ProKern-Leistung deutlich abnimmt. Wie Du oben schon angedeutet hast. Ich bezweifel, dass die Realleistung von ~1-1,2 * 2500K den Aufpreis wert ist.
3. Das Z68-Mainboard zum problemlosen Übertakten der CPU und zur Nutzung der im 2500K integrierten Grafik (falls benötigt).
4. 8GB RAM, um auch bei Deinen größten Berechnen ("bis zu 2GB") alle 4 Threads auslasten zu können. Das könnte noch ein Punkt sein, der gegen den 2600K spricht, der mit seinen 8 "Pseudo-"Threads evtl. mehr RAM bräuchte?


Ich kann nicht abschätzen, wie gut Du Deine Software für Bulldozer optimieren kannst, in jedem Fall dürfte das System aber keine Chance gegen die zwei vorgeschlagenen Systeme haben (die zugegebenermaßen aber auch teurer sind).
 
aabbeeff schrieb:
Rechnungen auf GPU machen nur Sinn, wenn der notwendige Speicher pro Thread gering ist, weil GPUs zwar in der Lage sind, massiv parallel zu rechnen, aber pro Thread wenig Speicher haben. Mehrere GiB Speicher pro GPU mögen viel klingen, aber geteilt durch Zahl der parallel arbeitenden "Kerne" ist das fast nichts. Das funktioniert wunderbar zum Lösen kryptographischer Aufgaben, für meine Berechnungen aber leider nicht.

Gut zu wissen, danke!
 
2. Der 2600K realisiert die "Kerne 5 bis 8" durch Hyperthreading. Daher würde ich damit rechnen, dass bei Belastung aller Kerne die ProKern-Leistung deutlich abnimmt. Wie Du oben schon angedeutet hast. Ich bezweifel, dass die Realleistung von ~1-1,2 * 2500K den Aufpreis wert ist.
Bei Berechnungen kommt es immer wieder zu nur Millisekunden langen Rechenpausen, in denen der eine Kerne auf das Ergebnis des anderen wartet. HT verteilit die Last hochdynamisch. Gerade wenn die CPUs im hohen Lastbereich betrieben werden, kommt der Mehrwert von HT deutlich zu tragen.
 
Zurück
Oben