yetisports
Lieutenant
- Registriert
- Juli 2008
- Beiträge
- 747
1. Was ist der Verwendungszweck?
Auf der Arbeit benötigen wir für ein Projekt (bzw. auch projektübergreifend als Abteilung) einen potenten Rechner. Es ist angedacht, damit die Daten, die von unseren Händlern der Warenwirtschaft zugespielt werden, über Programmiersprachen wie Python mit Bibliotheken wie pandas und Co zu analysieren und aufzubereiten. Zwecks Parallelisierung wird natürlich auch mit multiprocessing gearbeitet. Die Datenmenge ist aktuell im zwei-dreistelligen GB-Bereich, wird aber natürlich nicht kleiner, gerade wenn die Bestandsthemen wichtiger werden.
Machine Learning, Neuronale Netze (Tensorflow) und Webcrawling etc. sind ebenfalls Themen, die eben nicht mehr auf einem normalen Arbeitslaptop umgesetzt werden können.
Angedacht war ein Threadripper 2950X, 64GB RAM und ein passendes Mainboard (inkl. Speicher, Gehäuse, Mainboard, ...). Zugriff erfolgt nicht direkt, sondern bspw. über Citrix vom Notebook aus.
Speicher:
Die Daten werden vermutlich "häppchenweise" als CSV im zweistelligen MB-Bereich gespeichert. Sollen dann die verschiedenen Prozesse die Dateien lesen. Dabei soll es natürlich nicht auch schon zu bottlenecks kommen, sondern der Vorteil des parallelen Lesens entsprechend genutzt werden.
Daher die Frage: NVME-SSD(s), SATA-SSD(s) oder HDDs? Hätte jetzt bspw. an 2x2TB SATA-SSDs im RAID0 oder RAID1 gedacht. Bzgl. Backup-Planung muss ich mich nochmal mit dem Rechenzentrum austauschen, die haben da (hoffentlich) eine sinnvolle Strategie.
CSVs werden neben Python noch mit einem guten Texteditor (EmEditor) geöffnet. Als IDE kommt Visual Studio zum Einsatz.
CPU:
Macht ein 2970 oder 2990 im Vergleich zum 2950 bei Python und Co. Sinn? Wegen des Aufbaus bei Anbindung der Speicherkanäle skalieren ja manche Dinge gut, andere aber gar nicht oder gar negativ.
GPU:
Welche Grafikkarte wäre sinnvoll, sofern man Tensorflow über die GPU laufen lässt? Reicht da ne Gamer-Karte oder muss es eine Profi-Karte sein? Und wie gut skaliert die Leistung mit der GPU? Zwischen 1050 und 1080Ti besteht ja beispielsweise bei Videocodierung nicht der gigantische Unterschied.
OS:
Windows 10 Professional, Windows Server (welche Version auch immer) oder eine Linux-Distribution? Ich lese immer mal wieder, dass Python auf Linux performanter ist.
3. Wie viel Geld bist du bereit auszugeben?
1.000-5.000€. Muss in der Konstellation eben Sinn machen - aktuell wird bei uns extrem auf die Kosten geachtet, daher muss es einfach sinn machen.
4. Was ist die geplante Nutzungszeit (in Jahren)?
Ein paar Jahre. Ist aber hier jetzt nicht relevant.
5. Wann soll gekauft werden?
Dieses Jahr.
6. Möchtest du den PC selbst zusammenbauen oder zusammenbauen lassen?
Könnte ich prinzipiell selbst zusammenbauen. Hab ich ja bei den Desktop-Rechnern schon immer gemacht. Kann natürlich sein dass die IT das anders sieht. Geht primär jetzt um sinnvolle Hardware für den Einsatzzweck. Vorhanden ist noch nichts.
Vielen Dank schon einmal für eure Unterstützung.
Auf der Arbeit benötigen wir für ein Projekt (bzw. auch projektübergreifend als Abteilung) einen potenten Rechner. Es ist angedacht, damit die Daten, die von unseren Händlern der Warenwirtschaft zugespielt werden, über Programmiersprachen wie Python mit Bibliotheken wie pandas und Co zu analysieren und aufzubereiten. Zwecks Parallelisierung wird natürlich auch mit multiprocessing gearbeitet. Die Datenmenge ist aktuell im zwei-dreistelligen GB-Bereich, wird aber natürlich nicht kleiner, gerade wenn die Bestandsthemen wichtiger werden.
Machine Learning, Neuronale Netze (Tensorflow) und Webcrawling etc. sind ebenfalls Themen, die eben nicht mehr auf einem normalen Arbeitslaptop umgesetzt werden können.
Angedacht war ein Threadripper 2950X, 64GB RAM und ein passendes Mainboard (inkl. Speicher, Gehäuse, Mainboard, ...). Zugriff erfolgt nicht direkt, sondern bspw. über Citrix vom Notebook aus.
Speicher:
Die Daten werden vermutlich "häppchenweise" als CSV im zweistelligen MB-Bereich gespeichert. Sollen dann die verschiedenen Prozesse die Dateien lesen. Dabei soll es natürlich nicht auch schon zu bottlenecks kommen, sondern der Vorteil des parallelen Lesens entsprechend genutzt werden.
Daher die Frage: NVME-SSD(s), SATA-SSD(s) oder HDDs? Hätte jetzt bspw. an 2x2TB SATA-SSDs im RAID0 oder RAID1 gedacht. Bzgl. Backup-Planung muss ich mich nochmal mit dem Rechenzentrum austauschen, die haben da (hoffentlich) eine sinnvolle Strategie.
CSVs werden neben Python noch mit einem guten Texteditor (EmEditor) geöffnet. Als IDE kommt Visual Studio zum Einsatz.
CPU:
Macht ein 2970 oder 2990 im Vergleich zum 2950 bei Python und Co. Sinn? Wegen des Aufbaus bei Anbindung der Speicherkanäle skalieren ja manche Dinge gut, andere aber gar nicht oder gar negativ.
GPU:
Welche Grafikkarte wäre sinnvoll, sofern man Tensorflow über die GPU laufen lässt? Reicht da ne Gamer-Karte oder muss es eine Profi-Karte sein? Und wie gut skaliert die Leistung mit der GPU? Zwischen 1050 und 1080Ti besteht ja beispielsweise bei Videocodierung nicht der gigantische Unterschied.
OS:
Windows 10 Professional, Windows Server (welche Version auch immer) oder eine Linux-Distribution? Ich lese immer mal wieder, dass Python auf Linux performanter ist.
3. Wie viel Geld bist du bereit auszugeben?
1.000-5.000€. Muss in der Konstellation eben Sinn machen - aktuell wird bei uns extrem auf die Kosten geachtet, daher muss es einfach sinn machen.
4. Was ist die geplante Nutzungszeit (in Jahren)?
Ein paar Jahre. Ist aber hier jetzt nicht relevant.
5. Wann soll gekauft werden?
Dieses Jahr.
6. Möchtest du den PC selbst zusammenbauen oder zusammenbauen lassen?
Könnte ich prinzipiell selbst zusammenbauen. Hab ich ja bei den Desktop-Rechnern schon immer gemacht. Kann natürlich sein dass die IT das anders sieht. Geht primär jetzt um sinnvolle Hardware für den Einsatzzweck. Vorhanden ist noch nichts.
Vielen Dank schon einmal für eure Unterstützung.