Monero-Mining mit CPUs: Viel Cache lässt Threadripper auf GPU-Niveau schürfen

Wolfgang Andermahr
125 Kommentare
Monero-Mining mit CPUs: Viel Cache lässt Threadripper auf GPU-Niveau schürfen

tl;dr: Effizient minen lässt es sich nur auf ASICs oder GPUs? Mitnichten. In CryptoNight (u. a. Monero) kann auch AMD Ryzen Threadripper vorne mitspielen, wie Benchmarks und Messungen der Leistungsaufnahme zeigen. Kein Wunder, dass AMD selber auf das sehr gute Abschneiden der CPU aufmerksam gemacht hat.

Mining auf dem Prozessor – bei CryptoNight möglich

Die meisten Kryptowährungen lassen sich mittlerweile nur noch mit ASICs effizient minen, einige Algorithmen verlangen hingegen (noch) nach einer GPU. ComputerBase hat sich erst vor Kurzem das Mining von Ethereum, Monero und Zcash auf verschiedenen AMD- und Nvidia-Grafikkarten angesehen. Ein aktueller Algorithmus soll sich aber auch auf einer CPU kosteneffizient berechnen lassen, vorausgesetzt, sie hat genug Cache.

Viel Cache beschleunigt CryptoNight massiv

Gemeint ist der Proof-of-Work-Algorithmus CryptoNight, der unter anderem der Kryptowährung Monero zugrunde liegt, die auch mit GPUs effizient berechnet werden kann – eine echte Besonderheit, denn GPUs und CPUs haben wenig Gemeinsamkeiten. Auf einer Grafikkarte schöpft er aus der sehr hohen Speicherbandbreite, die auf einem Prozessor zum vergleichbar großen Arbeitsspeicher vergleichsweise winzig ist.

Das Zauberwort heißt hier hingegen Cache und es gilt die Devise: viel schneller Speicher direkt in der CPU hilft in Monero viel. Und Cache haben Prozessoren heutzutage eine ganze Menge: Intels Core i7-8700K bietet 12 Megabyte, ein Ryzen 5 1600X 16 Megabyte und ein Ryzen Threadripper 1920X oder 1950X sogar gleich 32 Megabyte. Grafikkarten bieten dagegen nur einen Bruchteil an schnellem integrierten Speicher.

Von AMD darauf aufmerksam gemacht

Dass insbesondere Threadripper mit seinem konkurrenzlos großen L3-Cache in Monero gut abschneiden können soll, darauf hatte AMD zuletzt mehrere Redaktionen weltweit aufmerksam gemacht. Die Idee für diesen Artikel ist der Redaktion also nicht alleine gekommen, sie ist deshalb aber nicht minder interessant.

Die PR-Aktion unterstreicht dabei erneut, wie zwiespältig das Verhältnis zwischen den Herstellern und dem Thema Mining ist. So kritisch Spieler die aktuelle Entwicklung sehen und so kritisch AMD und Nvidia deren Stimmung beobachten sollten, so sehr profitieren beide Unternehmen derzeit vom hohen GPU-Absatz durch Mining. Und bei den CPUs ist AMD einem höheren Absatz durch Miner ganz öffentlich nicht abgeneigt.

Der CPU-Miner für Monero will konfiguriert werden

Als Software zur Berechnung von Monero wird im Test der CPU-Stack vom xmrig-Miner in der Version 2.4.4 genutzt. Bei diesem gilt es nur darauf zu achten, die Anzahl an Threads, die das Tool nutzen soll, korrekt zu konfigurieren. Die korrekte Formel lautet: Pro Thread wird ein zwei Megabyte großer Cache benötigt. Die Größe richtet sich fast durchweg nach dem L3-Cache. Ist dieser zum Beispiel zwölf Megabyte groß, sind sechs Threads am schnellsten.

Das Mining-Tool bietet auch eine Automatik, die die Anzahl an genutzten Threads bei den Testreihen mit einer einzigen Ausnahme immer korrekt konfiguriert hat: Beim Intel Core i9-7900X, der auch über einen 10 MB großen L2-Cache verfügt, war die getroffene Wahl aber suboptimal. Der L3-Cache ist auf der CPU 13,75 Megabyte groß, was der Faustregel zufolge sechs Threads entspricht. Per manueller Zuweisung mittels „--threads“ haben sich aber zehn Threads als die schnellste Variante erwiesen.

Elf Threads (sechs Threads für den L3 und fünf Threads für den L2) waren bereits deutlich schneller als die Automatik, aber nicht optimal. Zehn Threads zeigten auf der CPU das beste Ergebnis. Bei sämtlichen anderen Prozessoren ließ sich durch eine manuelle Thread-Vergabe die Leistung nicht weiter steigern.

Acht CPUs von AMD und Intel im Test

Insgesamt acht verschiedene Prozessoren müssen die Testreihen über sich ergehen lassen. Dabei stammen drei Prozessoren von Intel und die restlichen fünf von AMD. Alle Systeme werden mit den Standardeinstellungen betrieben, dasselbe gilt für den jeweils 16 Gigabyte großen DDR4-Speicher. Als Grafikkarte wird eine GeForce GTX 1050 Ti genutzt, die jedoch ausschließlich für die Bildausgabe zuständig ist. Windows 10 mit sämtlichen Updates ist das Betriebssystem der Wahl.

L2-Cache L3-Cache Vorgeschlagene
#Threads
Optimale
#Threads
AMD Ryzen 3 1200 2 MB 8 MB 4 4
AMD Ryzen 5 1600X 3 MB 16 MB 8 8
AMD Ryzen 7 1800X 4 MB 16 MB 8 8
AMD Ryzen Threadripper 1920X 6 MB 32 MB 16 16
AMD Ryzen Threadripper 1950X 9 MB 32 MB 16 16
Intel Core i7-7700K 1 MB 8 MB 4 4
Intel Core i7-8700K 1,5 MB 8 MB 6 6
Intel Core i9-7900X 10 MB 13,75 MB 6 10

Neben der Performance spielt bei dem Test auch die Leistungsaufnahme eine große Rolle. Die Leistungsaufnahme des gesamten Systems wird an der Steckdose gemessen. Um den Einflussfaktor der verschiedenen Plattformen zu minimieren, wird zunächst die Leistungsaufnahme im Leerlauf gemessen. Entscheidend für die Beurteilung der Effizienz ist nur das Delta aus der Leistungsaufnahme unter Last und im Leerlauf.

25 Jahre ComputerBase!
Im Podcast erinnern sich Frank, Steffen und Jan daran, wie im Jahr 1999 alles begann.