News Marvells ARM-Server-CPU: ThunderX3 mehr als doppelt so schnell wie ThunderX2

@Volker

Man hört immer wieder wie viel besser ARM jetzt geworden ist. Gibts irgendeinen direkten Vergleich einer aktuellen x86 Architektur mit einer aktuellen Desktop/Server ARM Architektur mit Blick auf Performance und Performance/Watt in einem Real World Benchmark? (Also nicht Encryption etc...)
 
AAS schrieb:
Ich sehe das anders, wie schon erwähnt der Apple-SoC ist ein gutes Beispiel, ein anderes "negatives" sind die Xeon-Phi.
Es hängt sehr stark von deinen Anwendungen ab, wie eine Architektur skaliert.
Ja schon, deshalb meine Beschränkung auf ähnliche Architekturen und selbe Workloads. Einfach gesagt, ein Cortex A76 von Qualcomm und A76 von Samsung mit gleichen Hardware-Addons (also Anzahl FPU, Video-Decoder etc.) in der selben TSMC-Technologie werden ähnlich schnell sein, oder etwa nicht?

Ich denke, für hohe Taktraten darf man auch nicht außer Acht lassen, dass die Verluste nicht linear, sondern exponentiell steigen. x86 als CISC-Arch ist da mit 4-5GHz schon recht ineffizient.
 
Ich dachte eigentlich, Marvell macht nur Comic's und Verfilmungen dieser ^^
 
  • Gefällt mir
Reaktionen: Kazuja
Die haben die Leistung mit ner neuen Architektur und dem Sprung von 16 auf 7 nm verdoppelt.
Klingt jetzt erstmal unspannend.
Außerdem sagt verdoppelt oder verdreifacht im Grunde nichts aus wenn man keinen Ausgangswert kennt.
Wenn das Ding nur halb so schnell war wie ein Xeon anno 2010, dann gewinnt man mit doppelt so schnell heute trotzdem keinen Blumentopf.

Ansonsten wie bei jeder News zu irgendwelchen ARM-CPUs: Viel heiße Luft aber im Grunde keine realen Produkte jenseits von Smartphones am Markt.
Bitte erstmal liefern (Hardware und evtl. notwendige SW-Anpassungen für die gängigen Software-Pakete), für ne News wie toll das mal wird kann sich keiner was kaufen.
 
süchtla schrieb:
Einfach gesagt, ein Cortex A76 von Qualcomm und A76 von Samsung mit gleichen Hardware-Addons (also Anzahl FPU, Video-Decoder etc.) in der selben TSMC-Technologie werden ähnlich schnell sein, oder etwa nicht?
Sind die Ähnlichkeiten in der Implementation hinreichend groß, dann fällt auch die Leistung sehr ähnlich aus.
Aber der A76 ist nur ein CPU-Kern und die Variationsmöglichkeiten außerhalb des Kerns sind vielfältig (Cache-Hierarchie, Interconnect, Speicheranbindung etc.). Und nur mal so, Samsung läßt nicht bei TSMC fertigen ;)

süchtla schrieb:
Ich denke, für hohe Taktraten darf man auch nicht außer Acht lassen, dass die Verluste nicht linear, sondern exponentiell steigen. x86 als CISC-Arch ist da mit 4-5GHz schon recht ineffizient.
x86 hat schon vor Jahrzehnten aufgehört eine CISC-Architektur zu sein, seit Intel Pentium Pro (bzw. AMD K5) werkelt intern eine RISC-Maschine. Und die hohen Taktraten werden benötigt, weil die Auslegung der CPUs über die Jahre relativ schmal geblieben ist. Wirklich weltbewegendes hat sich da seit Merom nicht getan.
 
AAS schrieb:
Singlecore Leistung brauchen höchstens Gamer und Office PCs.
Diese CPU ist für Microservices und änhliches ausgelegt.

1. ja, aber auch Rendering kann nicht genug Rechenwerke haben. Siehe Workloads a la Cinebench etc.
2. "noch"

… es scheint mir dennoch zukunftsträchtig, iwann anstelle von x86/x64 Technik einen ARM in einem "PC" zu haben. Viele Geräte des heutigen täglichen elektronischen Lebens arbeiten mit ARM-basierter Rechenleistung. Mir als Endverbraucher stünde daher nichts im Weg, wenn ich passende Software und Spiele bekäme, einen Rechenknecht mit ARM zu erwerben.

Alpha, MIPS, X86, ARM ... solange das passende Ökosystem darum besteht ...
 
"wie" oder "als" … ist je nach geographischer Mundart als gleichwertig zu betrachten. Was hingegen nicht geht ist "als wie" oder gar "als wie wenn" oder absolut Gaga "als wie wenn'ste"
 
smalM schrieb:
Sind die Ähnlichkeiten in der Implementation hinreichend groß, dann fällt auch die Leistung sehr ähnlich aus.
Aber der A76 ist nur ein CPU-Kern und die Variationsmöglichkeiten außerhalb des Kerns sind vielfältig (Cache-Hierarchie, Interconnect, Speicheranbindung etc.). Und nur mal so, Samsung läßt nicht bei TSMC fertigen ;)
Ja, Variationsmöglichkeiten gibts viele und ich sollt wohl unkonzentriert keine Beiträge verfassen. Samsung bei TSMC, schon peinlich :D

smalM schrieb:
x86 hat schon vor Jahrzehnten aufgehört eine CISC-Architektur zu sein, seit Intel Pentium Pro (bzw. AMD K5) werkelt intern eine RISC-Maschine. Und die hohen Taktraten werden benötigt, weil die Auslegung der CPUs über die Jahre relativ schmal geblieben ist. Wirklich weltbewegendes hat sich da seit Merom nicht getan.
Mag sein, dass das laut Klassifikation mittlerweile eine RISC-Maschine ist, aber mit viel extra specialized Hardware-Extentions.
Wie meinst du, dass die Auslegung schmal blieb? Ich meine, es ist halt ein general-purpose-Core, optimiert für die Eier-legende Woll-Milch-Sau. FPU, AVX, Videodecoder, Branch-Prediction etc. ist halt alles und nichts gleichzeitig.
 
süchtla schrieb:
Wie meinst du, dass die Auslegung schmal blieb?

Die Anzahl der Decoder und die Anzahl der Execution-Ports:
Merom (2006) = 3+1 Decode (kein L0) – 4µOPs Dispatch – 6 Execution-Ports = 3 ALU/Branch/FP/SIMD + 3 AGU/Load/Store
Skylake (2015) = 4+1 Decode (+ 6µOPs aus L0) – 8µOPs Dispatch – 8 Execution-Ports = 4 ALU/Branch/FP/SIMD + 4 AGU/Load/Store

Die Entwicklung bei ARM läuft einfach viel schneller.
A73 (2016) = 2 Decode (kein L0) – 6µOPs Dispatch – 7 Execution-Ports = 2 ALU + 1 Branch + 2 FP/SIMD + 2 AGU/Load/Store
A77 (2019) = 4 Decode (+ 6MOPs aus L0) – 10µOPs Dispatch – 12 Execution-Ports = 4 ALU + 2 Branch + 2 FP/SIMD + 4 AGU/Load/Store

Arm hat seine großen Cores nun jedes Jahr deutlich weiter aufgebohrt, in nur drei Jahren hat man die Architektur von Pentium-3- fast auf Skylake-Niveau gehieft, und wird das in der Art zweifellos noch eine Zeit lang weiter betreiben. Ich würde mich nicht wundern, wenn sie bereits in zwei, spätestens in drei Jahren bei der Breite eines aktuellen Apple-Cores landen würden. Die noch mangelnde FP/SIMD-Leistung im Vergleich zu AVX-512 will man mit SVE angehen; schauen wir mal wie die Leistung bei Fujitsus erster Realisierung letztendlich aussieht, effizient ist sie ja anscheinend schon.

Wieso manche glauben, x86 könnte von ARM im Server nicht erreicht werden, ist mir völlig schleierhaft. Es wird bald keinen Bereich mehr geben, bei dem x86 ARM überlegen ist. Einen Haufen Cores? Einen Haufen Leistung? Chiplett-Design? Wird alles von Arm als IP zu haben sein.
 
Puh, jetzt sind wir aber ein guten Stück tiefer in der Technik :D

Gut, hier gibts viele Unterschiede im detailierten Aufbau der einzelnen Cores, welche mittlerweile ja mehr als eine EU bzw. ALU besitzen. Hier fundierte Vergleiche zu ziehen, ist schwer.

smalM schrieb:
Die Entwicklung bei ARM läuft einfach viel schneller.
Das trifft genau auch einen Punkt, den ich eigentlich schon angesprochen hatte. ARM hat momentan den Vorteil,dass die Technologie für das Fertigen riesiger ICs von den klassischen GPU/CPU-Herstellern schon entwickelt wurde. Ich denke, wenn ARM diese Technologie quasi selbst vor sich her treiben muss, dann wird die Entwicklung und das Scaling auch wieder langsamer.
Aus der Perspektive der Wafer-Fertigung ist ein ARM halt immer noch eine halbe oder viertelte Portion im Vergleich zu einer Navi-GPU oder einem Intel Xeon. Daher ist der Yield von Grund auf höher und der Core billiger.

smalM schrieb:
schauen wir mal wie die Leistung bei Fujitsus erster Realisierung letztendlich aussieht, effizient ist sie ja anscheinend schon.
Sehr interessant! Trotzdem finde ich, ist der Effizienz-Sprung sehr klein. <1% mehr GFlops/W ist jetzt nicht sonderlich viel. Je nach Messequipment und Benchmark könnte das auch durchaus in die Toleranz fallen ;)
Soll nicht heißen, dass es schlecht ist, aber irgendwie auch nicht die wahnsinnige Effizienzsteigerung von der immer alle reden.

Womit ich eigentlich wieder zurück zu meiner ursprünglichen Aussage kommen möchte, alle Hersteller kochen mit Wasser und sobald ein IC die selbe Größe, Komplexität und Anzahl der Transistoren hat, kriegt er die selben Probleme bzw. eine CPUs eine im groben ähnliche Performance.

smalM schrieb:
Wieso manche glauben, x86 könnte von ARM im Server nicht erreicht werden, ist mir völlig schleierhaft. Es wird bald keinen Bereich mehr geben, bei dem x86 ARM überlegen ist. Einen Haufen Cores? Einen Haufen Leistung? Chiplett-Design? Wird alles von Arm als IP zu haben sein.
Erreichen und Übertreffen sind aber zwei Paar Schuhe. Außerdem ist ARM allein quasi an die IC-Hersteller angewiesen, ihren Core zu verwenden und gut zu implementieren. Die IP allein ist nur ein kleiner Teil der Miete, den Großteil stemmen Qualcomm, Samsung und co.
 
Zurück
Oben