News TACC Frontera: 36-PFLOPS-Supercomputer mit Cascade Lake statt Epyc

ThePowerOfDream · 30. August 2018

yummycandy schrieb:
Ich kann mir natürlich vorstellen, daß Intel ihnen CCL vorgestellt hat, aber woher wissen sie, wie hoch Rome taktet und vor allem, was die CPUs leisten?

Du glaubst doch wohl das Intel bei Asus und Co seine Spitzel sitzen hat die denen sagen was ROME könnte. War doch bei Ryzen genau so.
Oder warum ist das ITX Angebot bei Ryzen so Beschissen ?

yummycandy · 30. August 2018

CCIBS schrieb:
@yummycandy
Die haben sicherlich bei AMD und auch bei Intel angefragt. Das sind ja keine 0/15 Kunden, sondern welche, die einen Supercomputer bauen, der unter den Top 10 sein wird. Eventuell bekommen die dann auch Bench von Prototypen zu sehen.

Klar, davon gehe ich natürlich auch aus. Die Produktvorstellen im Profibereich scheinen ziemlich interessant zu werden. Spätestens dann wissen wir, wie redlich die Aussage war.

Ergänzung (30. August 2018)

ThePowerOfDream schrieb:
Du glaubst doch wohl das Intel bei Asus und Co seine Spitzel sitzen hat die denen sagen was ROME könnte. War doch bei Ryzen genau so.
Oder warum ist das ITX Angebot bei Ryzen so Beschissen ?

Ähmn, Spitzel? Nein.

Da werden schon handfeste Benchmarks gelaufen sein, wenn auch mit Prototypen. Sofern das nicht passiert ist, wäre die ganze Aussage Makulatur.

YforU · 30. August 2018

yummycandy schrieb:
Nicht das ich es ausschließe, aber woher wissen die das jetzt schon?

Weil es Enterprise CPUs weit vor der offiziellen Markteinführung als Samples zur Validierung und Evaluierung gibt. Bei Projekten und Ausschreibungen dieser Größenordnung werden die Karten zwangsläufig auf den Tisch gelegt. Der potentielle Kunde evaluiert die Hardware und kann dann sehr exakt die Performance des finalen Produktes in seinem Anwendungsfall prognostizieren.

-Ps-Y-cO- · 30. August 2018

Würde mich nicht Wundern wenn nur eine Handvoll Unternehmen zu ROME greifen...

MichaG · 30. August 2018

lalelu schrieb:
"Die Äußerungen deuten an, dass Rome schlicht etwas zu spät für das Projekt kommt. "
Nö, Rome eignet sich für die "Workloads" einfach nicht so gut. Es dürfte sich wohl von selbst erklären, dass dies nicht mit dem Kauf eines Privat PC's zu vergleichen ist. Auf ein paar Monate kommt es bei Projekten dieser größe nicht an, die einen Kauf einer anderen Architektur rechtfertigen, weil diese ein Quartal früher verfügbar ist.
"Putzig"....

Seltsam, das Interview, das ich gelesen habe, liefert gleich mehrere Hinweise, dass die Zeit sehr wohl eine Rolle gespielt hat. Ist das nicht putzig?

We took a look at AMD Epyc, both Naples and certainly Rome, but with the combination of price, schedules, and performance, we felt like Cascade Lake was the way to get the best value right now. Our codes were just a little better for the time we needed this system but Rome is a promising architecture and we expect it is going to be a very good chip,” Stanzione explained.

borizb · 30. August 2018

Je nach Szenario wäre auch DGX2 interessant. Glaubt man Nvidia, sind pro 400K$ 2 Petaflops drin.
Wenn ich das mal Milchmädchenstyle nachrechne, brauche ich 18 davon, um mit 7,2 Mio$ auf die
gleiche (ja ich weiß, nicht die gleiche) Leistung zu kommen. Mit 180KW pro Einheit sollte man auch
dahingehend besser aufgestellt sein, von Platzverbrauch und Kühlung mal ganz abgesehen.

ZeXes · 30. August 2018

-Random Skynet Kommentar-

yummycandy · 30. August 2018

The cache per core is about the same but with that higher clock rate—probably between 25 percent to 30 percent [for AVX-512 vector units, not headline clocks] we are making some decisions about balance and tradeoffs in terms of energy.” =

Scheint also primär um Vektorleistung zu gehen.
https://www.nextplatform.com/2018/08/29/cascade-lake-heart-of-2019-tacc-supercomputer/

borizb · 30. August 2018

-Ps-Y-cO- schrieb:
Würde mich nicht Wundern wenn nur eine Handvoll Unternehmen zu ROME greifen...

Also selbst wenn Rome in allen Szenarien fürs gleiche Geld schneller wäre, was ich nicht mal von der
Hand weisen will, muss man dennoch im Hinterkopf haben, dass ein Supercomputer für Intel nur
Business as usual ist, für AMD aber kaum Expertise geltend gemacht werden kann. Auf dem Papier
gleich gut aufgestellt zu sein, heißt nicht, dass das Gesamtpaket (Intels riesige Armee von Hardware
und Software-Ingenieuren vs. AMDs überschaubares "Team") dann besser ist. Wenn ich einen Code
von Anfang an so schreibe, dass er bei einer Architektur alle Register zieht, ist außerdem anzunehmen,
dass Rome wo auch immer schneller sein mag, aber vielleicht nicht in dieser exakten Disziplin.

MP X10L · 30. August 2018

"hatten wir das Gefühl"
Um wie viel Geld ging es noch gleich?

YforU · 30. August 2018

MichaG schrieb:
Seltsam, das Interview, das ich gelesen habe, liefert gleich mehrere Hinweise, dass die Zeit sehr wohl eine Rolle gespielt hat. Ist das nicht putzig?

Deine eigene Überschrift impliziert das Gegenteil. Korrekt wäre Cascade Lake statt Naples. Rome hat hier aufgrund des späteren Erscheinungstermins bei der eigentlichen Entscheidung zwischen AMD und Intel (-> Performance) keine Rolle gespielt.

ascer · 30. August 2018

lalelu schrieb:
Nö, Rome eignet sich für die "Workloads" einfach nicht so gut. Es dürfte sich wohl von selbst erklären, dass dies nicht mit dem Kauf eines Privat PC's zu vergleichen ist.

Das passt aber (a) nicht zu dem Kommentar "hatten wir das Gefühl" und (b) gibt es bei AMD mehr Cores bei nur marginal geringeren Taktraten und IPC zu einem weitaus geringeren Preis.

Auch AVX512 war bis jetzt nicht der Riesenunterschied. Ich forsche im AI Umfeld und wir haben z.B. eine Workstation mit i7 7800X, welcher ja AVX512 beherrscht.

Es war bei dem Supercomputer ja durchaus auch von Machine Learning die Rede.
Ich habe TensorFlow (Google's ML Library) mit allen möglichen Optimierungen und Intel MKL kompiliert und verschiedene Simulationen auf der CPU getestet und mit meinem Ryzen 7 2700X zu Hause verglichen.

In manchen edge cases bringt AVX512 viel, aber in den allermeisten Simulationen nutzt man nicht nur irgendwelche exotischen Funktionen die hochoptimiert funktionieren. Für ganz typische neuronale Netze war der 2700X mit seinen 8 Cores häufig sogar marginal schneller als der 6-Core 7800X mit MKL und AVX512 und das, obwohl AVX512 ja richtig saftig Energie verbraucht und der 7800X dadurch deutlich mehr Strom frisst als ein 2700X.

Wenn ich mir die Benutzung unserer Supercomputer anschaue, dann werden da in der Realität allemöglichen Experimente durchgeführt, die an der Uni / Forschungsinstitut / ... eben gerade so anfallen. Viele davon werden sicherlich ebenfalls Gebrauch von Funktionalitäten machen, die sich nicht optimal für AVX512 eignen.

yummycandy · 30. August 2018

Passend zum Thema, der Impact von allen Sicherheitspatches bisher. Hat auch Auswirkungen auf EPYC: https://www.phoronix.com/scan.php?page=article&item=linux-419-mitigations&num=2

MichaG · 30. August 2018

YforU schrieb:
Deine eigene Überschrift impliziert das Gegenteil. Korrekt wäre Cascade Lake statt Naples. Rome hat hier aufgrund des späteren Erscheinungstermins bei der eigentlichen Entscheidung zwischen AMD und Intel (-> Performance) keine Rolle gespielt.

Da geb ich dir Recht. Ich ändere Rome in Epyc

Joshua2go · 30. August 2018

In so einem Supercomputer steckt doch viel Rechenleistung für Bitcoin oder? Ich hoffe, Hacker hacken sich über die Sicherheitslücken in den Supercomputer ein und verwenden die Rechenleistung ausgiebig für die Bitcoinberechnung. Es ist wie immer, die Leute werden erst schlau, wenn das Kind in den Brunnen gefallen ist.

CastorTransport · 30. August 2018

Khaotik schrieb:
Hm schade... grade so ein Auftrag wäre für AMD aus vielerlei Hinsicht sehr positiv gewesen.

Ach warte doch ab. Wenn AMD nächstes Jahr einen "Supercomputer" beliefert, der dann ein paar Plätze vor dem hier genannten steht - bei halb so hohen Kosten, dann grinsen sich andere einen ab

w0mbat · 30. August 2018

Was für eine seltsame "Nachricht". AMD wurde hier nie wirklich in Betracht gezogen, das Inrerview ist kompletter BS. Die haben schon eine Intel-Plattform und die passende Software, es gab da keine andere Wahl.

Das CB auf sowas reinfällt lässt einen denken...

ZeXes · 30. August 2018

Joshua2go schrieb:
In so einem Supercomputer steckt doch viel Rechenleistung für Bitcoin oder? Ich hoffe, Hacker hacken sich über die Sicherheitslücken in den Supercomputer ein und verwenden die Rechenleistung ausgiebig für die Bitcoinberechnung. Es ist wie immer, die Leute werden erst schlau, wenn das Kind in den Brunnen gefallen ist.

Im stärksten Supercomputer der Welt stecken 27,648 Nvidia Tesla V100 GPUs drin. Damit kann man schon gut arbeiten.

max9123 · 30. August 2018

ascer schrieb:
Ich forsche im AI Umfeld und wir haben z.B. eine Workstation mit i7 7800X, welcher ja AVX512 beherrscht.

Mit eingeschränkter Anzahl an Ausführungseinheiten. Große Unterschiede bestehen derzeit ua. bei Fused-Multiply Add (FMA). Ihr i7 7800X hat hier nur (1x512 Bit) breite Ausführungseinheit, Skylake-X mit 10 Kernen aufwärts haben (2x512 Bit) und damit bis zu dem doppelten Durchsatz pro Takt.
Skylake hat (2x256 Bit), Ryzen 1 (2x128 Bit), kombinierbar auf 2x256Bit/2 Taktzyklen

Vor allem bei skalaren Instruktionen und teilweise auch 128Bit (SSEx.x) liegt wieder meist Ryzen in Front. [1] https://www.agner.org/optimize/blog/read.php?i=838
Die Angabe einer "IPC" ohne klar definiertem Anwendungsgebiet macht alleine schon aus diesem Grund keinen Sinn.

Viele Packages verwenden noch kein AVX, es wird sich allerdings in Zukunft immer mehr verbreiten, da es neben der Parallelisierung und im erheblich geringerem Maßstab Taktsteigerungen, die einzige Möglichkeit darstellt um die Rechenleistung nennenswert zu erhöhen.

Ob zenvers2 nun ein paar Prozent mehr oder weniger Takt hat, ist im Vergleich zu Architekturverbesserungen eher weniger interessant. In welchen Bereichen die Architektur verbessert wird, ist allerdings zum derzeitigen Zeitpunkt reine Spekulation. Für professionelle Anwendungsfälle wäre auf jedem Fall wünschenswert, wenn der Durchsatz bei AVX Instruktionen deutlich erhöht wird.

Verminaard · 30. August 2018

Aber laeuft denn Crysis darauf fluessig?

Die wichtigen Fragen stellt wieder mal keiner.

News TACC Frontera: 36-PFLOPS-Supercomputer mit Cascade Lake statt Epyc

Lt. Junior Grade

Commodore

Captain

Vice Admiral

Redakteur

Rear Admiral

Banned

Commodore

Rear Admiral

Ensign

Captain

Captain

Commodore

Redakteur

Lt. Commander

Captain Pro

Lt. Commander

Banned

Cadet 4th Year

Ensign

Ähnliche Themen

Passend zum Thema