Intel Cooper Lake-SP: Skylake-Finale mit 28 Kernen, DDR4-3200 und 250 Watt

18.6.2020 15:00 Uhr

Bild: Intel

tl;dr: 28 Kerne, DDR4-3200, 6 UPI-Links, bis zu 250 Watt, dazu neue Instruktionen: Intel quetscht ein letztes Mal alles aus der 14-nm-Fertigung und bringt Cooper Lake-SP an den Start. Im Fokus stehen dabei aber nur große Server mit vier bis acht Sockeln, kleinere sollen im späteren Jahresverlauf auf Ice Lake-SP wechseln.

Der letzte Skylake-Ableger für Server

Der nun wirklich finale Zug von Intels 2015 eingeführter Skylake-Architektur startet heute. Noch einmal die 14-nm-Fertigung bemüht und auch die Grundzüge des drei Jahre alten Server-CPU-Designs übernommen, wird Cooper Lake-SP der Refresh für die teuersten Modelle im Xeon-Portfolio. Denn bereits im Frühjahr hatte Intel die kleineren Varianten abgesägt, offiziell weil der Cascade Lake Refresh ausreicht, inoffiziell weil der Mehrwert einfach nicht vorhanden ist, weshalb nun lediglich der Markt anvisiert wird, den Mitbewerber AMD gar nicht adressiert: vier bis acht Sockel.

AMD sagt, dieser Markt ist eine zu kleine Nische, Intel behauptet das Gegenteil. Die Wahrheit dürfte wohl irgendwo dazwischen liegen, Fakt ist aber zweifelsfrei, dass der Zwei-Sockel-Markt viel größer ist. Den musste AMD beim Wiedereinstieg adressieren und auch Intel weiß um diesen, weshalb, für eine Präsentation einer neuen CPU-Serie ziemlich unüblich, Intel direkt auf die nächste verweist. Ice Lake-SP wird sich in wenigen Monaten um den Dual-Sockel-Markt kümmern.

Intel zum kommenden Dual-Sockel-Server-Prozessor (Bild: Intel)

Verdoppelte UPI-Links, DDR4-3200 und neuer Sockel P+

Und um genau in diesem Markt auch mehr Leistung aus nahezu gleicher Hardware zu bieten, hat Intel an vielen kleinen Stellschrauben zum Teil deutlich gedreht. So wird erstmals bei Intel DDR4-3200 unterstützt und damit eine Server-Plattform dem Desktop sogar voraus gebracht. Die Anzahl der UPI-Links, die für die Kommunikation zwischen den Prozessoren verantwortlich ist, wird von insgesamt drei auf sechs verdoppelt, die Geschwindigkeit bleibt mit Blick auf die Energieeffizienz bei 10,4 GT/s pro Link. Nicht geändert hat Intel das PCI-Express-Interface, es bleibt beim Stand 3.0 und liefert 48 Lanes pro CPU. Hier wird erst Ice Lake-SP die Neuheit PCIe 4.0 bieten.

Doch diese Anpassungen sind unter anderem schon ein Grund für einen neuen Sockel: Bei Intel Sockel P+ getauft bietet dieser nun 4.189 Kontaktflächen statt bisher im Sockel P 3.647 Kontakte. Dieser ist zumindest identisch zur kommenden Ice-Lake-SP-Plattform, wenngleich dort noch mehr geboten wird.

Intel 3rd Gen Xeon Scalable-angle (Bild: Intel)

Intel 3rd Gen Xeon-SP Cooper Lake-SP Blockdiagramm (Bild: Intel)

Bfloat16 als Bindeglied zwischen INT8 und FP32

Das Aushängeschild im Bereich neuer Instruktionen ist ein erweiterter DL Boost (für Deep Learning), wie Intel die AI-Features der CPUs getauft hat. Nach den Vector Neural Network Instructions (VNNI) kommt nun Brain Floating Point 16-bit (Bfloat16) hinzu. VNNI hatte als Erweiterung von AVX-512 das Geschehen bei INT8 im Fokus, Bfloat16 schließt nun die Lücke zu klassischen FP32-Operationen. Der Hersteller selbst beschreibt es mit fast so hoher Genauigkeit wie bei FP32, allerdings bei deutlich schnellerer Ausführung. Zudem sollen die Anpassungen bei der Software nur mit minimalem Aufwand verbunden sein, sodass die Unterstützung schnell genutzt werden kann.

Intel DL Boost mit bfloat16 (Bild: Intel)

Erste Benchmarks bringt Intel auch mit. Dabei sollen diese die Entwicklung in den letzten drei Jahren zeigen, seit der Einführung von AVX-512 bei den Xeon-SP der ersten Generation. Über 100 Technologien sollen durch die Erweiterungen AVX-512, VNNI und nun Bfloat16 nur auf Xeon-Systemen zur Verfügung stehen, Testergebnisse bei gleicher Anzahl an CPU-Kernen, die im Grunde genommen ja auch noch die gleiche CPU-Architektur sind, zeigen Leistungsgewinne in deutlichem Ausmaß.

Intel-Instruktionen und Leistungsverbesserungen durch diese bei gleicher Anzahl an CPU-Kernen (Bild: Intel)

Intel DL Boost mit bfloat16 Ergebnisse (Bild: Intel)

Modellübersicht von Cooper Lake-SP: Mehr Takt und höhere TDP

Offiziell firmieren die neuen Prozessoren als Xeon Gold 5300H, Xeon Gold 6300H und Xeon Platinum 8300H. Die Xeon Gold sind für Systeme mit vier Sockeln gedacht, Xeon Platinum darf acht Sockel antreiben. AVX-512 mit zwei FMA-Einheiten bieten alle CPUs inklusive der kleinsten Xeon Gold 5300, das ist vor allem im Einstieg ein Fortschritt gegenüber bisherigen Xeon Gold 5200, die nur einmal FMA (Fused Multiply Add instructions) boten. Unterschiede gibt es einmal mehr in der maximalen Speicherunterstützung, 4,5 TByte pro Sockel bieten nur die Modell mit dem Suffix „L“.

Intel Cooper Lake-SP alias 3rd Gen Xeon-SP (Bild: Intel)

Drei Modelle sind zudem für das vor einem Jahr eingeführte und nun optimierte Intel Speed Select ausgewählt, was Intel SST Core Power (SST-CP) und Intel SST Turbo Frequency (SST-TF) einschließt. Core Power zielt darauf ab, eine gewisse Anzahl an Kernen mit einem höheren Basistakt zu betreiben als die verbleibenden aber gleichzeitig den maximal möglichen Turbo-Takt für alle Kerne bereitzustellen, während Turbo Frequency bestimmte Kerne mit höherem Turbotakt betreiben darf als die verbleibenden, während der Basistakt für alle Kerne nicht angetastet wird. Diese Möglichkeiten bieten nur die Modelle Intel Xeon Gold 6328HL, 6328H und 5320H.

Alte Lewisburg-Chipsätze für neue Plattform

Die neue Plattform Cedar Island verbindet den neuen Sockel P+ mit altbekannten Lewisburg-Chipsätzen. Namentlich führt Intel die Varianten C621A, C627A und C629A auf. Das sind auf die neue Plattform abgewandelte Versionen der bereits bestehenden acht Lösungen aus der Lewisburg-Familie aus dem Jahre 2017. An der Verbindung zur CPU per DMI mit vier PCI-Express-3.0-Lanes sowie jedweder weiteren Ausstattung hat sich nichts geändert.

Intel Optane Memory 200 für 4-Sockel-Systeme

Im Gepäck für die neue Plattform hat Intel auch endlich die lange Zeit erwartete zweite Generation an Optane Memory, Codename Barlow Pass. An den grundlegenden Features hat sich dabei aber wenig geändert. Die Module sind nach wie vor maximal 512 GByte groß und werden dabei mit einer TDP von 18 Watt ausgeliefert, auch hat Intel die Taktfrequenzen überraschenderweise nicht erhöht. Und während DDR4-3200 bei regulärem RAM unterstützt wird, bleibt Optane Memory auch in der neuen 200er-Serie bei 2.666 MT/s. Dennoch betont Intel, dass die Bandbreite gegenüber bisherigen Systemen um 25 Prozent zugelegt hat.

Intel Optane PMem 200 series (Bild: Intel)

Auf Nachfrage von ComputerBase, wie denn das sein kann, wenn alle Parameter quasi identisch sind, wollte Intel nur bedingt technische Details preisgeben. Dennoch bestätigte der Hersteller die gestiegene Bandbreite, die vor allem durch Verbesserungen am Speichercontroller auf den Modulen sowie Optimierungen beim Fertigungsprozess gegenüber der ersten Generation zustande kommen.

Update 15:15 Uhr: Es gibt anscheinende doch größere Änderungen, Intel hat falsche Informationen an viele Pressevertreter verteilt. An den grundlegenden technischen Details ändert sich wie berichtet nichts und auch die Taktraten stimmen, allerdings ist die Bandbreite und Haltbarkeit in allen Szenarien deutlich höher.

Vom Erfolg des neuen Speichers ist Intel ohnehin überzeugt. Über 270 sogenannte production wins hat Intel mit Optane Memory bisher erzielt, von den 500 größten Firmen laut Fortune nutzen bereits über 200 diese Speichertechnologie. Dabei gibt es durch die Partner und Kunden stetig neue Anwendungsszenarien, die nicht einmal Intel auf dem Schirm hatte, die sich durch Anpassungen bei der Software erreichen lassen. Je nach Einsatzgebiet können diese von kleinem bis zu riesigem Einfluss reichen.

Intel Optane PMem im Einsatz (Bild: Intel)

Passend zur neuen Plattform hat Intel auch zwei neue Profi-SSDs vorgestellt, die ComputerBase in einer separaten Meldung näher betrachtet.

Für Spezialgebiete: Intel/Altera Stratix 10 NX FPGA

Mit dem Fokus auf AI hat Intel passend zum Start der neuen Xeon auch den Stratix 10 in einer überarbeiteten Auflage im Angebot. Der Stratix 10 NX mit seinen 15 Milliarden Transistoren soll später in diesem Jahr erscheinen und setzt auf einen komplett überarbeiteten AI-Block der die 15-fache Leistung als das bisherige Modell bieten soll, während die weiteren Bestandteile des Chiplet-Prozessors inklusive HBM und die Nutzung von EMIB identisch bleiben.

Intel Stratix 10 NX FPGA mit neuem AI Tensor Block (Bild: Intel)

In eigenen Benchmarks sieht sich Intel erneut gut aufgestellt, konnte bisher aber nur gegen Nvidia V100 antreten. Mit der neuen Ampere-Generation dürften von Nvidias Seite die Karten aber neu gemischt werden, sodass für Intel ein ganz anderer Herausforderer im Ring steht, wenn das Produkt im zweiten Halbjahr verfügbar wird.

Herstellerbenchmarks Stratix 10 NX FPGA gegen Nvidia V100 (Bild: Intel)

ComputerBase hat die Informationen zu dem Bericht von Intel unter NDA erhalten. Die einzige Vorgabe war der frühestmögliche Veröffentlichungszeitpunkt.

Dieser Artikel war interessant, hilfreich oder beides? Die Redaktion freut sich über jede Unterstützung durch ComputerBase Pro und deaktivierte Werbeblocker. Mehr zum Thema Anzeigen auf ComputerBase.