News Xeon Phi: Knights Landing als Prozessor zum IDF 2015 mit 60 Kernen

Volker

Ost 1
Teammitglied
Registriert
Juni 2001
Beiträge
18.281
Ist so ein Kern mit einem "normalen" Haswell/Broadwell/Skylake-Kern vergleichbar oder ist das eine ganz andere Architektur?
 
Vergleichbar nein, aber Intel wird versuchen ihn x86/64 kompatibel zu machen. Und ich glaube damit wirds Probleme geben, da der Prozessor hierfür teilweise neu designt werden muss.
 
@Yast


Das sind Airmont Kerne, die noch um mehrfaches SMT und sehr breite Vector Einheiten modifiziert worden sind.
 
Zuletzt bearbeitet:
Waren das anfangs nicht mal alte Pentium Prozessoren, die durch die neuen Fertigungsstrukturen so klein wurden, dass Intel einfach mehrere auf einen Die kloppte und hoffte damit den Grafik- / Rendermarkt zu erobern?
 
Das war früher das Larrabee Projekt, aus dem dann die Xeon Phi Geschichte heraus vor ging. Damals wollte Intel einen Grafikprozessor auf der Grundlage von kleinen Clustern, aus den schon angesprochenen Pentium Prozessoren bauen.
 
Macht es für die Software einen Unterschied ob Beschleunigerkarte oder Prozessor? Und wie darf man sich das vorstellen, sind die KNL Dies auf dem Mainboard, neben einer CPU die das System berechnet?

Und gilt das jetzt nur für das gezeigte System, dass KNL also Prozessor zum Einsatz kommt, oder wird es für die gesame KNL-Serie keine PCIe Karten Version geben?
 
Welches Anwendungsfeld lastet so einen Prozessor wirklich aus? Momentan werden ja x-Kerne nur dann ausgelastet, wenn sie über mehrere Server verteilt sind und dementsprechend auch viel RAM mitbringen. Bei nur einem Server mit derart vielen Kernen....wie sieht es da aus?
 
Raytracing in Software.

Die News sagt aber auch wieder so gut wie gar nichts aus.


Der Chipsatz bringt den Sockel2011-v3 und ist damit in Endkunden-Boards bereits enthalten.
Da wäre die Frage doch berechtigt:
Wo soll dieser Prozessor zum Einsatz kommen?
Wird es eine bezahlbare Endkundenversion geben?
Ist der CPU mit aktuellen CPU vergleichbar?
Benötigt er auf xx-Kerne optimierte Software oder übernimmt ein neues(oder altes Larabee-) Feature die Verteilung der Last?
 
@Befehlssatz:
Soweit ich weiß, x64 mit einem Teil von AVX-512 (so stehts in Intels Befehlssatztabelle). Also theoretisch "Crysis-compatible" (CPU-Part) ;).

@Anwendungsgebiet:
Parallelisierung mit doch häufigen Zugriffskonflikten/Synchropunkten. Bzw. mit AVX-512 Number-Crunching (8x DP SIMD => bei 2 GHz ca. 2 TFLOPS (angenommenen 1 Takt pro FMA)) auf Höher aktueller Grafikkarten.
 
60 Atomkerne mit je einer dicken Vectoreinheit drangeflascht.
Damit dürfte der beim HEVC Encoding das mit abstand schnellste sein was es auf Markt gibt und das ohne das Software drauf angepasst werden müsste.
Wenn man mal nach einem sinnvollen Einsatz ausserhalb des HPC Bereichs sucht.
 
So lange Dein Code nicht speziell auf die Vector Einheiten ausgelegt ist und diese nicht optimal aus lastet, wirst Du mit nicht angepasster Software keinen Speed erreichen. Auch nicht mit Auto-Vektorisierung Deines Compilers. Was HEVC Encoding angeht würde ich mich in der Hinsicht nicht zu weit aus dem Fenster lehnen.

Der X264 Entwickler Dark Shikari hatte mal in der Vergangenheit speziell für Larrabee eine X264 Version geschrieben und Video Encoding auf der Karte betrieben. Von der Performance war er nicht gerade begeistert.
 
input_iterator schrieb:
Das war früher das Larrabee Projekt, aus dem dann die Xeon Phi Geschichte heraus vor ging. Damals wollte Intel einen Grafikprozessor auf der Grundlage von kleinen Clustern, aus den schon angesprochenen Pentium Prozessoren bauen.

Das Projekt ist ein pures Forschungsprojekt. Ob es jemals erfolgreich wird? Oder doch auch mal eingestampft bzw. maximal ein Nischenprodukt? Intel (und auch andere Firmen) hatte genügend IT-Projekte/Produkte, die letztlich gescheitert sind: Intel Itanium, Intel i860, EMT64 (ja, hier hat AMDs x64 gewonnen!), ...

Die parallelen Prozessoren haben heute auch immer noch Alltagsprobleme: so kann beispielsweise ein Windows (Server) mit den 72 Kernen des größten Xeons nix anfangen... da scheitert bereits das Betriebssystem, ohne dass überhaupt eine Anwendung laufen muss.
 
Wolfsrabe schrieb:
Welches Anwendungsfeld lastet so einen Prozessor wirklich aus? Momentan werden ja x-Kerne nur dann ausgelastet, wenn sie über mehrere Server verteilt sind und dementsprechend auch viel RAM mitbringen. Bei nur einem Server mit derart vielen Kernen....wie sieht es da aus?

Faust2011 schrieb:
Die parallelen Prozessoren haben heute auch immer noch Alltagsprobleme: so kann beispielsweise ein Windows (Server) mit den 72 Kernen des größten Xeons nix anfangen... da scheitert bereits das Betriebssystem, ohne dass überhaupt eine Anwendung laufen muss.

Simulation von Massenvernichtungswaffen, Hochfrequenzhandel, Strömungssimulation, Wetter- und Klima-simulation, Cinebench usw.. Alles Gebiete wo x86- und Windows-kompatibilität keine Rolex spielt.
 
Zuletzt bearbeitet:
Mich würde ja interessieren, ob man das System theoretisch mit normalen Linux/Windows laufen lassen kann.

Gerade für Hobbyrenderer, die viel mit C4d und Co hantieren könnten da einen schicken Leistungsboost bekommen bei 60+ Kernen und mehrfachen SMT
 
foofoobar schrieb:
Simulation von Massenvernichtungswaffen, Hochfrequenzhandel, Strömungssimulation, Wetter- und Klima-simulation, Cinebench usw.. Alles Gebiete wo x86- und Windows-kompatibilität keine Rolex spielt.

Auf *nix-Umgebungen performen solche Xeons / Multi-Core CPUs deutlich besser als unter Windows. Und die entsprechenden Programme, wie Du sie genannt hast, laufen dann auch unter diesen Unixen.

Ein weiterer Anwendungsfall ist die Partitionierung der CPU durch den Betrieb eines ESX-Servers, Stichwort Virtualisierung.
 
foofoobar schrieb:
Simulation von Massenvernichtungswaffen, Hochfrequenzhandel, Strömungssimulation, Wetter- und Klima-simulation, Cinebench usw.. Alles Gebiete wo x86- und Windows-kompatibilität keine Rolex spielt.

Genau so sieht ist es. Diese Beschleuniger sind (erstmal?) nicht für den Heimgebrauch gedacht sondern werden im Supercomputerbereich eingesetzt. Dort laufen sie auch mehr oder weniger ohne Probleme unter Linux. Natürlich muss der Code entsprechend angepasst werden um davon profitieren zu können aber das geht z.B. Mit OpenCl und wird sich in nächsten Jahren weiter verbessern. Und das ganze wird in den USA bzw. Vom DOE sehr ernst genommen und an verschiedenen National Labs werden neue Großrechner damit ausgestattet.
 
@Pyroplan
Für "Hobbyrenderer" bieten AMD und Nvidia extra Grafikkarten an, um sowas zu beschleunigen. Stichpunkt FirePro und Quadro. Ich glaube das wäre eher was für dich, wenn du sowas benötigst.
Xeon Phi ist ja auch "nur" ein Co-Prozessor und auf diesem Co-Prozessor läuft im Speicher ein eigenes Linux. (Quelle)
Auf dieser Karte kann man keine Windows-Programme laufen lassen, weil auf der Karte eben ein uOS läuft und Windows-Programme binär inkompatibel sind. Also, man kann die Karte zwar unter Windows booten, aber eben keine Windows-Programme darauf ausführen. Es laufen nur Linux-Programme. Unter Windows braucht man dann eben einen Cross-Compiler etc. Und wenn man die Karte in seinen normalen Windows-Rechner stecken würde, dann würde das OS keinen weiteren Rechenkern anzeigen, da die Karte eben ein eigenes OS hat und erst speziell gebootet werden muss. Details dazu findet man online genügend.

Wer hier also immer noch glaub, dass man sich die Karte als Ottonormaluser einfach die den Rechner klatscht, ist auf dem Holzweg.

Edit:
Hier (und hier) gibt es auch noch viele Infos für Interessierte.

The embedded Linux operating system, running on Intel Xeon Phi coprocessors, supports communication with the host via standard networking tools. To run an application directly on an Intel Xeon Phi coprocessor, transfer the application and any dependencies using SSH and SCP.

By default, the driver installation configures a network interface and alias for each Intel Xeon Phi coprocessor so that developers can refer to a coprocessor by “name” or by static IP address. For example, the default configuration will associate the name “mic0” with the first card in the system, the name “mic1” with the second card and so forth.
 
Zuletzt bearbeitet:
Faust2011 schrieb:
Das Projekt ist ein pures Forschungsprojekt. Ob es jemals erfolgreich wird? Oder doch auch mal eingestampft bzw. maximal ein Nischenprodukt? Intel (und auch andere Firmen) hatte genügend IT-Projekte/Produkte, die letztlich gescheitert sind: Intel Itanium, Intel i860, EMT64 (ja, hier hat AMDs x64 gewonnen!), ...

Die parallelen Prozessoren haben heute auch immer noch Alltagsprobleme: so kann beispielsweise ein Windows (Server) mit den 72 Kernen des größten Xeons nix anfangen... da scheitert bereits das Betriebssystem, ohne dass überhaupt eine Anwendung laufen muss.

Öhm nicht, Kassenschlager in der HPC Welt. 32% der TOP500 System mit Co-Prozessor setzen auf Phi. Das seit 2013. Im Vergleich zu AMD mit nur 4% weit besser.

Quelle: http://top500.org/lists/2015/06/

Faust2011 schrieb:
Die parallelen Prozessoren haben heute auch immer noch Alltagsprobleme: so kann beispielsweise ein Windows (Server) mit den 72 Kernen des größten Xeons nix anfangen... da scheitert bereits das Betriebssystem, ohne dass überhaupt eine Anwendung laufen muss.

Sagst du? Hmm, dann wundere ich mich doch über die volle Auslastung eines Quad Sockel E7. Alles was man schön parallelisieren lassen kann, kann man auch verteilen. Egal ob unter Windows oder Linux. Dafür gibt es genug Programme von DBs, Analysewerkzeuge, Webserver,..

Quelle: http://www.anandtech.com/show/9193/the-xeon-e78800-v3-review/9


Immer wieder lustig wie Leute vor den Schreiben nicht denken.

c2ash schrieb:
Xeon Phi ist ja auch "nur" ein Co-Prozessor und auf diesem Co-Prozessor läuft im Speicher ein eigenes Linux.



@c2ash


Das was du verlinkst sind Angaben der vorherigen Modelle. Die BGA Variante von Knights Landing verwendet:

heavily modified “Silvermont” Atom cores

Und weiter sind die Binärkompatibel zum Xeon:

That includes not only running various Linux distributions, but also running Microsoft’s Windows Server operating system. That’s because the heavily modified “Silvermont” Atom cores at the heart of the Knights Landing chip support all of the instructions that a regular Xeon does, with the exception of the TSX transactional memory feature that is just now coming to market in the Xeon D chip for microservers that Intel just announced.

Und weiter:

he starting point for the Knights Landing processor is the heavily modified Silvermont Atom core, which has been so changed that Sodani says that it would probably be more accurate to call it a Knights core. Because Intel has streamlined the Silvermont core radically, yet while maintaining full compatibility with the Xeon processors as far as Linux and Windows applications are concerned, there is room to put lots of AVX floating point processing oomph into the chip.

Und weiter:

While running a Windows OS on this platform you can see all the logical processors in the task manager which shows the OS actually sees all the cores unlike Knights Corner which was a PCIe coprocessor.

Die Diskussion hatten wir letzte Vorstellung schon einmal. Nur die Co-Prozessor und Infiniband Variante kann das nicht, die BGA Variante ist ein Großer x86 Chip auf dem native Windows oder Linux läuft.

Quelle: http://www.tweaktown.com/news/44225/details-intels-next-gen-knights-landing-platform/index.html
Quelle: http://www.theplatform.net/2015/03/25/more-knights-landing-xeon-phi-secrets-unveiled/
 
Zuletzt bearbeitet:
Zurück
Oben