News Hot Chips 33: Intel Alder Lake steht und fällt mit dem Thread Director

Thomaswww schrieb:
Vor allem, da mein Ryzen 1700 ja eh keine Zukunft unter Windows hat, dank nicht vorhandenem TPM 2.0
Also wenn ich hier nach gehe, sollte das kein Problem sein.
 
mcsteph schrieb:
Ich sage nur 4 Kerner mit 5% Leistungsprung, alle 2 Jahre für 500 Euro und das über Jahre hinweg.
Aber trotzdem wurde von Sandy-Bridge zu Skylake die Architektur zwei Mal geshrinked, einige Instructions eingeführt sowie neue Schnittstellen (DDR4, USB3.x, PCI4), danach der 14nm-Prozess optimiert sodass eben mehr Kerne auf einem Die parallel betrieben werden können. (Performance pro Watt). Das kommt nicht von irgendwo. Wie die Prozessoren dann verkauft werden, dass entscheiden BWL-er...
Die Innovationen der Chiphersteller müssen nicht zwangsweise alle in die Peak Performance gehen. Ich kenne auch noch die Zyklen von 386, 486, Pentium usw. die waren damals auch alle ca. 2 Jahre...
 
Thomaswww schrieb:
Vor allem, da mein Ryzen 1700 ja eh keine Zukunft unter Windows hat, dank nicht vorhandenem TPM 2.0

Summit Ridge bringt bereits ausreichende TPM Funktionalität mit.

TPM1.2 reicht bereits.
 
@Blumentopf1989 big.LiTTLE gibts schon länger, schau dir mal Mobil SOCs an. Es gibt ja sogar super Anwendungen für big.LiTTLE, jedoch nicht im Desktop Bereich, da kauf ich mir Kerne, weil ich sie benötige! Aber wir werden bald sehen, cwie die Kleinen in Spielen performen.
 
  • Gefällt mir
Reaktionen: iron-man
Virtramp schrieb:
Also ich hab angst dass der schedueler microstutter verursacht
Jop. Diese Angst ist nicht unbegründet.. ich hab auch bedeutend bessere frames und frametimes bei nem 5950x mit cppc disabled
Kostet halt Zeit und Leistung wenn der sheduler dauernt die Threads hin und her schiebt zwischen verschiedenen Kernen..

Ist halt wie auf der Arbeit.. wenn du die Arbeit von nem Kollegen zugewiesen bekommst aber du keine Ahnung hast was er bereits dran gemacht hast fängst du erstmal bei 0 an.. kostet halt mehr Zeit als wie den Kollegen einfach Mal seinem Scheiss fertig machen lassen
 
Nizakh schrieb:
Wenn ich die Leistungangaben zu Multithreading richtig deute, bedeutet das:
2 P-Core + 4 E-Core = MT Performance von 4 P-Core
1 P-Core = 2 E-Core
Nein, im Artikel steht die Leistung ist (über) 50% höher (nicht 100%):
Der Performance-Kern „Golden Cove“ ist nach wie vor eine ganz andere Liga, er liefert über 50 Prozent mehr Leistung als ein einzelner E-Core
 
Aber die Kerne können ja halt nicht alles berechnen. Irgendwoher muss ja auch der Größenunterschied herkommen.

Gracemont [P]​
Golden Cove [E]​
Cache​
L1 cache​
96 KB per core (64 KB instructions + 32 KB data)​
80 KB per core (32 KB instructions + 48 data)​
L2 cache​
2 MB per module​
1.25 MB per core​
L3 cache​
3 MB per module​
3 MB per core​
Architecture and classification​
Architecture​
x86-64​
Instructions​
x86-64, Intel 64​
Min. feature size​
Intel 7​
Instruction set​
x86​
Extensions​
AES-NI, CLMUL, RDRAND, SHA, TXT​
MMX, SSE, SSE2, SSE3, SSSE3, SSE4, SSE4.1, SSE4.2​
MMX, SSE, SSE2, SSE3, SSSE3, SSE4, SSE4.1, SSE4.2​
AVX, AVX2, FMA3​
AVX, AVX2, AVX-512, FMA3​
AES, CLMUL, RDRAND, SHA, TXT​
VT-d, VT-x​
VT-x, VT-d​
 
xexex schrieb:
Da man hier anscheinend nicht rechtzeitig mit Microsoft zusammengearbeitet hat, aus welchen Gründen auch immer, kamen hieraus Verzögerungen die bei Zen gut zwei Jahre gedauert haben, bis zu einer optimierten Unterstützung dieser Architektur.
War es nicht so, dass AMD bei Zen1 selbst gesagt hat, dass der Windows-Scheduler ordnungsgemäß arbeitet? Soweit ich weiß war die Leistung einfach nicht verbesserbar.

Bei Zen2 kamen dann die Preferred Cores neu dazu, für die Windows direkt ein Update zur Hand hatte.

Also ich würde sagen, die Zusammenarbeit lief, wie sie soll. Zen1 lief halt latenzmäßig nicht besonders.
 
dhew schrieb:
Nein, im Artikel steht die Leistung ist (über) 50% höher (nicht 100%):
Er bezieht sich auf das multithread Diagramm
2+8 ist 50% schneller als 4P. Mal angenommen die P-Kerne sind bei beiden gleich schnell, dann wären die 8 E-Cores eben so schnell wie 4 P-Cores.

Da sich der Cluster von 4 E-Cores den L2 Cache und die Anbindung an den Ringbus teilt, kann es schon einen Unterschied zwischen ST und MT geben.
Ergänzung ()

brabe schrieb:
Aber die Kerne können ja halt nicht alles berechnen.
Was genau jetzt? Deine Tabelle sieht für beide ziemlich gleich aus. AVX512 gibt's ja generell nicht.
 
Zuletzt bearbeitet:
Dome87 schrieb:
Ja, das haben wir einzig AMD zu verdanken. Die hätten das an Intels Position übrigens ebenso gemacht. So agieren wirtschaftliche Unternehmen halt.
Du meinst das Intel eine Vergleichszahlung in MRD Höhe an AMD zahlte damit es zu keinem Prozess wegen Missbrauch der markbeherrschenden Stellung kam?
oder das die EU Intel dennoch verurteilte und noch auf Strafzahlung wartet? Was aufgrund Formfehler wieder neu aufgerollt werden muss?
So die Art von AMD würde das selbe tun? Vielleicht. Werden wir wohl nie erfahren^^

###

Zu BIG.little, ja also stehe ich nicht alleine da, im Desktopbereich Humbug. Das einzige was Inel spart ist DIE Size. Aber jetzt fantasiert Intel schon mit 50% vgl zu hier und da etc. pp.

So ein paar Fragen die man sich stellen könnte wenn man skeptisch gegenüber Intel Folien ist:
Was will man mit 8P und 8 und später 16 E-Kerne?
Wie will man da Ahmdalsche Gesetz aushebeln?
Wenn die 4 im Sweetspot laufen, why den großen nicht im Sweetspot laufen lassen?
Wenn die 4 E Fläche eines P brauchen, wie sieht es mit Strom aus? Selbes Verhältniss? Wenn nein, wo soll die gesteigerte Wärmedichte hin?
Was für Preisvorstellungen hat Intel mit der "neuen" Fertigung und später Foveros?
Warum 250W PL2 TDP?
Wer bezahlt die Lizenzen da alles auf Lizenz pro Kern umgestiegen ist?
Wieso kommt den Inels HEDT und Server CPU Sapphire Rapids ohne E-Core?^^

Ich bleibe dabei, Rechner sind keine Smartphones, welche mit always on und 5G Netz etc. betrieben werden und dabei Akku ziehen. Selbst ein 800Mhz Atom Kern schafft Background Last von Windows. Was will man mit 8 E Kernen? Rendern? Na dann auf zu 16 Kerne AMD (730€).

Die Wahrheit die ich vermute:
Intels CPU P-Kerne sind flächentechnich viel zu groß und ineffizient, auch in Intel 7 whatever.
Da man keine 12 P Kerne packen kann ohne Kernschmelze zu bekommen, versucht man es mit 8 + 8 da inIntel genau weiß, das die Kerne im Desktop nutzlos werden, abseits von 28s Cinebench. Außerdem kann man dann sagen man bietet 16 Kerne an, zum Preis(?) von AMD 12 Kernen.
In modernen Spielen, welche circa 7-8 Kerne brauchen, ideln 4 kerne bei AMD herum, bei Intel dann alle 8 E-Kerne. Jede Produktivumgebung kauft sich schlicht nen 1 Jahr alten 5950x mit 16 dicken Kernen, fertig.
Wer mehr will kauft AMD HEDT bis Oktachannel 64 Kerne mit 4TB Ram. Spieler wundern sich was die E-Kerne tun sollen, außer für, wie Intel exakt so sagte, "nebenbei Netflix zu schauen".
 
Ja, das werden wir wohl nie erfahren. Aber wenn's ums Geld geht ist das meistens so. Auch AMD hätte an der Position Angst um seine Macht gemacht. Jedes Unternehmen.

Scheiße ist das natürlich trotzdem. Egal wer das macht.
 
Colindo schrieb:
War es nicht so, dass AMD bei Zen1 selbst gesagt hat, dass der Windows-Scheduler ordnungsgemäß arbeitet? Soweit ich weiß war die Leistung einfach nicht verbesserbar.
Der Windows Scheduler schaltet standardmäßig die Threads zwischen den Kernen hin und her. Kann man ja wunderbar sehen wenn man (auf einem Intel PC) ein Programm mit einem Thread und 100% Last startet, dann erscheint bei einer 4C CPU 25% Auslastung auf allen Kernen.

Dieses Verhalten mochten aber vor allem die ersten Zen CPUs nicht, weshalb auch Microsoft gute zwei Jahre später das Verhalten angepasst hat und das obwohl AMD hier früher behauptet hatte, es wäre ja alles in Ordnung.

1629801827319.png

https://www.computerbase.de/2017-03/amd-ryzen-stellungnahme-scheduling-core-parking/

1629801768726.png

https://www.pcgameshardware.de/AMD-...Scheduler-Performance-Verbesserungen-1284131/

Vom Prinzip hat man es also selbst verbockt, weil man diese Optimierungen schon viel früher hätte haben können, hätte man sich rechtzeitig vor dem Launch zusammengesetzt.

Der Linux Scheduler arbeitet anders und schaltet die Threads seltener zwischen den Kernen. Das ändert aber nichts daran, dass AMD der Scheduler von Windows bekannt war, man aber versäumt hatte hier rechtzeitig einzugreifen. Intel zeigt wie man es richtig macht (wenn es funktioniert) und wird zum Launch mit einem angepassten Scheduler starten, spannend wie gut oder schlecht es funktioniert wird es allemal.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Klever
Draco Nobilis schrieb:
Was will man mit 8P und 8 und später 16 E-Kerne?
Wie will man da Ahmdalsche Gesetz aushebeln?
Wie hebeln andere das Gesetz aus? CPUs mit mehr als 8 Kernen sind jetzt nichts neues.

Draco Nobilis schrieb:
Wenn die 4 im Sweetspot laufen, why den großen nicht im Sweetspot laufen lassen?
Kann man machen. Einfach die TDP begrenzen. Kostet eben Performance. Generell wird es immer effizienter sein mehrere Kerne auf niedrigen Takt zu betreiben, als weniger Kerne mit höherem Takt, solange das Problem parallelisierbar ist. Zeigen die Server CPUs seit Jahren.
Draco Nobilis schrieb:
Wieso kommt den Inels HEDT und Server CPU Sapphire Rapids ohne E-Core?^^
In dem Preisbereich wird die Marge deutlich größer sein, um etwas mehr Die-Fläche verschmerzen zu können.
Draco Nobilis schrieb:
Was will man mit 8 E Kernen? Rendern? Na dann auf zu 16 Kerne AMD (730€).
Wen interessiert es wie die Kerne zusammengesetzt sind? Es entscheidet Preis und Leistung des fertigen Produkts. Warum sollte man sich am Konzept abarbeiten?
Wenn der Maximalausbau von Alderlake teurer als der 5950x wird und auch langsamer, bleibt er eben liegen.

Draco Nobilis schrieb:
Die Wahrheit die ich vermute:
Intels CPU P-Kerne sind flächentechnich viel zu groß und ineffizient, auch in Intel 7 whatever.
Mal unabhängig davon, dass Intel bei der Effizienz und Kerngröße aktuell im Nachteil ist. Was hat das mit dem Konzept zu tun? Entweder es ist effizienter, bzw ermöglicht mehr Performance pro Fläche oder nicht. Ganz unabhängig von der Ausgangslage.

Draco Nobilis schrieb:
Da man keine 12 P Kerne packen kann ohne Kernschmelze zu bekommen, versucht man es mit 8 + 8 da inIntel genau weiß, das die Kerne im Desktop nutzlos werden, abseits von 28s Cinebench.
Wenn mehr als 8 Kerne nutzlos wären, bräuchte Intel ja nur 8 Kerne zu verbauen.
Komischerweise verkauft AMD die 5900 und 5950 ganz gut. Es scheint also Bedarf an mehr Kerne vorhanden zu sein.


Nur mal so als Denkanstoß. Wenn der Alderlake floppen wird. Wie groß ist die Wahrscheinlichkeit, dass die CPU mit 10 Golden Cove Kernen dann ein Erfolg gewesen wäre?
 
@xexex Den Teil der Überschrift, der sagt "Scheduling ist kein Problem" hast du aber schon gelesen, oder? Darauf hatte ich mich bezogen.

Was den PCGH-Artikel angeht, hatte ich die CCX-Awareness tatsächlich vergessen. Zuletzt berichteten hier im Forum noch 5900X- und 5950X-User, dass ohne Festpinnen auf ein Chiplet die Gaming-Leistung nicht konstant wäre. Dadurch hatte ich das verdrängt. CB hat damals übrigens nur bei Ryzen 3000 Vorteile festgestellt und die CCX-Awareness gar nicht erwähnt
 
bensen schrieb:
Wie hebeln andere das Gesetz aus? CPUs mit mehr als 8 Kernen sind jetzt nichts neues.
Für Desktop schon, Ausname AMD 12 und 16 Kerne, welche für Spiele eigentlich nicht weiter relevant sind (12 Kerner weil wegen Cache und 2x CCD schon eher).

bensen schrieb:
Kann man machen. Einfach die TDP begrenzen. Kostet eben Performance. Generell wird es immer effizienter sein mehrere Kerne auf niedrigen Takt zu betreiben, als weniger Kerne mit höherem Takt, solange das Problem parallelisierbar ist. Zeigen die Server CPUs seit Jahren.
Also in Kurz: Ja, aber viele kleine sind effektiver.
Meine Entgegnung: wobei im gewählten Szenario? Welches Use Case existiert den da für 8P und 8E Kerne was ein 12 Kern CPU nicht besser kann? Die angesprochene CPU hat Probleme bei 12 Kern Anwendungen, während AMD dies dann nicht hat. Andersherum hat Intel dann Vorteile bei 16 Kern Last, swoweit Ahmdal da nicht dazwischen kommt, die P Kerne dann nicht zuviel TDP wegboosten und die E-Kerne nicht die Workload abbremsen.

bensen schrieb:
In dem Preisbereich wird die Marge deutlich größer sein, um etwas mehr Die-Fläche verschmerzen zu können.
Ja dann könne man doch gleich >16 E Kerne verbauen^^ ist doch in der Logik Intels für Produktivanwendungen gut?

bensen schrieb:
Wenn der Maximalausbau von Alderlake teurer als der 5950x wird und auch langsamer, bleibt er eben liegen.
Das meine ich. Das Risiko besteht.

bensen schrieb:
Was hat das mit dem Konzept zu tun?
Man versucht damit Intels CPU Core Flächenproblem zu kompensieren.
Idee ist also meiner Meinung aus der Not heraus geboren, weil man 12 Kerne im Desktop aufgrund Wärme und Größe nicht sinnvoll anbieten kann.

bensen schrieb:
Wenn mehr als 8 Kerne nutzlos wären, bräuchte Intel ja nur 8 Kerne zu verbauen.
Nicht nutzlos, aber weniger gefragt, bzw. was will den der Markt?
Unterschiedliche Kerne? Wir werden ja sehen. Intel ignoriert viel zu gern als Monopolist den Markt als ganzes. Deswegen scheitert so viel an der Technik und Innovation Intels.

bensen schrieb:
Nur mal so als Denkanstoß. Wenn der Alderlake floppen wird. Wie groß ist die Wahrscheinlichkeit, dass die CPU mit 10 Golden Cove Kernen dann ein Erfolg gewesen wäre?
Können Sie nicht bringen, weil wieder weniger Kerne als AMD + auch nicht gut kühlbar.
Auch gab es das bei Intel schon. Sind ja von 10 auf 8 "Gaming Cores" heruntergegangen.
 
Colindo schrieb:
Den Teil der Überschrift, der sagt "Scheduling ist kein Problem" hast du aber schon gelesen, oder? Darauf hatte ich mich bezogen.
Natürlich! Aber sie haben zunächst behauptet, dass Scheduling sei kein Problem und zwei Jahre später gab es dann besseres Scheduling, die Behauptung war also schlichtweg Mist.
1629807684375.png
 
Zuletzt bearbeitet:
Zurück
Oben