News Hot Chips 33: IBMs Telum-Architektur setzt auf 32 MB L2-Cache – pro Kern

Volker

Ost 1
Teammitglied
Registriert
Juni 2001
Beiträge
18.362
IBMs neuer z-Chip „Telum“ muss sich nicht hinter x86-CPUs verstecken: Zu den Design-Raffinessen des Mainframe-Prozessor gehören unter anderem 32 MB L2-Cache – pro Kern. Aber auch andere Eigenschaften suchen in der x86-Welt bisher ihresgleichen. Anfang 2022 sollen erste Systeme verfügbar werden.

Zur News: Hot Chips 33: IBMs Telum-Architektur setzt auf 32 MB L2-Cache – pro Kern
 
  • Gefällt mir
Reaktionen: flo.murr, Volvo480, boxte30:Goas und 12 andere
Warum werden eigentlich die Wafer am Rand mit Teilweisen cpus belichtet?
 
  • Gefällt mir
Reaktionen: Gnarfoz, jotecklen und Mcr-King
Eine wahre Monster CPU, würde mich jucken das mal zu administrieren.
 
Zuletzt bearbeitet: (typo)
  • Gefällt mir
Reaktionen: flo.murr, Fritzler, MilchKuh Trude und 4 andere
Multivac schrieb:
Warum werden eigentlich die Wafer am Rand mit Teilweisen cpus belichtet?

Vor allem in der industriellen Produktion wird während des Prozesses die Rückseite und der Wafer-Rand (Vorderseite; bis zu 2 mm) mit Lösungsmittel besprüht. Dies soll zum einen Lackansammlungen auf der Rückseite und die Ausbildung einer Lackwulst am Rand verhindern.

Das habe ich gefunden.
 
  • Gefällt mir
Reaktionen: Mort626, GT200b, Pulsar77 und 3 andere
Artikel:
Die auf die Prozessoren abgestimmte Software sieht den Cache als physikalisch vorhandenen und über alle Kerne geteilten L3-Cache, wenn sie den Prozessor anspricht.
Wie kann man sich das vorstellen? Kann dann Kern 1 auf die Daten des L2/vL3 Caches von Kern 3, 4, 5 zugreifen?
Hört sich in erster Linie nicht dumm an, zusammen mit der Größe könnte das dann ne echt gute Trefferrate geben. Aber wie wird dann entschieden, welche Daten im Cache von welchem Kern liegen, wenn der Cache als großes ganzes erkannt wird?
 
  • Gefällt mir
Reaktionen: Ned Flanders
Und ich war schon kurzzeitig dem Glauben verfallen, IBM hätte nur noch wenig zu sagen in der IT-Welt... Aber die meisten Patente und die riesen CPU.
 
  • Gefällt mir
Reaktionen: Snowi und andi_sco
Ironbutt schrieb:
verfallen, IBM hätte nur noch wenig zu sagen
Ja, bin auch überrascht, das Sie so weit vorne liegen
 
  • Gefällt mir
Reaktionen: gartenriese
Multivac schrieb:
Warum werden eigentlich die Wafer am Rand mit Teilweisen cpus belichtet?

Weil im Step-and-Repeat Prozess immer mehrere Dies gleichzeitig belichtet werden. Die Anordnung auf den Belichtungsmasken ist dann natürlich rechteckig, wie hier zu sehen bei einer Maske für 20 Dies:

1629797168734.png



Rechteckige Maske und runde Wafer ergeben dann einfach den Ausschuss am Rand.
 
  • Gefällt mir
Reaktionen: Mort626, GT200b, Piktogramm und 15 andere
So bleibt pro Kern nur eine Leistungssteigerung von rund 7 Prozent übrig.
Das klingt jetzt nicht sonderlich beeindruckend, zumal der letzte Chip 2 Jahre alt ist, aus älterer Fertigung stammt und ~1/3 der Transistoren pro Core hatte. Das ist ja fast weniger Fortschritt als Intel CPUs jahrelang zwischen (jährlichen!) Generationen hatte.

Transistorzahlen sind aber wahrscheinlich wenig vergleichbar weil der Vorgänger auf große DRAM L4 Caches gesetzt hat, hier gehen wahrscheinlich die für die großen Caches drauf. Transistordichte hier ist auch Vergleichbar mit den Ampere GPUs auf 8nm Samsung, also immer noch eine ganze Ecke hinter TSMC.
 
konkretor schrieb:
Ein wahre Monster CPU

+e :D

btt:

@Volker

"Groß waren IBMs Prozessoren zum Beispiel schon immer, 530 mm² sind für eine Telum-Chip deshalb keine Besonderheit. 22,5 Milliarden Transistoren bringt IBM auf dieser Fläche mithilfe von Samsung unter"

Die Tatsache, dass dieses zwar für IBM CPUs gilt, bedeutet jedoch auch wieder nicht, dass 22,5 Milliarden Transistoren für eine CPU nicht trotzdem total "gestört" ist, für eine CPU.

Selbst eine RTX2080Ti hatte "nur" 18,6 Milliarden Transistoren und die 4 Milliarden Transistoren von AMD für einen 8 Kern Prozessor, sehen hier eher niedlich aus.

Die Fläche ist, dem Aufwand entsprechend, ordentlich und die Vermutung, dass IBM nicht mit Murmeln spielt, ist ziemlich naheliegend.

Für Maschinen die dazu dienen, Spiele und anderen Firlefanz darzustellen, ist das natürlich nichts.

mfg
 
  • Gefällt mir
Reaktionen: ComputerJunge, medsommer, Volker und eine weitere Person
Interessant das man dort von SMT4 bzw sogar SMT8 wieder zurück auf SMT2 geht.
Bei Intel und AMD munkelt man immer wieder ob es in Richtung SMT4 geht.

Vielleicht ist das aber auch bedingt durch die unterschiedliche Architektur ein Apfel - Birnen Vergleich meinerseits.
 
  • Gefällt mir
Reaktionen: 4nanai
Finde es zwar wahnsinnig interessant, kann mir aber nur sehr wenig darunter vorstellen. Wir brauchen Performance-Vergleiche und Benchmarks!
 
Hannibal Smith schrieb:
Wie kann man sich das vorstellen? Kann dann Kern 1 auf die Daten des L2/vL3 Caches von Kern 3, 4, 5 zugreifen?
Ja. Das geht sogar so ähnlich unter IBM Power, da können die Cores meines Wissens nach zwar nicht auf die Caches der anderen zugreifen, aber sie können die Daten geschickt bekommen, wodurch man bei Power selbst Sockel und sogar über Netzwerk systemübergreifend die CPUs in Echtzeit synchronisieren können. Damit kann man auf Power unterbrechungsfrei LPARs ( vergleichbar mit VM und Vmware ) von einer physischen Maschine zu einer anderen bewegen.

Calaphos schrieb:
Das klingt jetzt nicht sonderlich beeindruckend, zumal der letzte Chip 2 Jahre alt ist, aus älterer Fertigung stammt und ~1/3 der Transistoren pro Core hatte. Das ist ja fast weniger Fortschritt als Intel CPUs jahrelang zwischen (jährlichen!) Generationen hatte.
Was aber auch recht irrelevant ist, weil die Skalierbarkeit oft nicht von mehr Cores abhängig ist.

marzk schrieb:
Interessant das man dort von SMT4 bzw sogar SMT8 wieder zurück auf SMT2 geht.
Aber halt auch nur bei den z-Chips. Power 10 bleibt bei SMT8
 
  • Gefällt mir
Reaktionen: Hannibal Smith
Zurück
Oben