News AVX10.2 für Nova Lake bestätigt: Kommando zurück und Alles auf Anfang

Volker

Ost 1
Teammitglied
Registriert
Juni 2001
Beiträge
19.634
  • Gefällt mir
Reaktionen: flo.murr, Quidproquo77, Deinorius und 10 andere
Besser spät als nie, Intel. :jumpin:


Intel APX doubles the number of general-purpose registers (GPRs) from 16 to 32. This allows the compiler to keep more values in registers
Das erfordert gezieltes Kompilieren? Uff.
Oder hat AMD auch doppelt so viele Register, sodass man mit einer Kompilierung die CPUs beider Hersteller abfrühstücken kann?
 
  • Gefällt mir
Reaktionen: herrStreusalz
Naja auf jedem neuen Prozessor nimmt man am besten den aktuellen Compiler und schmeißt nur die arch-Flags dazu. Die Optimierungem macht ja weitgehenst der Compiler, das ist im HPC gang und gebe.

Sehr sehr selten gibts Verrückte die native in Assembler/C++ die Instruktionen per Hand optimieren.
Abwärts geht halt immer, du kannst Binaries die auf Skylake optimiert wurden auch auf Granite Rapids AP laufen lassen, Performancegewinn hängt dann halt nur vom Cache und dem Tackt ab.

Auf GPUs ist das ja noch viel schlimmer, da gib man z.b. bei nvcc anfang und end Arch an und der Compiler macht dann 23 compiles und stopft sie zusammen...
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: rvnbld und herrStreusalz
Mal gespannt was dann von AMD und Intel als kleine halb kaputte 1/4 so große Chips bezahlbar übrig bleiben denn die Spitzenmodelle werden sicher extrem teuer und extrem schnell, also komplett OP für Gamer zumindest aufm AMD Seite ob Intel mithalten kann real auch in Spieleleistung wird man erst noch sehen. Wir reden schon bei Zen 6 von glaub 24 oder 32 Kerne oder 26? mit bis zu 7Ghz, teils mit massiv größerem Cache... also so ne Art x3d (light) by default.
 
Zuletzt bearbeitet:
Volker schrieb:
Heute geht alles zurück auf Anfang und das komplette AVX10.2-Featureset ist auch für Intel Nova Lake dabei, auch APX darf der kommende Desktop-Prozessor aufbieten. Alles andere wäre auch schlichtweg eine Überraschung gewesen.
Ja … Bis dann in drei Monaten wieder ISA-Erweiterung Xyz bei E- oder P-Cores fehlt, oder was? Was'n Chaos!

Und dann wundert sich Intel ernsthaft bei dieser brutalen ISA-Fragmentierung (welche sie zuvorderst selbst ständig mit ihrem Hin und Her vorantreiben), daß es mit der Adaption der Erweiterungen bei Software-Projekten hapert …

Welcher Software-Entwickler will denn bitte auf spezifische ISA-Erweiterungen setzten, wenn er sich nicht einmal wirklich sicher sein kann, daß die Software wenige Monate später (nach Projekt-Abschluß im Markt) die ISA in tatsächlicher Hardware zur Nutzung überhaupt vorfindet, weil Erweiterung Xyz kurzfristig für die aktuelle, nächste oder übernächste CPU-Serie wieder plötzlich abgekündigt wurde?!

Kann in Santa Clara überhaupt noch Jemand geradeaus denken? Dieses Zurück auf Anfang jetzt, wird sicherlich nicht Entwickler dazu bringen, die Erweiterungen nutzen zu wollen – Das Gegenteil ist der Fall!

Weil jetzt werden Software-Entwickler unter Garantie erst recht sicher stellen, daß ihre Software selbst ohne solche Erweiterungen (wenn auch vielleicht langsamer, aber zumindest einwandfrei) funktioniert, nur für den Fall, daß sich Intel in drei Monaten doch wieder mit den nächsten Rücktritt vom Rücktritt umentscheidet …

Mit anderen Worten: Diese Aktion sorgt unter Garantie für eine noch langsamere Adaption der ISA-Erweiterungen als ohnehin schon in der bereits ziemlich fragmentierten ISA-Landschaft.

Was für Klappspaten … Kann man sich nicht ausdenken!
 
  • Gefällt mir
Reaktionen: Hatsune_Miku und SSD960
Krik schrieb:
Das erfordert gezieltes Kompilieren? Uff.
Oder hat AMD auch doppelt so viele Register, sodass man mit einer Kompilierung die CPUs beider Hersteller abfrühstücken kann?
Sowohl Intel als auch AMD haben viel mehr physische als logische Register. Aktuell sind es 240 bei Zen 5 und irgendwas um die 280 bei Lion Cove. Der Grund für ist zum einen, dass man allein für SMT mindestens doppelt so viele physische wie logische Register braucht, und zum anderen, dass man für spekulative Ausführung (nach einer spekulativen Sprungvorhersage) die Ergebnisse "irgendwo" hinschreiben muss ohne "echte" Ergebnisse zu überschreiben. Dadurch kann man bei einer falschen Sprungvorhersage die spekulativen Ergebnisse ganz einfach wieder verwerfen.

Dennoch wären 32 logische Register ein netter Vorteil, weil der Compiler dann mehr Spielraum hat um Daten zwischenzulagern. Braucht man an einer Stelle mehr als 16 Register, muss der Compiler ein paar Werte auf den Stack, d.h. in den RAM schreiben. Dabei ist es egal wieviele (freie) physische Register die CPU hat, denn der Compiler muss immer ISA-konformen Maschinencode erzeugen und kann sich deswegen nicht darauf verlassen, dass die CPU mehr Register hat als in der ISA stehen und Befehle "versteht" wo eine höhere Registernummer drinsteht als die 16, die es gibt.

Ich weiß nicht inwieweit moderne Kerne vielleicht sogar in der Lage sind solche "Auslagerungen" des Compilers zu erkennen (z.B. weil etwas nach Adresse x geschrieben, kurz danach wieder gelesen und danach nie wieder verwendet wird), aber trotzdem macht so eine ISA-Erweiterung den CPUs das Leben deutlich leichter. Es wäre interessant zu sehen wieviel das in der Praxis bringt, denn ARM nutzt schon länger 32 logische Register und interessanterweise hatte Apples M1 "nur" 3 AGUs (also ähnlich wie z.B. Zen 3), aber fast doppelt so viele ALUs. Wenn 32 logische Register so viel Druck von den AGUs (und entsprechend dem TLB und L1) nehmen, könnte das auch auf x86 echt viel bringen.

Als nächstes bitte noch die Pagesize von 4kB auf z.B. 64kB anheben :D
 
  • Gefällt mir
Reaktionen: tony164, konkretor, TPD-Andy und 4 andere
Für Software sowie nur bis avx 2 gehen ,kann so ein hauruck Aktion ja ziemlich egal sein weil das juckt der Software ja eh nicht und so oder ?
 
Also ich finde bei APX mehr "Conditional execution" als nur CMOV wesentlich spannender als mehr Register.
 
  • Gefällt mir
Reaktionen: tony164
Auch hier fehlt mir etwas Kontext am Anfang des Artikels... was ist avx bei Intel?? Zwei Sätze für dummies zu Beginn würden helfen.
 
Tja, ein hin und her bei Intel. So ist es wenn an hinten dran ist. Aber besser spät als nie.
 
TechFA schrieb:
Dieses Zurück auf Anfang jetzt, wird sicherlich nicht Entwickler dazu bringen, die Erweiterungen nutzen zu wollen – Das Gegenteil ist der Fall!
Du hast echt ne blühende Phantasie.
Zurück auf Anfang meint lediglich die Gerüchteküche. Die Dokumente waren einfach unvollständig, mehr nicht.
Du glaubst doch nicht ernsthaft, dass Intel das Produkt kurzfristig nochmal ändert, nachdem es schon den tape-out hinter sich hat.
 
  • Gefällt mir
Reaktionen: Quidproquo77, mkl1, DynamaxX und eine weitere Person
Ich finde dem AVX-Gedöhns wird seit Jahren eine zu große Bühne gegeben. Überall wird einem erzählt wie wichtig und toll AVX & Co. sei.
In unseren täglichen Anwendungen und Spielen kommt das aber entweder gar nicht zum Einsatz oder wenn, bringt es nur in ganz speziellen nieschigen Situation signifikant etwas.
Gefühlt brachten SSE, MMX & Co. einen deutlicheren Mehrgewinn.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: slow_snail, Hatsune_Miku und TechFA
Ja sehe ich auch so. Ich bin mir nicht sicher ob avx 1 das meiste gebracht hatte oder wenn avx 2 auch noch ein ist. Bei mir sind es bei bestimmten Fällen 5% schneller ob ich nun avx 1 &2 ein oder aus habe meinte ich damit.

Nen hohen Gewinn ist das ja echt nicht .
 
MORPEUS schrieb:
Ich finde dem AVX-Gedöhns wird seit Jahren eine zu große Bühne gegeben. Überall wird einem erzählt wie wichtig und toll AVX & Co. sei. In unseren täglichen Anwendungen und Spielen kommt das aber entweder gar nicht zum Einsatz oder wenn, bringt es nur in ganz speziellen nieschigen Situation signifikant etwas. Gefühlt brachten SSE, MMX & Co. einen deutlicheren Mehrgewinn.
Also beim Frickel-OS kommen die AVX-Versionen der glibc & Co bei entsprechender HW automatisch zum Einsatz.
Und da Intel in der Vergangenheit AVX komplett verkackt hat mussten erst CPUs her die das richtig machen.
latiose88 schrieb:
Ja sehe ich auch so. Ich bin mir nicht sicher ob avx 1 das meiste gebracht hatte oder wenn avx 2 auch noch ein ist. Bei mir sind es bei bestimmten Fällen 5% schneller ob ich nun avx 1 &2 ein oder aus habe meinte ich damit.
Bist du immer noch mit mit deiner antiken 32-Bit Software unterwegs?
 
@foofoobar es gibt da halt nix besseres ,kann ich ja nix dafür das es andere auch nicht besser hin kriegen ,da kann ich nix dafür. Nur Handbrake wäre das einzige wo das beste ist. Als ich das jedoch benutzt hatte gab es nur Probleme. Ich konnte keine guten Videos damit zustande bekommen. Handbrake scheint wohl mit 576i also 50 Halbbilder Probleme zu haben. Sind überwiegend nur 50 Halbbilder. Nur die 720p Aufnahmen profitieren mehr von Avx. Davon habe ich jedoch nicht so viele davon.
Also mehr als 5 % nutzen von Avx habe ich nicht. Habe bei anderen Programmen dieses Problem lösen können. Es reichte ja schon das ich mehrere Wochen und Monate es mit Handbrake nicht geschafft hatte vernünftige Videos draus zu machen. Wackelige ,vertauschte oder Bild und Ton asynxrone reichten mir schon. Auch aktuelle Version davon machte es leider nicht besser. Ich habe es versucht gehabt aber das wird nix. Naja soll nicht sein.
Ich bin somit auf solche Software angewiesen. Zumindest die neue CPU die ich noch kaufen werde ,richtet schlechte Software ein wenig .
 
foofoobar schrieb:
Das wird leider nix nützen weil es am deinterlacer von Handbrake liegt. Die sind einfach Müll bei Handbrake. Die meisten brauchen das nicht aber bei mir ist das verdammt wichtig. Daran kann ich leider nix machen und ein melden hilft nix. Werden auch keine extra für mich anderen interlacer entwickeln. So ist das halt.
 
Zurück
Oben