IDF: Neue Befehle für Westmere und Nehalem

Thomas Hübner
24 Kommentare

Befehlssätze sind etwas tolles – sofern genutzt, können sie deutliche Performance-Steigerungen bewirken, indem sie das, was bisher mit vielen einzelnen Befehlen realisiert werden musste, kompakt mit Hilfe eines einzigen ermöglichen. Ein tolles Beispiel ist SSE4 mit dessen Hilfe neue Rekorde beim DivX-Encoding möglich sind.

Die traumhafte Performance-Steigerung mit SSE4 in DivX hat man in erster Linie zwei der neuen Befehle zu verdanken, nämlich MPSADBW und PHMINPOSUW. Nur zwei Befehle sind maßgeblich an einer Performancesteigerung von über 60 Prozent bei gleichem Prozessortakt beteiligt.

Ja, Erweiterungen sind klasse! Die aktuell unter SSE4 bekannten 54 neuen Befehle werden in zwei Etappen auf den Markt gebracht. Die für November 2007 erwarteten Penryn-Prozessoren unterstützten SSE4.1 mit 47 neuen Befehlen. Die für H2 2008 erwarteten Nehalem-Prozessoren werfen SSE4.2 mit 7 neuen Befehlen in die Waagschale. Hierzu gehören z.B. POPCNT und CRC32.

Intel erwartet von SSE4.2 im Bereich der XML-Verarbeitung eine Performancesteigerung um den Faktor drei, wobei die Anzahl der bisher nötigen Instruktionen um 75 Prozent reduziert werden sollen. Mit dem für 2009 geplanten Shrink auf 32 nm des Nehalem, Codename Westmere, ist ebenfalls ein neuer Befehlssatz geplant. Unter AES-NI (AES New Instruction) verbirgt sich eine nicht näher genannte Zahl neuer Opcodes, die vor allem die AES Ver- und Entschlüsselung deutlich beschleunigen sollen. Mit AES-NI soll der Programmcode vereinfacht und die Verbreitung von AES als Verschlüsselungsalgorithmus stark erhöht werden.

Weniger schön sind Befehlserweiterungen dann, wenn sie proprietär bleiben und nicht industrieweit eingesetzt werden. So bleiben SSE4.1 und SSE4.2 allein Intel vorbehalten (zumindest vorerst), wohingegen AMD im Barcelona/Agena (K10) mit SSE4a komplett andere Befehle definiert. Intel auf der anderen Seite sieht gemäß einiger im Rahmen des IDF gemachten Aussagen keinerlei Veranlassung, die von AMD für 2009 mit Bulldozer angekündigten SSE5-Instruktionen zu unterstützen – irgendwie schon doof, wenn jeder meint sein eigenes Süppchen kochen zu müssen.