7/20 Intel „Haswell“-Prozessor für Desktop-PCs im Test : Enttäuschend gut.

, 791 Kommentare

AVX2, FMA, TSX & Co.

Hinter AVX2 steckt die Weiterentwicklung der Advanced Vector Extensions (AVX) aus der Generation Sandy Bridge. Seinerzeit hatte Intel AVX „nur halb umgesetzt“, mit der bei Haswell optimierten Gleitkommaeinheit werden fortan zum Beispiel auch endlich die auf der letzten Seite angesprochenen „Fused Multiply Add“-Befehle (FMA) unterstützt. Der Vorteil einer FMA-Instruktion gegenüber einer herkömmlichen „Multiply Add“-Instruktion ist, dass bei einer FMA erst am Ende der kompletten Berechnung (a*x + y) das Ergebnis gerundet wird, bei einer Multiply-Add-Instruktion hingegen bereits nach der Multiplikation und dann noch einmal nach der Addition. Außerdem werden zwei einzelne Rechenschritte auf einmal erledigt – ohne FMA sind zwei Befehle nötig, die darüber hinaus eine geringere Genauigkeit bieten.

AVX2 mit vielen Optimierungen
AVX2 mit vielen Optimierungen

Darüber hinaus wurden auch Integer-Instruktionen weiter optimiert und ausgebaut. Unter dem Dach von AVX2 sind 16 sogenannte „gather instructions“ hinzugekommen, FMA bringt alleine nochmals 36 Befehle für die 256-Bit-Berechnungen sowie 60 zusätzliche für 128-Bit-Vektoren mit. All dies soll mit angepasster Software teilweise massive Performancezuwächse bringen, wobei auch die teilweise gesteigerte Bandbreite der Caches in den Prozessorkernen helfen soll.

Intel „Haswell“-Architektur
Intel „Haswell“-Architektur
Mehr Bandbreite für die Caches
Mehr Bandbreite für die Caches

Zu den Neuheiten zählen bei Haswell auch noch die Bit Manipulation Instructions (BMI) für zum Beispiel verbesserte Ergebnisse bei der Kryptografie als auch die wichtigsten, weil mächtigsten, neuen Instruktionen rund um das Transactional Memory (TM) sowie die dazugehörigen Transactional Synchronization Extentions (TSX).

In der einfachsten Betrachtungsweise erlauben die TSX Programmierern, sich auf die Arbeit an der Synchronisation von zwei parallel ausgeführten Threads und deren Korrektheit zu konzentrieren, während die Hardware die eigentliche Ausführung optimiert und beschleunigt.

Intel TSX
Intel TSX
Intel TSX
Intel TSX
Intel TSX

Die Krux liegt jedoch wie üblich darin, dass die Software erst dementsprechend angepasst werden muss, um Leistungsgewinne verbuchen zu können. Dies wird wie üblich Jahre dauern, denn AVX hat in den 30 Monaten seit Sandy Bridge immer noch nicht das Ziel erreicht, dass bereits alles, was möglich wäre, darauf optimiert ist. Hier spielt insbesondere immer das Server-Umfeld eine gewaltige Rolle, denn in der Forschung und Wissenschaft werden derartige Instruktionen in der Regel zuerst genutzt. Da Haswell im echten Server-Segment frühestens Ende 2014 erscheint, dürfte die Reifung der neuen Instruktionen noch etwas länger dauern.

AVX2- und FMA-Unterstützung bei SiSoft Sandra 2013
AVX2- und FMA-Unterstützung bei SiSoft Sandra 2013

Auf der nächsten Seite: Ringbus und EDRAM