Das mit der FPU ist wohl wirklich Ansichtssache. Ich hatte die neue FPU von den Folien von AMD mal angesehen und etwas ein bisschen verglichen. Soweit ich erkennen konnte, ist die neue schneller als die alte (im 128-Bit-Modus), da sie bis zu zwei Instruktionen pro Gleitkommazahl ausführen kann (von der Situation abhängig). Die alte K10-Architektur und Intels aktuelle Architektur erlauben nur eine Instruktion pro Gleitkommazahl pro Takt.
Das macht summa summarum:
K10: parallel 1x 128 Bit FADD-Operation auf eine Gleitkommazahl & 1x 128 Bit FMUL-Operation auf eine Gleitkommazahl pro Taktzyklus
Sandy Bridge: 4x Gleitkommaberechnungen in einer 256 Bit FPU mit 128 Bit Pipeline (), mit FADD oder FMUL pro Taktzyklus
Bulldozer: parallel 4x FMAC (FMAC = 1x FMUL + 1x FADD) in einer 128 Bit FPU bzw. das doppelte bei 2x 128 Bit FPU pro Taktzyklus
Hier kann man erkennen, dass schon eine Bulldozer 128 Bit FPU der von Intel überlegen ist. Dadurch, dass der Bulldozer zwei Operationen pro Zahl ausführen kann, ist die FPU in manchen Fällen doppelt so schnell wie Intels FPU. Im schlechtesten Fall ist sie genau so schnell wie das Intel Pendant. Und dann kommt noch dazu, dass die FPU des Nachbarn auch noch zur Arbeit herangezogen werden kann, falls die gerade nix zu tun hat.