Mit dem HT bzw SMT müsste es doch aber etwas bessser sein, oder?
kann ich nicht genau sagen. hatte bisher weder so eine cpu noch weiß ich wie es umgesetzt wurde.
Rein theoretisch könnte es jedoch um welten besser sein.
das ist derzeit völlig egal.
Die Algorithmen dafür werden nicht eingesetzt weil sie auf keiner aktuellen cpu funktionieren, deswegen spielt es auch keine Rolle was man kauft.
Geeignet wäre keiner von genannten da die Zeit zur Kommunikation bei allen viel zu groß ist.
Was zum Beispiel wirklich funktioniert haben wir heute schon : Superskalarität mit Out of Order.
Beispiel : ein Core 2 Duo schafft es aus jedwedem Programm, das nicht auf multicore ausgerichtet sein muss, bis zu 4 Befehle gleichzeitig zu berechnen.
Das klappt, weil die Ergebnisse dieser Operationen zeitig zur Verfügung stehen werden.
Bei verschiedenen Kernen klappt diese Parallelität auf Instruktionsebene nicht, weil die Zeit für die Kommunikation schon größer ist als die Berechnungsdauer an sich.
Man kann also höchstens bereits aggregierte Werte übertragen, z.b. indem man mehrere völlig unabhängige Schritte berechnet.
Das sind eben die 3 Stufen :
1 - rein sequentiell : wird auch in Zukunft nicht parallelisiert werden können, egal was kommt
2 - parallel auf Instruktionsebene : superskalarität und ähnliche Ansätze (rekonfigurierbare Strukturen etwa)
3 - unabhängig parallel
Derzeit erreichen wir eben nur das dritte und das ermöglicht einfach nur einen geringen Teil aller Probleme zu lösen.
Insbesondere betrifft das Probleme die wachsen. Beispielsweise ein doppelt so schweres Problem in der gleichen Zeit mit 2 Prozessoren zu berechnen.
Ein gleichschweres Problem jedoch in der halben zeit zu berechnet gelingt damit sehr oft nicht.
Stufe 2 erreichen wir zu einem gewissen Teil. Was die Zukunft bringt wird sich zeigen. Bulldozer von AMD verspricht hier viel und auch Torrenza könnte hier extreme Fortschritte bringen wenn es sich mal durchsetzt.
Stufe 1 ist wie gesagt unerreichbar.