Ob HT gut oder nicht so gut ist, hängt von der Nutzung ab und eben auch von der Effizienz der CPU Architektur, denn bei HT soll der zweite Thread ja dann die Rechenwerke nutzen wenn der erste gerade auf I/O warten muss. Je besser die Vorhersagen arbeiten um dies zu verhindern (also Sprungvorhersagen, vorsorgliches Laden von Daten die demnächst gebraucht werden in den Cache, etc.) umso weniger bringt HT. Bei den alten Pentium und Atoms die noch keine Out-of-Order Architektur hatten, hat HT oft sogar über 60% Mehrleistung ermöglicht, dies schafft man heute praktisch nicht mehr, aber es hängt eben auch von der Anwendung ab.
Bei Anwendungen bei denen die Kerne alle unabhängig voneinander an einem Teil der Daten arbeiten wie bei Cinebench, ist HT von Vorteil, aber bei Spielen wo ja ein Thread die Leistung bestimmt weil der die ganze Arbeit der anderen synchronisiert, ist es eben anderes, da muss der sich dann mit HT die Reourcen mit einem weiteren Thread teilen, also die Caches des Kerns und der zweite Thread wird natürlich auch nicht sofort gestoppt wenn die Daten für den ersten angekommen sind, sondern erst wenn er dann auf etwas (meist Daten aus dem RAM oder I/O) warten muss oder schon eine Weile gelaufen ist und daher der andere mal wieder dran ist. Damit läuft dann dieser zentrale Thread gewissermaßen nur auf einem halben Kern und eben nicht so schnell als wenn er den Kern für sich alleine hätte.