@The_Jackal
Was meinst du mit HT?
Das intel-marketingwort Hyperthreading oder Hypertransport?
Ich vermute "Hyperthreading".
Ich nutze lieber das neutrale Wort SMT
SMT : SMT = Simultaneous Multi-Threading
...
http://www.planet3dnow.de/vbulletin/showthread.php3?s=&postid=1492407#post1492407
Zu deinem Wegeproblem folgendes:
Ihr müsst sehen, dass die CPUs bzw. Cores miteinanders kommunizieren müssen und damit verliert man Leistung, z.B. durch Cache Teilung, RAM Teilung oder Hyper Transport. Alles, was per Leitung, Pipelines oder so verbunden werden muss ist langsam, denn jede Leitung bedeutet einen weiteren Weg. Bei 90 nm Strukturen sind 1 cm Leitung auf dem Board, als würde man einmal um die Welt fahren müssen
1. Der Cache ist für jeden Prozessor seperat. Daher sind dort keine Leistungsverluste zu erwarten.
2. RAM. Sicherlich richtig, dass bei ungeschickter Programmierung sich Prozesse in den Weg kommen. Bei einem ordentlichen OS ist die NUMA-Architektur aber der Ausweg/Lösung aus dem Problem, nicht der Anfang vom Problem.
3. Hypertransport ist vollkommen egal in diesem Zusammenhang.
a. ist dies nach der SRQ.
b. Und falls da ein Bandbreitenproblem sein sollte, bietet
HypertransportT-2.0 deutlich erhöhte Bandbreite.
Bei einer physikalischen Taktfrquenz von 1,4 GHz (virtuelle 2,8 GHz, da DDR Verfahren) kommt am Ende 11,2 GB/s heraus. mit dem Potential, dass da noch mehr möglich ist (Stichwort Emphasis/Deempahsis)
Bild der SRQ und der CPUs
4. Die Integration bietet doch verkürzte Laufwege an, da sticht dein Argument mit dem 1 cm nicht. Die Verbindungen von einem Dual-Opteron per Hypertransport auf einem Board ist da deutlich schlechter.
a. Zangsläufig höhere Latenzen der exernen Lösung durch Hypertransport auf dem Board.
b. Die Anbindungsbreite ist deutlich besser bei der integrierten Lösung. Hypertansport hat 16 Bit hin und 16 Bit zurück.
Die integrierte Lösung hat jeweils hin 64 Bit und zurück 64 Bit (mindestens)
5. Wärme nun ja ... AMD hat es jedenfalls geschaft beim K8 mit 0,13µm deutlich kälter zu sein.
In der Zwischenzeit werden Exemplare mit einem
Maximumverbrauch von 25 W und 35 W verkauft.
Selbst die Exemplare mit dem Nennmaximum von 89 W werden aber kaum Handwarm!
Wärme ist daher nicht wirklich ein Problem für den K8,eher das Timing zu maximalen Taktfrequenzen.
6. Mumpitz ist in der Tat die Rechnung:
2 externe CPUs mit Taktfrequenz A = Dual-Core mit der Leistung L
L = 2xA bei identischer Taktfreuenz von A.
Is ähnlicher Mumpitz wie Berechnungen unter 64 Bit sind doppelt so schnell wie Berechnungen unter 32 Bit.
Nur unter ganz seltenen Bedingungen (Verschlüsselung) kommt die Milchmädchenrechnung hin.
7. SMT Hin und wieder hat es Vorteile, aber je nach Design kegeln sich die Programme aus dem Cache heraus, auch deswegen wurde beim Power 5 dieses Feature abschaltbar gemacht, je nach Anwendung. Intel spricht hier von einer Steigerung von
durchschnittlich 10 - 15 %
Dual Core Lösungen (SMP) versprechen
durchschnittlich 30 - 40 % Zugewinn.
Diese Zahlen geistern durch diverse Dokus von IBM, Intel, SUN und anderen ... wie gesagt
DURCHSCHNITTLICH da kann`s auch mal schlechter und auch besser aussehen.
Wichtig ist jedoch auch hier, dass die Software mitmacht, sonst ist der Zugewinn bei beiden Lösungen SMT, SMP bei 0 oder sogar negativ ... sprich sogar schlechter!
Wir gleiten so langsam in eine Dekade hinein, in der Software und Hardware eine Synthese eingehen müssen, damit ein Zugewinn erreicht wird. Ausschliessliche Hardwareoptimierung war mal.