Athlon XP und P4

Carsten · 11. Oktober 2001

Original erstellt von baal666
DISSKUTIERT MIT TATSACHEN NICHT MI...h hab auch ne GF und ne SBLive...keine Probs!

Tiu · 11. Oktober 2001

Also Baal ich weiß nicht ob du nur das ließt was du lesen willst oder ob du auch andere Tatsachen zuläßt. Selbst der neue Celeron mit Tualatin Kern ist einem P4 1.5GHz fast ebenbürtig. Der P4 hat in seiner JETZIGEN technischen Form nur ein BUH verdient. Er ist in Wirklichkeit nur B-Ware von Intel. Erst der neue Kern wird zumindest einiges haben was der P4 von Beginn an haben sollte doch leider nicht implementiert wurde aus Zeitgründen. Man konnte AMD ja nicht auch noch die Taktungskrone überlassen, nachdem man diesem schon die Rechenleistungskrone übergeben musste. JEDER der einen P4 in seiner jetzigen Form hat, hat sich verkauft und wer sich ein SD-RAM Board für den P4 kaufen wird ist verkauft und verraten. Selbst für Office Anwendungen wäre dies mit Sicherheit die LETZTE CPU - Board Konfiguration die zu Empfehlen wäre. Zumindest zeigt AMD das es noch Innovationen in seine CPU´s steckt wärend Intel hier bei dem P4 NICHTS geboten hat bzw. in einigen technischen Details sogar Rückschritte eingestehen musste.

Was die Spiele angeht solltest Du evtl. bedenken, das wohl kaum alle Spiele auf der Quake3 Engine basieren und das AMD auch hier bei einigen Quake-Benches dem P4 2Ghz auf und davon zieht.

makaara2k1 · 11. Oktober 2001

Original erstellt von baal666

A) office lief schon unter 600mhz schnell genug...

B) dafür läuft mein p4 stabil und ohne sonstige probleme - hab auch keine probleme mit der geforce3 bzw. der sblive ... aber die hat auch kein amd-fan , gelle ?!

C) nebenbei mein p4 mit rd-ram hat ca. 300 dm mehr gekostet als ein athlon-system ( halt wegen dem speicher )

Ok...

A) Stimmt, habe nun nen 1400er, der reicht FÜR ALLES...daher brauch ich weder nen Athlon XP NOCH nen P4.

B) Hatte 3 AMD Systeme und nie Probleme mit SB Live. Auch Geforce 1, Geforce 2 MX und Geforce 2 Pro laufen perfekt.

C) Kauf dir nen MSI Board, Infineon DDR Ram, nen Athlon, ne Geforce 1-3 und ne SB Live, dann hast Du auch keine Probleme.

Musst ja nun nicht grad deinen arschteuren Intel-Kram mit den billigsten AMD Boards und dem billigsten DDR-Ram vergleichen.

MSI+AMD = super Gespann....hab nur AMD spezifizierte Teile (CPU-Lüfter, Netzteil, DDR-RAM, Mainboard) -> Läuft perfekt.

Und die gleiche Leistung hätte beim P4 eindeutig mehr gekostet.

Gruß an die Ideologen beider Seiten!!!

euer zufriedener AMD Kunde

makaara

TeddyBiker · 11. Oktober 2001

Moonstone is back

Original erstellt von baal666
http://www.heise.de/ct/01/21/218/

der p4 ist für meine bearbeitungszwecke :
video/audio bearbeitung 1a und dem athlon klar überlegen - in games kann der athlon dem p4 auch nicht davon ziehen ( siehe auch quake3 ! )
der athlon ist in jetzigen office-anwendungen deutlich flinker ! und , wer brauchts ?? office lief schon unter 600mhz schnell genug... dafür läuft mein p4 stabil und ohne sonstige probleme - hab auch keine probleme mit der geforce3 bzw. der sblive ... aber die hat auch kein amd-fan , gelle ?! möchte nur wissen woher diese hartnäckigen gerüchte kommen aber wahrscheinlich sind die alle zu blöd ihren rechner zu konfigurieren.. nebenbei mein p4 mit rd-ram hat ca. 300 dm mehr gekostet als ein athlon-system ( halt wegen dem speicher ) .. das gehäuse konnte ich selbst anpassen - also was solls

DISSKUTIERT MIT TATSACHEN NICHT MIT MODERNEN MYTHEN !!

so long und viel spaß ( nehmt nicht alles so bitterernst , das erinnert einen ja schon an selige amiga/atariST-zeiten )

Endlich mal jemand, der sich in Moonstone's Fussstapfen traut.

BTW: ...nicht ganz so frech wie Moonstone...das wäre eleganter.

Tiu · 11. Oktober 2001

Jau!
Gute Argumente helfen eben bei Vorurteilen genau soviel wie Schokoladenplätzchen bei Verstopfung.

baal666 · 11. Oktober 2001

nun ich verwende halt nicht nur irgend welche shareware oder so , sondern arbeite ernsthaft damit - und programme wie der cinemacraft-encoder oder ähnliche laufen halt schneller ( isse-optimiert ) ... nebenbei konnte ich das selbst ausprobieren auf einem athlon

gekauft hätte ich mir ein amd-system trotzdem nicht , da es bei mir nicht für stabilität steht..

Kwuteg · 11. Oktober 2001

Juhu, Klopperei

@baal666
Sag mal, von wegen Shareware... hast du etwa Vorurteile???
Deine Hardwareauswahl in Ehren, aber es gibt auch Profis, die Athlon reiten. Erst neulich hat jemand gepostet, daß für seine professionelle Rendering-Software (Lightwave glaube ich) nur der Athlon in Frage kommt, da er eine überragende FPU-Leistung hat.
Aber das nur am Rande.

Ich bezog mich mit dem 1333Mhz-Prozessor auf den einzigen mir bekannten Athlon XP, dessen P-Rating ich mal außen vor gelassen habe (brachen wir das hier?). Ich ging davon aus, daß in den besagten Benchmarks auch dieser 1333er zum Einsatz gekommen sei. Oder hab ich was verpaßt?
Jedenfalls bleibe ich dabei: Wenn der P4-Core so großes Potential für Spitzentakte hat, dann muß er zwangsläufig auch irgendwo schwächeln - im "Niedrigtaktbereich" unterhalb 2Ghz vielleicht?

Es würde einiges erklären.

baal666 · 11. Oktober 2001

ich hab nix gegen amd-systeme - nur ich nenne die gründe für meine wahl und fertig ... außerdem find ich es eher umgekehrt nervig jeden zu hören intel suxx - amd macht alles besser ... so ist eben nicht die realität und sagen wir es mal vorsichtiger : amd-systeme bieten halt mehr möglichkeiten sehr viel falsch zu machen - zu frieden ??

Tiu · 11. Oktober 2001

Fehler Nr. 1 – Kleiner L1 Daten Cache
Der Pentium 4 hat einen äußerst unterdimensionierten 8KB großen L1 Daten Cache. Das entspricht der Größe des L1 Caches zu Zeiten des 486, über 10 Jahre her. Es gibt halt Idioten die niemals etwas lernen. Der L1 Cache ist der wichtigste Speicher im gesamte Computer. Es ist der erste Speicher an den sich der Prozessor wendet, und mit dessen Zugriff der Prozessor die meiste Zeit verbringt. Zu Zeiten des 486 merkte Intel schnell, das 8 KB einfach zu wenig sind. Schnell verdoppelte man die Größe auf 16 KB, und später 32 KB, 16 KB für Code und 16 KB für Daten in der 6. Generation. AMD ging mit dem Athlon sogar ncoh einen Schritt weiter, und vervierfachte den L1 – Cache auf 128 KB (64 KB Daten und 64 KB Code)

Eine Rückkehr zu 8 KB ist einfach idiotisch. Klar, man spart sich ne Menge Transistoren auf dem Chip. Aber man verringert auch gleichzeitig die Performance für jedes verdammte Windows – Programm da draußen. 8 KB ist nicht besonders viel an Daten. Bei einer Auflösung von 1024x768 bei 32 Bit Farbtiefe, belegen 2 Zeilen bereits 8 KB. Eine Veränderung von mehr als 2 Zeilen gleichzeitig überfüllt den L1 – Cache des Pentium 4 bereits.

Fehler Nr. 2 – Kein L3 – Cache
Intel hatte ursprünglich einen 1 MB großen L3 – Cache für den Pentium 4 vorgesehen. Dieser Cache, ähnlich dem des Back-Side Cache des G4 oder dem großen L2-Cache beim orignial Pentium III XEON und Athlon, liefert noch einen weiteren sehr schnellen Speicher, und vermeidet Zugriffe auf den lansamen Hauptspeicher. Der L3 – Cache wurde beim veröffentlichten Pentium 4 komplett gestrichen. Wie ich bereits sagen, eine Idioten dort bei Intel lernen es wohl nie. Intel hätte es besser wissen müssen, durch ihre Erfahrungen mit dem ursprünglich veröffentlichten Celeron, der ja um seinen L2-Cache gebracht wurde. Bereits da hätte man bei Intel lernen müssen, das mal den Cache tunlichst NICHT weglassen sollte. Es scheint so, das man bei Intel sehr früh merkte das die 8 KB L1-Cache zuwenig sind, und plante dann eben als Ausgleich einen L3-Cache ein. Aber unter dem Druck der aufkam, und unter dem sich Intel gezwungen sah den Prozessor um wichtige Eigenschaften zu kürzen, wurde eben kurzerhand der L3-Cache eliminier

Fehler Nr. 3 – Der Decoder wurde verkrüppelt
Ein weiterer Schritt 10 Jahre zurück: Intel hat eine ziemlich idiotische Art gewählt, um sich dem Problem der U-V Paare und des 4-1-1 Limits vergangener Generationen anzunähern: Man entfernte ganz einfach die zusätzlichen Decoder, und kehrte zurück zu einem einzelnen. Und plötzlich kann nur noch eine Maschinencode – Instruktion pro Taktzyklus durchgeführt werden. Die Idee und der Gedanke der hinter dieser Idiotischen Logik steckt ist folgender: Der Trace – Cache macht die Decodierung der einzelnen Instruktionen jeden Taktzyklus überflüssig, da ja das Ergebnis des Decodierens abgelegt wird. Nur hat man da eine Kleinigkeit übersehen: Dies funktioniert ausschließlich, wenn der Code der grade ausgeführt wird bereits decodiert wurde, und auch noch im Trace – Cache liegt.
Jetzt kommt das große Aber... Wenn jetzt ein Teil vom Code aufgerufen wird, der NICHT im Trace – Cache decodiert liegt, muß der Prozessor bis auf den L2-Cache oder gar bis auf den Hauptspeicher zurückgreifen, um sich 64 Byte an Code zu holen. Dann muß der Prozessor diese 64 Byte übersetzen (=decodieren). Eine typische x86 – kompatible Instruktion hat eine Länge von 3 Byte, demnach entsprechen 64 Byte an Code 21 Maschinencode – Instruktionen. Angenommen, alle 64 Byte des Codes müssen ausgeführt werden.. wie lange dauert es jetzt bis der Pentium 4 diese 64 Byte übersetzt hat? Exact 21 Taktzyklen. Und wie lange dauert die Ausführung dieser 64 Byte an Code? Mehr als 21 Taktzyklen. Und jetzt erinnert euch mal an den Pentium III und den Athlon, und vergleicht es. Denn diese beiden benötigen für diesen Vorgang grade mal 7 – 11 Taktzyklen.

Fehler Nr. 4 – Der Durchsatz des Trace Cache ist zu gering
Wir haben mittlerweile schon rausgefunden, das der Decoder nur einen einzigen Wert einer Micro – Op im Trace Cache zwischenspeichern kann. Wenn man Intels Spezifikationen etwas weiterliest, kann man entdecken, das der Trace – Cache grade mal 3 Micro – Ops innerhalb eines Taktes an die Recheneinheiten weitergeben kann.
Der Trace – Cache gibt diese Micro – Ops weiter an den Prozessor-Kern, welcher sie dann in einer oder mehreren zuständigen Recheneinheiten ausführt. Intels's Pentium 4 Übersicht erwähnt, das der Pentium 4 Sieben solcher Recheneinheiten besitzt:
• Die zwei ALUs, die mit doppelter Geschwindigkeit laufen für einfach Addition und Subraktion.
• Eine ALU die mit normaler Geschwindigkeit läuft, und für Shift/Rotations zuständig ist. Einfach gesagt, eine ALU für komplexere Berechnungen.
• Eine Einheit um aus dem Speicher auszulesen
• Eine Einheit um in den Speicher zu schreiben
• Eine Floating Piont Move Unit, welche die Fähigkeit hat, im Speicher zu lesen und zu schreiben.
• Eine FPU die für Fließkommaberechnungen und MMX – Operationen zuständig ist.
Zusammen können diese Recheneinheitenen also 9 Micro – Ops pro Takt durchführen: 4 einfache Integer-Rechnungen, eine komlexe Integer-Rechnung, einen Lese- und einen Schreibvorgang im Speicher, eine Fließkommaberechnung und eine MMX – Operation.
Klingt ja eigentlich sehr nett und schnell. Dummerweise kann der Trace – Cache grade mal 3 Micro – Ops pro Takt zu den Recheneinheiten schicken. Während wir beim Pentium III die Sitation haben, das der Decoder die Recheneinheiten mit insgesamt 3 Instruktionen und 6 Micro – Ops (4-1-1) pro Takt füttern kann, wurde der Pentium 4 soweit verkrüppelt, das er grade mal eine Instruktion und Drei Micro-Ops mit einem Takt an die Recheneinheiten übermittlen kann.
Bei gut optimiertem Code, der dem 4-1-1 Prinzip folgt und somit sowohl auf dem Pentium III als auch auf dem Athlon optimal läuft, ist der Pentium 4 geradezu dazu verdammt bei gleicher Taktfrequenz langsamer zu laufen. Ich habe dies mit einigen Code – Sequenzen überprüft. Kein Wunder mehr, das der Athlon 900 den Pentium 4 in den Benchmarks schlägt.

Fehler Nr. 5 – Fehlerhafte Verteilung auf die Recheneinheiten
Dies ist eine direkte Folge des Fehlers Nr. 4, und zwar das die Aufteilung auf die Spezialgebiete der einzelnen Recheneinheiten absolut falsch erfolgt ist.
Überlegt doch mal mal... 5 von den 7 Recheneinheiten sind dazu da, mit den klassischen 8 Integer – Registern EAX EBX ECX EDX ESI EDI EBP ESP zusammenzuarbeiten. Mittlerweile ist auch klar, das der Pentium 4 enorme Probleme damit hat, nicht auf ihn optimierten Code auszuführen.
Intel's eigene Dokumente heben besonders die häufige Verwendung der neuen MMX – Registers hervor. Zwei 64- und zwei 128 Bit Register, die bereits in der 6. Generation eingeführt wurden. Trotzdem ist nur eine einzige Recheneinheit für MMX zuständig. Und wenn man noch bißchen weiterliest merkt man, das diese auch noch dazu nur eine Micro – Op jeden zweiten Takt annehmen kann. Das bedeutet also, in anderen Worten gesagt, der 1,5 Ghz Pentium 4 kann höchstens 750 Millionen Fließkommaberechnungen oder MMX – Operationen durchführen. Aber MMX ist doch grade eines der Dinge, auf die Intel so schwört!!!
Warum wird eine Funktion verkrüppelt, in die Intel so große Hoffnungen setzt?
In einem Anfall von Grenzdebilität hat Intel 3 Integereinheiten in den Kern gesteckt, wobei zwei von ihnen mit doppelter Geschwindigkeit laufen. Somit können die ALUs demnach 5 Micro – Ops pro Takt bearbeiten. Aber wir wissen bereits auch, das der Trace – Cache grade mal 3 Micro – Ops pro Takt an alle Recheneinheiten weitergeben kann. Somit muß also immer mindestens eine der Integereinheiten pro Takt pausieren. Es geht ja nicht mal, das die beiden mit doppelter Geschwindigkeit laufenden ALUs mit Micro – Ops gefüttert werden, das wären dann 4 Micro – Ops. Warum verschwendet Intel dann wertvolle Transistoren für eine Integereinheit die brach liegt, kürzt aber im gleichen Zuge eine dringendst benötigte FPU weg??????? Diese Aktion ist nicht mehr nur mit absoluter Grenzdebilität und Idiotie zu erklären...

SOVIEL ZUM THEMA TATSACHEN UND PENTIUM 4 (BUH)

Leider habe ich nicht mehr hier hinein bekommen.

TeddyBiker · 11. Oktober 2001

moin moin GRAKA0815,

Deine Fachkenntnis in dem obigen Kommentar haben mich sehr beeindruckt. Was mich jedoch wundert ist die Tatsache, dass Du nach eigenen Angaben ein P4-System besitzt und es auch stolz in Deiner Sig zeigst. Ich könnte mir vorstellen, dass es lediglich was mit Deinem Job als **** von ****** zu tun hat, oder liege ich da falsch??

Tiu · 11. Oktober 2001

Also zunächst möchte ich mich nicht mit dem Text schmücken! Er ist nicht von mir!!!

Ich habe auch nur den Intel, da ich einige Brocken bei einer Messe gewonnen habe. Gekauft hätte ich mir den nie. Zumindest nie eine erste Version von Intel. Bei Intel sollte man IMMER auf die zweite Generation einer CPU Version warten. Siehe Pentium2 (66/100 Mhz) siehe P3 (Katmai/Coppermine/Tualatin) siehe P4. Hier sieht man sehr gut wie SCHEISSE die erste Version immer ist. Zumindest seit AMD mit dem K6 Intel auf den Fersen ist.

Sahneknuffi · 11. Oktober 2001

Falls jemanden die technischen Details zum Athlon XP interessieren, die gibts hier.

Quaker · 11. Oktober 2001

Original erstellt von GRAKA0815
Fehler Nr. 1 – Kleiner L1 Daten Cache
Der Pentium 4 hat einen äußerst unterdimensionierten 8KB großen L1 Daten Cache. Das entspricht der Größe des L1 Caches zu Zeiten des 486, über 10 Jahre her. Es gibt halt Idioten die niemals etwas lernen. Der L1 Cache ist der wichtigste Speicher im gesamte Computer. Es ist der erste Speicher an den sich der Prozessor wendet, und mit dessen Zugriff der Prozessor die meiste Zeit verbringt. Zu Zeiten des 486 merkte Intel schnell, das 8 KB einfach zu wenig sind. Schnell verdoppelte man die Größe auf 16 KB, und später 32 KB, 16 KB für Code und 16 KB für Daten in der 6. Generation. AMD ging mit dem Athlon sogar ncoh einen Schritt weiter, und vervierfachte den L1 – Cache auf 128 KB (64 KB Daten und 64 KB Code)

Eine Rückkehr zu 8 KB ist einfach idiotisch. Klar, man spart sich ne Menge Transistoren auf dem Chip. Aber man verringert auch gleichzeitig die Performance für jedes verdammte Windows – Programm da draußen. 8 KB ist nicht besonders viel an Daten. Bei einer Auflösung von 1024x768 bei 32 Bit Farbtiefe, belegen 2 Zeilen bereits 8 KB. Eine Veränderung von mehr als 2 Zeilen gleichzeitig überfüllt den L1 – Cache des Pentium 4 bereits.

Fehler Nr. 2 – Kein L3 – Cache
Intel hatte ursprünglich einen 1 MB großen L3 – Cache für den Pentium 4 vorgesehen. Dieser Cache, ähnlich dem des Back-Side Cache des G4 oder dem großen L2-Cache beim orignial Pentium III XEON und Athlon, liefert noch einen weiteren sehr schnellen Speicher, und vermeidet Zugriffe auf den lansamen Hauptspeicher. Der L3 – Cache wurde beim veröffentlichten Pentium 4 komplett gestrichen. Wie ich bereits sagen, eine Idioten dort bei Intel lernen es wohl nie. Intel hätte es besser wissen müssen, durch ihre Erfahrungen mit dem ursprünglich veröffentlichten Celeron, der ja um seinen L2-Cache gebracht wurde. Bereits da hätte man bei Intel lernen müssen, das mal den Cache tunlichst NICHT weglassen sollte. Es scheint so, das man bei Intel sehr früh merkte das die 8 KB L1-Cache zuwenig sind, und plante dann eben als Ausgleich einen L3-Cache ein. Aber unter dem Druck der aufkam, und unter dem sich Intel gezwungen sah den Prozessor um wichtige Eigenschaften zu kürzen, wurde eben kurzerhand der L3-Cache eliminier

Fehler Nr. 3 – Der Decoder wurde verkrüppelt
Ein weiterer Schritt 10 Jahre zurück: Intel hat eine ziemlich idiotische Art gewählt, um sich dem Problem der U-V Paare und des 4-1-1 Limits vergangener Generationen anzunähern: Man entfernte ganz einfach die zusätzlichen Decoder, und kehrte zurück zu einem einzelnen. Und plötzlich kann nur noch eine Maschinencode – Instruktion pro Taktzyklus durchgeführt werden. Die Idee und der Gedanke der hinter dieser Idiotischen Logik steckt ist folgender: Der Trace – Cache macht die Decodierung der einzelnen Instruktionen jeden Taktzyklus überflüssig, da ja das Ergebnis des Decodierens abgelegt wird. Nur hat man da eine Kleinigkeit übersehen: Dies funktioniert ausschließlich, wenn der Code der grade ausgeführt wird bereits decodiert wurde, und auch noch im Trace – Cache liegt.
Jetzt kommt das große Aber... Wenn jetzt ein Teil vom Code aufgerufen wird, der NICHT im Trace – Cache decodiert liegt, muß der Prozessor bis auf den L2-Cache oder gar bis auf den Hauptspeicher zurückgreifen, um sich 64 Byte an Code zu holen. Dann muß der Prozessor diese 64 Byte übersetzen (=decodieren). Eine typische x86 – kompatible Instruktion hat eine Länge von 3 Byte, demnach entsprechen 64 Byte an Code 21 Maschinencode – Instruktionen. Angenommen, alle 64 Byte des Codes müssen ausgeführt werden.. wie lange dauert es jetzt bis der Pentium 4 diese 64 Byte übersetzt hat? Exact 21 Taktzyklen. Und wie lange dauert die Ausführung dieser 64 Byte an Code? Mehr als 21 Taktzyklen. Und jetzt erinnert euch mal an den Pentium III und den Athlon, und vergleicht es. Denn diese beiden benötigen für diesen Vorgang grade mal 7 – 11 Taktzyklen.

Fehler Nr. 4 – Der Durchsatz des Trace Cache ist zu gering
Wir haben mittlerweile schon rausgefunden, das der Decoder nur einen einzigen Wert einer Micro – Op im Trace Cache zwischenspeichern kann. Wenn man Intels Spezifikationen etwas weiterliest, kann man entdecken, das der Trace – Cache grade mal 3 Micro – Ops innerhalb eines Taktes an die Recheneinheiten weitergeben kann.
Der Trace – Cache gibt diese Micro – Ops weiter an den Prozessor-Kern, welcher sie dann in einer oder mehreren zuständigen Recheneinheiten ausführt. Intels's Pentium 4 Übersicht erwähnt, das der Pentium 4 Sieben solcher Recheneinheiten besitzt:
• Die zwei ALUs, die mit doppelter Geschwindigkeit laufen für einfach Addition und Subraktion.
• Eine ALU die mit normaler Geschwindigkeit läuft, und für Shift/Rotations zuständig ist. Einfach gesagt, eine ALU für komplexere Berechnungen.
• Eine Einheit um aus dem Speicher auszulesen
• Eine Einheit um in den Speicher zu schreiben
• Eine Floating Piont Move Unit, welche die Fähigkeit hat, im Speicher zu lesen und zu schreiben.
• Eine FPU die für Fließkommaberechnungen und MMX – Operationen zuständig ist.
Zusammen können diese Recheneinheitenen also 9 Micro – Ops pro Takt durchführen: 4 einfache Integer-Rechnungen, eine komlexe Integer-Rechnung, einen Lese- und einen Schreibvorgang im Speicher, eine Fließkommaberechnung und eine MMX – Operation.
Klingt ja eigentlich sehr nett und schnell. Dummerweise kann der Trace – Cache grade mal 3 Micro – Ops pro Takt zu den Recheneinheiten schicken. Während wir beim Pentium III die Sitation haben, das der Decoder die Recheneinheiten mit insgesamt 3 Instruktionen und 6 Micro – Ops (4-1-1) pro Takt füttern kann, wurde der Pentium 4 soweit verkrüppelt, das er grade mal eine Instruktion und Drei Micro-Ops mit einem Takt an die Recheneinheiten übermittlen kann.
Bei gut optimiertem Code, der dem 4-1-1 Prinzip folgt und somit sowohl auf dem Pentium III als auch auf dem Athlon optimal läuft, ist der Pentium 4 geradezu dazu verdammt bei gleicher Taktfrequenz langsamer zu laufen. Ich habe dies mit einigen Code – Sequenzen überprüft. Kein Wunder mehr, das der Athlon 900 den Pentium 4 in den Benchmarks schlägt.

Fehler Nr. 5 – Fehlerhafte Verteilung auf die Recheneinheiten
Dies ist eine direkte Folge des Fehlers Nr. 4, und zwar das die Aufteilung auf die Spezialgebiete der einzelnen Recheneinheiten absolut falsch erfolgt ist.
Überlegt doch mal mal... 5 von den 7 Recheneinheiten sind dazu da, mit den klassischen 8 Integer – Registern EAX EBX ECX EDX ESI EDI EBP ESP zusammenzuarbeiten. Mittlerweile ist auch klar, das der Pentium 4 enorme Probleme damit hat, nicht auf ihn optimierten Code auszuführen.
Intel's eigene Dokumente heben besonders die häufige Verwendung der neuen MMX – Registers hervor. Zwei 64- und zwei 128 Bit Register, die bereits in der 6. Generation eingeführt wurden. Trotzdem ist nur eine einzige Recheneinheit für MMX zuständig. Und wenn man noch bißchen weiterliest merkt man, das diese auch noch dazu nur eine Micro – Op jeden zweiten Takt annehmen kann. Das bedeutet also, in anderen Worten gesagt, der 1,5 Ghz Pentium 4 kann höchstens 750 Millionen Fließkommaberechnungen oder MMX – Operationen durchführen. Aber MMX ist doch grade eines der Dinge, auf die Intel so schwört!!!
Warum wird eine Funktion verkrüppelt, in die Intel so große Hoffnungen setzt?
In einem Anfall von Grenzdebilität hat Intel 3 Integereinheiten in den Kern gesteckt, wobei zwei von ihnen mit doppelter Geschwindigkeit laufen. Somit können die ALUs demnach 5 Micro – Ops pro Takt bearbeiten. Aber wir wissen bereits auch, das der Trace – Cache grade mal 3 Micro – Ops pro Takt an alle Recheneinheiten weitergeben kann. Somit muß also immer mindestens eine der Integereinheiten pro Takt pausieren. Es geht ja nicht mal, das die beiden mit doppelter Geschwindigkeit laufenden ALUs mit Micro – Ops gefüttert werden, das wären dann 4 Micro – Ops. Warum verschwendet Intel dann wertvolle Transistoren für eine Integereinheit die brach liegt, kürzt aber im gleichen Zuge eine dringendst benötigte FPU weg??????? Diese Aktion ist nicht mehr nur mit absoluter Grenzdebilität und Idiotie zu erklären...

SOVIEL ZUM THEMA TATSACHEN UND PENTIUM 4 (BUH)

Leider habe ich nicht mehr hier hinein bekommen.

Eins würde mich nun aber doch mal interessieren: Wenn der Pentium 4 solch ein verkrüppelter und mit Fehler geradezu überladener Prozessor ist, warum ist er dann so verflucht schnell?

PuppetMaster · 12. Oktober 2001

Original erstellt von Quaker
Eins würde mich nun aber doch mal interessieren: Wenn der Pentium 4 solch ein verkrüppelter und mit Fehler geradezu überladener Prozessor ist, warum ist er dann so verflucht schnell?

Weil er eben mit 2 GHz läuft

Crazy_Bon · 12. Oktober 2001

Re: Re: Re: 10 Ghz

Original erstellt von Quasar

Da muß ich dich aber wieder korrigieren:

1) hat der Lord nicht davon gesprochen, daß er den P4 schlägt, sondern ihm auf den Fersen bleibt...

Hmm.. der Abstand zwischen den AthlonXP1500+ und P4 2GHz ist schon etwas erheblicher als nur an den Fersen bleiben, keine Frage.

2) gibt es keinen 1,3GHz AMD, der einen Modellnamen trägt, nur den alten T-Bird. Und auch der neue 1500+ kann in den meisten Benchmarks gut mit dem alten 1400er mithalten und übertrifft ihn auch des öfteren....

Ich beruf mich bei meiner Aussage auf dieser Darstellung von THG.

3) gibt es gar keinen 1,5GHz AMD T-Bird, hier also keine Verwechslungsgefahr....

Thunderbird? Du meinst wohl sicher den Palomino, Fehler verziehen

. Hier noch mal das Bild, keine Ahnung was sich da THG zusammen spinnt. Aber gestern hat auch K&M-Elektronik fälschigerweise den AthlonXP1500+ als einen Athlon T-Bird 1.5GHz in ihrem Onlineshop deklariert, heute ist es korrigiert worden.

4) Der AthlonXP kann sogar sehr gut mit dem P4 2GHz mithalten und in seiner höchsten Ausbaustufe übertrifft er ihn in der weitaus größten Mehrzahl der Tests

Hab ich jemals was anderes behauptet?

Bis dahin.. gute Nacht.

Prophet · 12. Oktober 2001

Eins würde mich nun aber doch mal interessieren: Wenn der Pentium 4 solch ein verkrüppelter und mit Fehler geradezu überladener Prozessor ist, warum ist er dann so verflucht schnell?

Vorallem durch die hohe P4-Bandbreitenanbindung zum Chipsatz(effektive 400Mhz, Athlon "nur" 266Mhz) zusammenmit ebenso schnellen RamBus-Speicher mit seiner hohen Bandbreite von 3.2Gbyte/sec. welcher diesen Vorteil erst so richtig ausschöpft. (Deswegen ist ja langsammerer SD-Ram zusammen mit P4´s ja auch eher nix)
Sicher aber auch durch seine "NetBurst-Architektur" - dem Sammelbegriff für eine Vielzahl von Neuerungen beim P4, was in davon jetzt genau schnell macht dürfte sicher einmal die " Rapid Execution Engine" sein.
Rapid Execution Engine : Die ALUs takten mit der 2fachenTaktfrequenz des Core. Beim P4 1,5 GHz sind das demnach ganze 3 (!!) GHz.

Ausserdem : Die 20 Stufige "Hyper Pipeline" des P4 wodurch viel mehr Befehle auffeinmal zur gleichen Zeit verarbeitet werden können wodurch die Perfomance dann natürlich steigt. Genau diese Technik wurde z.B. beim P4-Patch für das Game : Black&White eingestetzt wodurch die Spielentwickler nun die Landschafft viel detailierter darstellen lassen konnten ohne das die CPU im Gegensatz zu einem Thunderbird oder P III dadurch zu sehr in die Knie ging
(standt mal ein Bericht/Interview darüber in der PcGamesHardware)

Wegen des kleinen L1-Caches von 8Kbyte des P4 :
Dafür wurde aber dessen Latenzzeit von 3 auf 2 Takte gesenkt - was das ganze zwar sicher nicht vollkommen aber doch um einiges ausgleicht.

Mehr darüber übrigens hier auf http://www.tecchannel.de/ (Sehr gut beschrieben) :
http://www.tecchannel.de/hardware/606/index.html

Der P4 ist schon ein komischer Prozessor, einiges aus mir unerklärlichen Gründen total abgespeckt (z.B. der L1-Cache), wo anders wieder im "Übermass" aufgetunt (z.B. die hohe Bandbreite zum Chipsatz - die aber sicher nötig ist, da einer der grössten Flaschenhälse bei CPU´s über 1Ghz)

Bin schon gespannt auf die nächste P4-Generation die uns im 1Q 2002 ins Haus stehen soll, dem P4 "Northwood", soll ja mit erhähten 512Kbyte Cache daherkommen und 533Mhz effektiven FSB - wird sicher ein Fäger.
Denkt dabei mal den jetzigen Pentium III-S Tualatin welcher auch 512 anstatt nur 256Kbyte L2-Cache hatt und dadurch in Games um ca. 15-20 Prozent schneller als ein gleichgetakter normaler P III Coppermine ist.
Bin schon gespannt wie sich das beim neuen P4 auswirken wird . glaube aber sogar noch stärker, weil der P4 noch mehr als der PIII von hohen Bandbreiten zum Speicher lebt und ein grösserer L2-Cache puffert oder fängt ja dann umsomehr Daten vom/zum Hauptspeicher ab und das beschleunigt die CPU um eniges.

Das spannenste Duel der nahen Zukunft lautet für mich damit eigentlich eher :
2Ghz AthonXP vers. 2Ghz P4"Northwood" (512Kybte L2-Cache/533Mhz FSB)

Carsten · 12. Oktober 2001

Re: Re: Re: Re: 10 Ghz

Original erstellt von Crazy_Bon
Thunderbird? Du meinst wohl sicher den Palomino, Fehler verziehen . Hier noch mal das Bild,

(Vorsicht beim Kauf, bei 1.5 und 1.53GHz ebenso(PR1800+)).

Ich meinte schon T-Bird. Ich hab wohl deinen Post falsch verstanden und dachte, du wolltest auf die Verwechslungsgefahr zwischen T-Bird und Palomino hinweisen und nicht auf die zwischen den glatten 1300er und 1500er Versionen, die sich THG wohl ausgedacht hat (oder AMD ein bißchen beim PDF-erstellen geschlafen), und den existierenden Pallys mit 1,33 und 1,53GHz.
1,3 und 1,5GHz wären mit einem FSB von 133MHz auch gar nicht zu erreichen (bei herkömmlichen Multis), und da der Pally nur in der 133MHz FSB Version erscheinen soll, halte ich einfach mal die Grafik für einen unter vielen Fehlern von THG

Quasar

P.S.: Auf die Frage, warum der P4 so verflucht schnell ist, kann ich nur eines sagen: Ist er doch gar nicht und der einzige Grund, warum er 2GHz erreicht, ist, daß er pro Takt sehr viel weniger tut....und die angeblichen Double Pumped ALUs (ich weiß, daß das so von *ntel abgeschrieben ist) müssen ja geradezu erbärmlich sein, wenn sie mit 3GHz nicht mal die Performance eines Duron mit 1GHz erreichen *rofl*

Kwuteg · 12. Oktober 2001

P4-Mängel

Habe ich das jetzt richtig verstanden, daß die Entwickler bei Intel mit ihrem immensen Entwicklungsbudget, ihrem Know-How aus einem halben Dutzend Prozessorgenerationen und viel Zeit unterm Strich nur eine schwer mängelbehaftete Architektur auf die Beine gestellt haben?
Habe ich richtig gehört, daß die AMD-"Underdogs" ganz einfach schlauer waren und logische Neuerungen verbaut haben, während Intel Halbgares auftischt?

Das ist natürlich überspitzt, aber diese Informationsschwemme muß ich erst einmal verarbeiten. Ich frage mich jetzt vor allem, warum Intel all das macht? Zu dämlich können sie doch eigentlich nicht sein. Zu sparsam? Das klingt ein wenig absurd, findet ihr nicht auch?

Ich weiß wirklich nicht, was ich davon halten soll...

Tiu · 12. Oktober 2001

Er war ja ursprünglich anders geplant. Größerer 1st & second level cache und sogar ein third level cache. Nachdem aber AMD auf und davon zog, Intel seinen 1,13 GHz P3 wieder vom Markt nehmen musste usw. sah sich Intel gezwungen einen halbgaren P4 in einem preislich vertretbarem Rahmen auf den Markt zu werfen. Wäre der P4 so gekommen wie er geplant war, hätte der Athlon kein Land mehr gesehen. Aber diemal wurde ein Prozessor nicht von den Entwicklern gemacht, sondern vom Management. Hier hätte Intel noch 6 oder 8 Monate warten sollen. Da zur Einführung des P4 Speicher noch sehr teuer war mussten u.a. die Caches einer Streichung zum Opfer fallen, da ansonsten der P4 viel zu teuer geworden wäre und das zusätzlich zu dem teuren RD-RAM. Das ganze gepaart mit den anderen halbgaren Entwicklungen ergab letztlich das was wir heute als P4 im Rechner haben. Man darf hier nicht den Entwicklern den jetzigen P4 an die Backe schmieren, sondern dem Management.

Warten wir also ab, was die nächste Version des P4 hergibt. Er ist mit Sicherheit besser, da schlechter wohl kaum mehr geht.

das_ICH · 12. Oktober 2001

Was Intel schon immer getan hat ist, das sie sich mit Klauen und Zähnen an ihrem Monopol festgeklammert haben.
Der P4 wäre sicher eine tolle Sache gewesen, wenn man mit der Veröffentlichung gewartet hätte, bis der Northwood serienreif gewesen wäre.Um ein Konkurrenzprodukt zu AMD´s Athlon Serie zu positionieren, wäre die konsequente und kontinuierliche Erweiterung der PIII-Linie (schaut euch doch bloss den Tualatin Kern an) besser gewesen.
Doch der Riese Intel sah sich auf einmal durch einen über Lange Jahre unterschätzten Rivalen überflügelt und begann damit blind um sich zu schlagen.
Konsequenz: Paperlaunch eines 1Ghz Prozzesors und zurückgehender Marktanteil.
In meinen Augen ist dieser Marktanteilrückgang sicherlich nicht hauptsächlcih durch schlechtere Produkte von Intel oder bessere von AMD passiert, sondern durch vollkommen verwirrte Marketingstratgien seitens Intel, die schliesslich dazu führten, das der Jahrelange CEO YU von Intel seinen Hut nehmen musste.
Von dieser "verwirrten Zeit" hat sich Intel bis heute nicht wirklich erholt, denn die Frühveröffentlichung von P4 und nun doch ständige Sockelwechsel selbst in aktuellen Prozessorgeneration (P3 und P4) sprechen eine deutliche Sprache und lassen ein langfristiges Konzept von seiten Intels vermissen.
Ich denke, das gerade diese Unsicherheit, die Intel durch dieses Vorgehen hervorruft, viele Inteljünger (der auch ich lange Zeit war), in das Lager von AMD getrieben hat.
Die Tatsache, das AMD CPU´s von der Leistungsfähigkeit (auch die neuen Palominos mit P-Rating) ihren Intel Pendants in nichts nachstehen und dazu vom Preis günstiger sind, haben AMD´s Erfolg ausgemacht.
Trotz alledem ist meine Prognose folgende:
Denkt an 3dfx und nVidia und ihr wisst was in nicht alzu ferner Zukunft mit AMD und Intel passieren wird, wenn AMD es nicht schafft in den entscheidenden Bereichen sich zu positionieren (als da wären : Bussiness-(NB etc.) und Servermarkt).Den Workstationmarkt kann man dabei getrost außen vor lassen, da hier kaum Geschäftsergebnisrelevante Gewinne erzielt werden.
mfG
Henning

Athlon XP und P4

Commodore

Rear Admiral

Lt. Commander

LaBuenaAlma

Rear Admiral

Ensign

Foren-Wookie

Ensign

Rear Admiral

LaBuenaAlma

Rear Admiral

Lt. Commander

Quaker

Gast

Admiral Pro

Rear Admiral

Lt. Junior Grade

Commodore

Foren-Wookie

Rear Admiral

Lieutenant Pro

Ähnliche Themen

Passend zum Thema