News Asus bald mit Physikbeschleuniger-Karte

Um hier mal bezüglich dieser utopischen Mutmaßungen aufzuräumen ,
die meisten hier argumentieren ja so , dass es sich gleich verhält (verhalten wird)
wie die Entwicklung der GPU's ABER , wer so argumentiert , dem fehlen einige Kenntnisse
über Rechnerarchitektur und Ähnliches .
Wer behauptet CPU's wären nicht dafür geeignet , bestimmte Formel auf großen Datenmengen
anzuwenden , der weis nicht was SIMD heißt und bedeutet (Single-Instruction-Multiple-Data) .
Es ist zwar richtig , dass man einen hypotetischen 1000Ghz P4,Ahtlon... bräuchte um die
Grafikberechnungen per CPU zu erledigen (dann auch mit 3.0 Shadern), aber die Datenmengen stehen definitiv nicht im
Vergleich zu den Physikberechnungsdaten sowohl von der Menge als auch der Art der Daten.
Nun zum SIMD , was glaubt ihr warum es Befehlssätze wie MMX,3DNOW,SSE,SSE2,SSE3 ... gab und gibt ?
Ganz einfach , um große Matrizen in wenigen Takten zu multiplizieren , oder einfach halt damit
zu rechnen (deswegen auch SingleInstruction) .
Wenn man jetzt noch die Entwicklung zu 2/4/8 - Core CPU's sieht ergibt sich
folgendes Leistungsbild :

CPU-Perf(Theoretisch) = 25(Befehlsatzleistungsfaktor) * 1(Cpu-Kerne) * 4.5Ghz(entspricht 4500+ bei AMD)
CPU-Perf = 112,5Ghz

Etwas realistischer (mit 2 Kernen) :

CPU-Perf = 15 * 2 * 4.5Ghz
CPU-Perf = 135Ghz


Zur Erklärung :
der Faktor 25 ist fast nicht erreichbar , aber es gibt optimierte Algorithmen
die es auf knapp 20 (bei MMX,SSE,SSE2 ...) bringen , die Anzahl an Kernen wird auch noch steigen
und sicher die Leistung auch .

---------------------------------------------------------------------------------------------------------------------
Damit ist der Beweis erbracht , eine PPU iss überflüssig :king:
 
Was ist das denn für eine Milchmädchenrechnung? Und selbst wenn man irgend etwas aus ihr ableiten könnte, wer sagt dir, das 135 GHz "Leistung" :rolleyes: ausreichen würde?

Und überhaupt. Selbst wenn es gehen würde die Berechnungen auf einer CPU zu erledigen, was nicht gehen wird, warum sollte man das tun? Die CPU Rechenleistung lässt sich garantiert für etwas anderes viel sinnvoller nutzen.

Hast du dir eigentlich mal das NovodeX Rocket Tool runtergeladen? Da kannst du ja mal gucken, wie gut deine CPU die Physik berechnen kann. So würde die Physikengine ohne den Chip ablaufen. Die Software nutzt garantiert auch die Befehlssatzerweiterung und man sieht ja was die CPU leisten kann. Beispiel: Big Bang
 
Zuletzt bearbeitet:
1. OK , das mit der Faktorisierung von Taktraten iss ungenau und
eigentlich ein wenig quatsch , es ist aber nicht falsch . Fakt ist jedoch , der erwähnte
Leistungsfaktor (bei voller Ausnutzung aktueller Befehlsätze),
wenn in 4 Takten 8 x 128Bit Integer-Register miteinander (XMM0-XMM7) addiert werden ... statt
in 4 Takten 4 x 32Bit-Register (EAX,EBX,ECX,EDX) , dann ist das wesentlich schneller ....
so ergibt sich auch der Faktor ...
 
Zuletzt bearbeitet:
Im Übrigen , nutzt das NovodeX Rocket Tool , kein einzigen SIMD-Befehlssatz , sonst müsste ja
das als Hardwareanforderung angegeben seien , vielleicht hat ein Pentium2 ja doch insgeheim SSE , weil auch damit funktioniert das Tool ...
... vielleicht sogar SSE2 oder SSE3 haaaa , Intel hat's bloß niemanden verraten ..... :p
 
Zuletzt bearbeitet:
Das spielt hier doch gar keine Rolle. Lad dir mal das Tool runter und du wirst sehn, wie schnell dein Rechner ist. Du kannst davon ausgehen, dass die die Software schon so weit optimiert haben, wie möglich.

Meinetwegen multiplizierst du das noch mit 4 oder sonstwas. Das wird eine CPU immer noch nicht packen. Eine CPU ist einfach zu vielseitig, als dass sie aufgabenspezifische Chips übertreffen könnte. Das ist ja auch gut so. Sonst bräuchte ich nen 286'er in meinem portablen MP3 Player.

Aber spiel doch mal ein bisschen mit dem Tool rum. Macht auch richtig Spaß.
Die Big Bang Demo besteht aus 16.000 Steinen. Du wirst sehen, wie langsam die abläuft. Jetzt überleg mal wie schnell die läuft, wenn du 32.000 Steine hast. Mehr als doppelt so langsam, so viel ist schon mal sicher. Die PPU soll das hingegen flüssig abspielen können.


EDIT:

BlueBird-XT schrieb:
Im Übrigen , nutzt das NovodeX Rocket Tool , kein einzigen SIMD-Befehlssatz , sonst müsste ja
das als Hardwareanforderung angegeben seien , vielleicht hat ein Pentium2 ja doch insgeheim SSE , weil auch damit funktionuert das Tool ...
... vielleicht sogar SSE2 oder SSE3 haaaa , Intel hat's bloß niemanden verraten ..... :p


Vielleicht ist es optional. An sowas schon mal gedacht? Aber ich glaube mir dir lohnt sich diese Unterhaltung irgendwie nicht. Kommt mir so vor, als ob du dich hier nur wichtig machen willst mit deinem Assembler und SIMD Gequatsche.

Eigentlich müsstest du dann ja auch wissen was RISC ist. Schlag mal nach.

Over and Out.
 
Zuletzt bearbeitet:
Aber nimmt mal an , so eine Karte iss zu 50% gerechtfertigt für nen Gelegenheitsspieler , und zu
100% für nen Hardcoregamer .....

Wirtschaftlich gesehen kann es zu einer Monopolbildung führen .... wenn es nur einen Hersteller gibt

Würdest du 250€ für so ne PPU ausgeben , wenn sie nach einem Jahr überholt iss ....
viele geben nich mal soviel für ne GPU aus .... !
 
Hmm.
Hab gerade gelesen, dass die Karte so zwischen 250$ und 300$ kosten soll.
Gestern habe ich noch irgendwo 200$ gelesen. Der Preis scheint also noch völlig unklar zu sein.
 
Man wird's halt sehen ... vielleicht iss so ne Karte auch bloß ne Übergangslösung (unfreiwillige) und
wird halt von , in CPU .o GPU integrierten PPU's abgelöst .
Dann wäre es garnich so schlecht , dass man trotz eines alten Systems so ne Karte reinsetzten kann
statt nen P5 mit PPU *zukunftsvision* welcher eine Komplettüberholung voraussetzen würde ...
 
noxon schrieb:
Vielleicht ist es optional. An sowas schon mal gedacht? Aber ich glaube mir dir lohnt sich diese Unterhaltung irgendwie nicht. Kommt mir so vor, als ob du dich hier nur wichtig machen willst mit deinem Assembler und SIMD Gequatsche.

Eigentlich müsstest du dann ja auch wissen was RISC ist. Schlag mal nach.

Over and Out.

Tsss--ssss *lachhaft* , hast du überhaupt schonmal programmiert (geschwindigkeitsoptimiert), oder weißt du wie ne moderne CPU aufgebaut ist ?
 
Zuletzt bearbeitet:
BlueBird-XT schrieb:
Nun zum SIMD , was glaubt ihr warum es Befehlssätze wie MMX,3DNOW,SSE,SSE2,SSE3 ... gab und gibt ?
Ganz einfach , um große Matrizen in wenigen Takten zu multiplizieren , oder einfach halt damit zu rechnen (deswegen auch SingleInstruction).
Ach sag an. Schon mal ein Matrix_Mutily für SSE geschrieben? Das ist immernoch weit über zwanzig Zeilen lang, vorallem weil SSE eben gar nicht so optimal dafür ist und die Daten oft umgeschaufelt werden müssen.

BlueBird-XT schrieb:
Fakt ist jedoch , der erwähnte Leistungsfaktor (bei voller Ausnutzung aktueller Befehlsätze), wenn in 4 Takten 8 x 128Bit Integer-Register miteinander (XMM0-XMM1) addiert werden ... statt in 4 Takten 4 x 32Bit-Register (EAX,EBX,ECX,EDX) , dann ist das wesentlich schneller .... so ergibt sich auch der Faktor ...
Wenn du Fakten willst... Fakt ist, dass eine Matrix-Matrix Multiplikation (jew. 4x4) auf einem P4 ohne SSE 414 Takte dauert und mit SSE 130 Takte.

Wenn du mir also erzählen willst, dass da mit einer Hardwareumsetzung nichts mehr rauszuholen sei, dann muss ich dir einfach widersprechen.
 
In ihrem Artikel E3 Expo 2005: Hardware Innovation Behind the Gaming Fun widmet man bei X-bit labs die letzte Seite (page 6) auch unserem Physikbeschleuniger:Darin werden u.a. die Vermutungen, dass PCI (standard) voerst als Schnittstelle dienen wird, bestätigt und auch begründet. Wenn die Karte im 4. Quartal diesen Jahres als Retail Version zu Verfügung stehen soll, wird sie angeblich zu einem Marktpreis zwischen $249 und $299 eingeführt werden.


Na wenn ich mir dafür nicht ne neue GraKa für UT2007 kaufen muss, kommts ja aufs gleiche raus
:cool_alt:
 
Zuletzt bearbeitet: (Rechtschreibung)
Ich hoffe, dass die Karte wirklich etwas günstiger wird. 200 EUR fände ich noch angemessen. Wenn sie teurer wird, dann werden sie bestimmt Probleme haben die Karte an den Mann zu bringen und gerade das ist wichtig, wenn sie wollen, dass sich ihre Karte und ihre Engine durchsetzt.

Außerdem hoffe ich darauf, dass man die Karte gleichzeitig als PCIe und als PCI Karte nutzen kann. Wie man auf den Bildern sieht hat sie ja beide Schnittstellen. Man muss die Karte nur umdrehen. Jedenfalls wäre das eine sehr gute Lösung um jeden zufreiden zu stellen.

Ich hätte sie nämlich schon gerne als PCIe Version. Davon hab ich eh noch ein paar Slots frei. Einen Geschwindigkeitsvorsprung hat man allerdings nicht. Höchstens beim Laden der Daten in die Karte. Die Daten, die nachher pro Frame übertragen werden sollen laut Ageia nicht mehr als ein paar MB betragen.



EDIT: So wie ich das gerade gelesen habe soll die Karte wohl zuerst einmal doch nur für den PCI Bus erscheinen. Dafür soll es die Karte aber in unterschiedlichen Versionen geben, die unterschiedlich stark sind. Genau so wie bei den Grafikkarten. Die Leistung einer PPU kann man angeblich sehr gut mit der Anzahl der Transistoren messen, die sie beinhaltet.
Daher wird vermutet, dass es sich bei der PPU um eine Multicore-Architektur handelt, bei der man unterschiedlich viele Cores zu unterschiedlichen Preisen bekommt.
 
Zuletzt bearbeitet:
Also nochmal paar kleine Rechtfertigungen meinerseits , klar iss mit SSE und co. nicht ALLES möglich ,
und ja ich habe schonmal Funktionen geschrieben (vielmehr gebastelt und rumprobiert) die mit
Matrizen arbeiten und SSE nutzen (+prefetch), und paar Zeitmessungen bezüglich der
Leistungsfähigkeit gemacht .

Es ist schon klar , das eine PPU noch wesentlich leistungsfähiger seien kann als so
eine Softwarelösung . [EDIT] Dies jedoch begründet sich von selbst, da spezielle DSP's
immer leistungsfähiger sind als generische Hardware/Software-Lösungen [EDIT]

Ich habe ja auch nicht gesagt , dass eine PPU auf lange Sicht komplett sinnlos ist .

Aber es freut mich das es hier Leute gibt, die sich mit der Problematik auskennen, und
fundierte Fakten bringen . Manche behaupten man würde sich wichtig machen , nur weil man
Begriffe verwendet die sie nicht richtig einordnen können.

(hatte mich oben verschrieben , meinte Register XMM0-XMM7)
 
Zuletzt bearbeitet:
Sorry, aber ich konnte nicht wiederstehen.

Normalerweise heißt es, dass es in der Natur der Sache liegt und nicht in der Sache der Natur.

Ich find's immer witzig, wenn Sprichworte oder Redewendungen vertauscht oder gemischt werden. Ist mir nur so aufgefallen. :)
 
Zurück
Oben