Realsmasher
Captain
- Registriert
- Juli 2005
- Beiträge
- 4.046
Kannst du mir mal bitte sagen was du studiert hast, oder studierst
Falls das noch nicht offensichtlich ist, Informatik.
Schwerpunkte : Parallele Systeme und Hardwareentwurf.
Allerdings beschäftige ich mich eher mit einem Bereich der direkte Parallelität zulässt, z.b. FPGAs, als mit klassischen Rechnern.
Es gibt als Beispiel numerische Verfahren, die Werte nicht berechnen sondern schätzen
ich weiß worauf du hinaus willst. Das man mit Approximation auch P-Vollständige Probleme parallelisieren kann ist mir schon klar.
Die Sache ist nur das dies in der Praxis doch fast nie eingesetzt wird, da es
a) schwierig ist eine solche Lösung zu finden
b) sie ungenau ist
Das kann man vielleicht bei einer Google Suchanfrage in Kauf nehmen, jedoch nicht überall.
Du kannst ja z.b. mal versuchen für das oben von mir genannte Problem eine solche Lösung zu finden.
Ausserdem würde mich interessieren wo du diesen Wert von 10 Taktzyklen für die Kommunikation zwischen den einzelnen Cores hergeholt hast.
hier mal für den i7 : KLICK
Die Zeit zur Kommunikation mit dem l2 Cache wird mit 10 Taktzyklen angegeben.
Der l3 cache zur Kommunikation wird dementsprechend sogar noch mehr zeit benötigen.
Nach deiner Ansicht wäre jeder aktuelle Superrechner garnicht möglich, weil dort zum Teil die Kommunikation zwischen den Kernen wesentlich länger dauert.
Nö, du musst schon richtig lesen. Instruktionsnahe Parallelität ist nicht möglich, das schließt jedoch andere Dinge nicht aus.
Immer wenn es unabhängige Arbeit gibt die aggregiert werden kann, dann kann man auch mit dem Kommunikationsdefizit leben.
Ah schön, selbst jemand der keine Ahnung von dem Thema hat, hat schonmal was von Ageia gehört.
schön das du scheinbar nichtmal den Thread gelesen hast.
Für dich nochmal : kuck dir bitte die Titel an die mit Physx erschienen sind. Und dann suche jene raus die nicht nur hunderte objekte bewegen, sondern auch sauber kollidieren lassen. Viel Spaß bei der Suche.
In der Regel sieht das nämlich so aus : http://games.au-ja.com/bilder/2007/cellfactor-2.jpg
Die Kollision wird parallel berechnet, deswegen hängen alle Objekte gerne mal mehrere Frames ineinander.
Wer das gut findet, ok, ich halte es für eine Physikberechnung für inakzeptabel.
Hier haben wir übrigens wieder das oben erwähnte : ein sequenzielles Problem durch eine schlechtere Lösung parallelisiert.