Programme, die mit der GPU rechnen

S

Straßdörfler

Gast
Hi,

ich bin auf der suche nach programmen, die nicht die CPU sondern die GPU für berechnungen einsetzen. (NVidia CUDA)

gibt es solche programme schon, mit denen man z.b. videos oder musik umrechnen kann, oder ist das noch in einer entwicklungsphase?

es können auch andere programme sein (wissenschaftliche), IHR KÖNNT SIE HIER MAL AUFLISTEN!!, wenn ihr wollt ^^.

Hier die Programme, die auf der Hompage von Nvidia gelistet sind:

http://www.nvidia.com/object/cuda_home.html

Bericht: Nvidia CUDA und PhysX im Überblick
 
Zuletzt bearbeitet von einem Moderator:
SuperPi kommt bald für alle GF 8 und 9, es folgen ein mp3-Encoder und sicherlich noch mehr Mainstream-Applikationen.

cYa
 
gibt es sowas wie nvidias cuda schnittstelle auch für ati grafikkarten?
 
Angeblich wird PhyX für alle GraKas freigegeben - auch Radeons. Wobei dann die Frage ist, ob CUDA auch auf Radeons läuft ... kA wie die das regeln bzw. machen wollen.

cYa
 
bearnator schrieb:
gibt es sowas wie nvidias cuda schnittstelle auch für ati grafikkarten?

Nennt sich bei Ati CTM ("Close To Metal") und wie üblich nicht kompatibel zu CUDA und umgekehrt natürlich auch nicht. Dort sind mir allerdings auch nur die diversen F@H-Clients bekannt die das nutzen.
 
Fastra:
Berechnung für wissenschaftliches, Tomographie. Mit 4x 9800GX2, 8GPUs, 1024 parallel arbeitende Shader, berechnen sie "Bob"
Extrem schnell, extrem effizient. Extrem Strom sparend und günstig, gegenüber CPUs.
GPGPU boomt gerade so richtig, ganze CPU-Serverfarmen werden einfach aufgelöst bzw. gar nicht erst gebaut.(wenn möglich)
http://fastra.ua.ac.be/en/specs.html
http://www.pcgameshardware.de/aid,6...puter_mit_GPUs_-_schneller_als_350_CPU-Kerne/
pic_internal.jpg

Man beachte die kleine zusammengelegte Stromleitung, die zum 1500W Netzteil führt.:rolleyes:
Man braucht den Hypertransport von Phenom X4, um die 8GPUs effizient mit der CPU kommunizieren zu lassen. Des weiteren ist das Mainboard auch nicht irgend eines, sondern ein 790FX mit 4x Dualslot Fähigkeit.




Update 05.04.2009:

Personal Supercomputer(PSC) Specifications der Atlas Folder: (vergleichbar mit Tesla Supercomputer)

Mal ein extremes Beispiel wie man CUDA und GPGPU nutzen kann:
Er hat definitiv vom Fastra gespickt. Am häufigsten kommt ein Phenom 9950 mit Hypertransport zum Einsatz. Beim QX9770 hat er definitiv zu viel bezahlt und 4,2GHz machen den FSB auch nicht schneller. Beim Mainboard ist er auch beim MSI k9A2 Platinum mit 4x dualslot Fähigkeit hängen geblieben. Beim Atlas kommt wie beim Fastra Windows XP x64 zum Einsatz.

Fürs Falten braucht man anscheinend auch für viele GPUs nur sehr wenig Ram, 2GB ist ja gar nix! Um Kosten zu sparen nimmt er mehrere 750Watt Netzteile.

AMD Phenom 9550, 2GB 1066, MSI K9A2 Platinum, Dual 750W PCP&C per shelf, cheapest HDD I can buy, only has OS on it. Rack is Middle Atlantic Products "Slim-5"
That rack is using dual 750W supplies tied together, each supply powers two cards. - Jason

Er versucht auf jeden Fall Geld zu sparen wo er kann! Zur Zeit überlegt er ob er weiter aufrüsten soll, also weitere GTX 295 kaufen, oder auf GT300 warten soll. Meiner Schätzung nach hat der GT300 ca. 3-4TFlops und eine bei weitem bessere Watt/Performance darum wird er auch darauf warten... :rolleyes:

http://atlasfolding.com/wp-content/gallery/buildtarget/19boxes_0.png
http://atlasfolding.com/wp-content/gallery/buildtarget/atlasfolder-3-14-09-rightside_0.png
nodes_12.png

Artikel von PCGH über den GPGPU Supercomputer:
http://www.pcgameshardware.de/aid,6...nd-17x-GTX-295-im-Video/Folding-at-home/News/
Artikel von CB über den GPGPU Supercomputer:
https://www.computerbase.de/2009-04/was-macht-man-mit-23-geforce-gtx-295/


Atlas Folder consists of:

23) nVidia GTX295
1) nVidia GTX260
1) nVidia 9800GT
2) nVidia 8800GTX
1) Sony PS3

4) MSI k9A2 Platinum motherboards w/ 2GB RAM
1) Foxconn Destroyer motherboard w/ 2GB RAM
1) EVGA 790i Ultra motherboard w/ 4GB RAM

5) AMD Phenom 9950 processors at 2.8 GHz
1) Intel QX9770 processor water cooled at 4.2 GHz

Microsoft Windows XP x64 on all

Middle Atlantic Products Slim-5 19″ rack
Shelves are Middle Atlantic Products Clamping Rackshelf model RC-4
Estimated Computing Power:

* 23 nVidia GTX295 at 1.788 TeraFLOPS each for 41.124 TeraFLOPS total (46 individual GPUs, two per board)
* 6 Quad Core processors at ~300 GigaFLOPS

41.424 single-precision TeraFLOPS

Quelle: http://atlasfolding.com/?page_id=148
http://atlasfolding.com/




Atlas Folder Youtube Channel:
http://www.youtube.com/user/AtlasFolder

23x GTX 295 @ 41TFlops im Einsatz:
http://www.youtube.com/watch?v=KjOW5iW7dJQ&feature=channel_page

41TFlops Supercomputer remote control: :cool_alt:
http://www.youtube.com/watch?v=RXZj39YuxCs

Tipps vom Entwickler selbst:
http://www.maximumpc.com/forums/viewtopic.php?t=90722&start=20&postdays=0&postorder=asc&highlight=

Schritt für Schritt wird gezeigt und erklärt wie man einen Supercomputer baut:
http://www.youtube.com/watch?v=pLubHCmBqpY
http://www.youtube.com/watch?v=7F3XE1-d_rw
http://www.youtube.com/watch?v=4Q1nfHJOvGY
http://www.youtube.com/watch?v=xq1r09ZVfOg



I looked just now and the machine is doing 302,245 PPD. My daily average is a bit less than that. - Jason
:o
Well, *I* pay for this. The vast majority of the equipment I paid for out of my personal money. The company that my family and I own has bought some of it and also donates the space and power, which is not insignificant.




Warum falten NV Grafikkarten so viel schneller als ATI Karten:
http://www.pcgameshardware.de/aid,6...age_id=937874&article_id=667155&page=1&show=n
* Why are the ATI x86 FLOP numbers half of the ATI native FLOP numbers?
Due to a difference in the implementation (in part due to hardware differences), the ATI code must do two force
calculations where the x86, Cell, and NVIDIA hardware need only do one. This increases the overall native FLOP count
for ATI hardware, but since these are not useful FLOPS in a sense, we did not include them in the x86 count.

* Why aren't the differences between native GPU and x86 FLOP counts even greater?
In the end, much of the code uses simpler operations (add, multiply, divide, etc) which counts as one FLOP
under both systems. The instructions which are much more different (e.g. exp(x)) are more rare (say 1/10th the number
of instructions) and thus the overall difference is closer to 2x.
Nur weil hier gleich 23x GTX 295 aufgefahren werden braucht ihr nicht glauben euer Beitrag sei weniger Wert. Die Masse machts. ;) Also schön mitfalten Kleinvieh macht auch Mist!
http://folding.stanford.edu/
http://folding.stanford.edu/English/DownloadWinOther
https://www.computerbase.de/2008-06/folding-at-home-client-fuer-nvidia-gpus-ist-raus/



23x GTX 295 luftgekühlt, ohne Murren ohne Zicken rechnen sie im Quad Bündel, extrem schnell, extrem effizient(im Vergleich zur CPU) vor sich hin. Wer hätte das gedacht, GT200b ist effizient genug in einem solch extremen Setting auf eine Wasserkühlung verzichten zu können.


Ich hoffe es wird noch rechtzeitig ein Mittel gegen Huntingtons gefunden, um seinen Vater noch in letzter Sekunde retten zu können, auf jeden Fall werden bei Erfolg zukünftige Fälle verhindert und Leben gerettet. Zur Zeit testet sein Vater ein Medikament das noch nicht auf dem Markt ist. Eine herzzerreißende Geschichte. Gute Besserung wünscht Kasmo




Harvard wird „CUDA Centre of Excellence
https://www.computerbase.de/2009-04/harvard-wird-cuda-centre-of-excellence/


Zur Zeit arbeitet NV an einer GTX 295 mit single PCB, damit werden dann Single-Slot wassergekühlte Ausführungen möglich. Damit sind dann zb. 7x GTX 295 auf einem Mainboard möglich, wie diesem extra für GPGPU zugeschnittenen von Asus: https://www.computerbase.de/2009-03/mainboard-mit-sieben-mal-pcie-x16-von-asus/
https://pics.computerbase.de/2/4/6/4/4/1-1080.2337363496.jpg
Mainboards mit 6x PCIe sind bereits im Handel: http://geizhals.at/deutschland/a388111.html

Ein paar theoretische Rechenbeispiele von mir, mit einem ähnlichen Supercomputer Setup:
https://www.computerbase.de/forum/t...23-geforce-gtx-295.572058/page-6#post-5868522



Atlas Folder Update 01. 05. 2009:

Anscheinend konnte er es doch nicht mehr abwarten und auf den GT300 warten. Daher hat er sich kurzerhand 31x 9800GX2 gebrauchte Grafikkarten mit einem Kumpel geteilt. Günstig erstanden und ca. 30% weniger Rechenleistung wie eine GTX 295 sprechen für sich.

Teil 1 dreht sich um das Auspacken der Rechenwerke:
http://www.youtube.com/watch?v=mAcW3Y_IJJA

31 Graphics cards, 62 GPUs, 46.75 Billion Transistors - Atlas Folder Phase Two - A joint venture between Atlas Folder (Team HUNT-DIS) and VanArnam (Team Fold4Life) - FOLD ON!


Atlas Folder Update 19. 05. 2009:

Im 2. Teil sieht man den Aufbau des neuen Großprojektes der die PPDs verdoppeln soll. :daumen:
http://www.youtube.com/watch?v=UI9QzIwAXFg

Over the weekend of May 8th-10th, John Van Arnam of team fold4life.com and I assembed Phase 2 of Atlas Folder: 32 additional 9800GX2 GPUs purchase from nitteo of team overclock.net.

Things went pretty smoothly and since then we have been tweaking the performance up and getting the thermal dissipation under control. Atlas Folder now consists of 13 full racks of 4 cards, each of which consume nearly 1,000 Watts. Research output for the complete farm currently stand at about 575,000 points per day.

John Van Arnam and I, Jason Farque, split the cost of nitteo’s hardware and also split the folding points that it emits.

Atlas Folder is:

23) nVidia GTX295 (46 computing units)
32) 9800GX2 (64 computing units)

14) MSI K9A2 Platinum motherboards
14) AMD dual and quad core processors (9950 and 5050e)
28) Gigabytes RAM

Microsoft Windows XP x64 on all

2 Middle Atlantic Products Slim-5 19″ racks
14 Middle Atlantic Products Clamping Rackshelves, model RC-4
Estimated Single-Precision Computing FLOPS:

23 nVidia GTX295 at 1.788 TeraFLOPS each
41.124 TeraFLOPS total

32 nVidia 9800GX2 at 1.152 TeraFLOPS each
36.864 TeraFLOPS total
77.988 TeraFLOPS

With the 9800GX2s we've seen temperatures as high as 95'C with them folding, but typically they run in the 80s overclocked to 1729MHz shaders. My GTX295s are similar. You put that may cards that close together and it's bound to get hot...

13 machines with 4 cards. Each of those machines is drawing about 1,000 Watts. 13,000 Watts.

Yes, 13,000 Watts continuously. Each rack has 8 GPUs under 100% load 24/7.



Update 21.04.2009:

Also eines muss man den Fastra und Atlas Folder lassen, nicht nur falten sie schneller als alles andere, sondern sie bewegen auch andere dazu es ihnen gleich zu tun.

Ein weiterer Fastra ähnlicher GPGPU Supercomputer wurde nun im PCGH-folding Team gebaut. Die Basis hat sich erneuert auf Sockel AM3, aber die Grundzutaten sind die gleichen:


StanFOLD Mark I:
97037d1240340856-folding-maschine-stanfold-mark-i-8-gpu-s-gegen-alzheimer-stanfold4.jpg



CPU: AMD Phenom II X4 810 http://geizhals.at/deutschland/a399919.html
Mainboard: MSI 790FX-GD70 http://geizhals.at/deutschland/a408995.html
Speicher: 4GB Geil DDR3 http://geizhals.at/deutschland/a272373.html oder http://geizhals.at/deutschland/a272375.html
GPU: 9800 GX2: http://geizhals.at/deutschland/?cat=gra16_512;asuch=9800 GX2&sort=eintr oder http://shop.ebay.de/items/_W0QQ_nkwZ9800Q20gx2QQ_armrsZ1QQ_fromZQQ_mdoZ
Netzteil: Coolermaster RealPower 1250W http://geizhals.at/deutschland/a289247.html
Gehäuse: Thermaltake Spedo http://geizhals.at/deutschland/a363439.html


Wie üblich kommt aufgrund der die Kommunikation zu den 8GPUs, der effiziente Hypertransport einer kostengünstigen AMD CPU zum Einsatz. Das Mainboard weis auch zu gefallen, ist quasi der direkte Nachfolger zum MSI K9A2 Platinum, mit 4x dualslot Fähigkeit. Sehr hohe Watt/Performance liefern 4x 9800GX2 Grafikkarten. Als Betriebssystem kommt diesmal Vista zum Einsatz das zugleich gegenüber XP einige Probleme mit sich bringt:
Um alle Grafikkarten zum Arbeiten zu überreden, nutzt Standeck sogenannte Monitor-Dummys, um dem Betriebssystem vorzugaukeln, dass am jeweiligen DVI-Anschluss auch ein Monitor sitzt. Dies ist nötig damit der Folding-@-Home-Client auf allen Grafikkarten auch sauber, also ohne Fehler, funktioniert.
http://extreme.pcgameshardware.de/a...-mark-i-8-gpu-s-gegen-alzheimer-stanfold7.jpg


Hier der Artikel bei PCGH:
http://www.pcgameshardware.de/aid,6...ne-im-Forum-vorgestellt/Folding-at-home/News/
Forumeintrag vom Entwickler des StanFOLD Mark I:
http://extreme.pcgameshardware.de/f...-stanfold-mark-i-8-gpu-s-gegen-alzheimer.html
Weitere Bilder:
http://extreme.pcgameshardware.de/a...-mark-i-8-gpu-s-gegen-alzheimer-stanfold2.jpg
http://extreme.pcgameshardware.de/a...-mark-i-8-gpu-s-gegen-alzheimer-stanfold3.jpg
http://extreme.pcgameshardware.de/a...-mark-i-8-gpu-s-gegen-alzheimer-stanfold4.jpg
http://extreme.pcgameshardware.de/a...-mark-i-8-gpu-s-gegen-alzheimer-stanfold5.jpg
http://extreme.pcgameshardware.de/a...-mark-i-8-gpu-s-gegen-alzheimer-stanfold7.jpg
http://www.pcgameshardware.de/aid,6...ge_id=1071544&article_id=682566&show=original

60.000 PPD bei geschätzten 800Watt Verlustleistung. :daumen:
Soweit ich weis, ist die Gesamtleistung der Folding Community 2,5 mal so hoch wie der zur Zeit schnellste Supercomputer.


MfG Kasmo
 
Zuletzt bearbeitet:
Pinnacle 11.1.2 nutz zum Teil auch die GPU zum vorrendern im Hintergrund wärend man sein Video und Übergänge schneidet. Weiß aber nicht ob das mit ATI Karten auch geht. Weil ich nutze nur nVidia Krafikkarten.
 
hi, ja habe ich auch gesehen, ich bin auch gerade auf der suche nach einem downloadlink für den video encoder ;), sobald ich was habe, werde ich es hier auflisten.
 
Es gab mal vor einer Zeit die Meldung, dass ein Keygen, der mit der GPU rechnete, deutlich schneller war als eine CPU, weil die GPU sich alles aufteilt und kleine Daten einzeln behandelt, anstatt immer nur große Brocken zu berechnen wie die CPU.
 
Vendetta schrieb:
Sollte Photoshop das nicht über OpenGL regeln?!

Filter möglicherweise bald mit CUDA, 3D-Objekte mit openGL. Für CS3 gibt es Anleitungen zum Schreiben von Plugins die CUDA verwenden.
 
hi, nachdem u.a. tomshardware & co. schon den badaboom videoconverter in betrieb haben, wollt ich nur mal fragen, ob ihr irgendwo schon eine lauffähige version davon badaboom im netz gefunden habt.
 
Wie wär´s wenn du mal die genannten Anwendungen im ersten Post auflistest ? Der Übersichtlichkeit halber mit Link usw.

ATI und nVidia nebeneinander oder zumindest (fairerweise) gleichberechtigt als Hersteller.

Zählt Havok auch dazu ?
http://de.wikipedia.org/wiki/Havok_(Software)

Vielleicht auch einen Link ins CUDA-Forum, dort gibt es interessante mathematische Programme, auch zum Herunterladen und testen, falls man CUDA bereits installiert hat.
 
Zurück
Oben