Spezialfragen CUDA

Die Geforce-Fermi ist tatsächlich beschnitten (eine kurze Google-Suche gibt auch die NVidia-Stellungnahme dazu aus).

Von der Architektur her könnte Fermi in Double-Precision genau die Hälfe an Performance liefern, die in Single Precision anliegt. Für die Geforce-Karten wurde dieser Wert aber noch auf ein viertel reduziert, womit man am Ende bei genau 1/8-DP-Leistung herauskommt. Tesla-Karten können in DP dementsprechend bis zu 4x schneller sein (wenn man andere Faktoren wie RAM-Ausbau, Taktraten etc. vernachlässigt).
 
Tja Quadros und Teslas sind massiv überteuert finde ich.
Oft konnte man schon mit dem Treiber ne Menge modden.

Sind ja alles Software-Sperren.
Bei ATI konnte man noch bis zur HD 2900 Pro ne vollwertige FireGL Flashen.
 
rwufka schrieb:
Offtopic Frage: Welches Programm bzw. welche Anwendung benötigt soviel CUDA Leistung bzw. kann damit etwas Anfangen in Form von 2 Stück GTX480 Karten wie hier gewünscht?

Man kann dann zum Beispiel zwei Simulationen parallel laufen lassen. Manche Probleme lassen sich auch einigermassen gut auf zwei Karten verteilen, das geht aber nicht bei jeder Art von Simulation besonders gut. Die "Normalen" Karten sind nicht wesentlich verschieden zu den professionellen Loesungen (muss man sich nur mal die Datenblaetter angucken) und kosten deutlich weniger.

Hoomd ist zum Beispiel ein Code, der (fast) komplett auf der Grafikkarte laeuft:
http://www.ameslab.gov/hoomd/benchmarks.html#results

Wie man in der Tabelle sehen kann, ist eine GTX 280 sogar schneller als die S1070-Tesla Karten (Spalte TPS ist "timesteps per second"). Warum, wenn man auf den groesseren Speicher verzichten kann, sollte man also die teuren Karten kaufen.
 
Ich weiß, das ging mal durch die news, dass die gtx 480 weniger dp leistung hat.

aber das ist schwachsinn:

Die GPU-Computing Karte Tesla C2070 (Fermi-Basis) hat SP: 1030 / DP: 515 GFlops.
Quellen:
http://de.wikipedia.org/wiki/Nvidia_Tesla#Modelldaten
http://www.nvidia.de/object/product_tesla_C2050_C2070_de.html (--> unter techschnische Daten)
Dies entspricht genau der GTX480 (diese hat sogar etwas mehr dank höherer Taktraten).
Quelle:
http://de.wikipedia.org/wiki/Nvidia-Geforce-400-Serie#Leistungsdaten

Also ist im Normalfall die GTX480 die bessere wahl, außer du braucht die zertifizierten treiber der tesla/quadro.

Aber wenn du selber cuda programmieren willst lass dir gesagt sein, parallelprogrammieren ist nicht immer einfach...
wenn du vorhandene software nutzen willst.... es gibt immernoch wenig brauchbare cudasoftware...

EDIT:
Ah, ich seh grad in einem PDF:
http://www.browndeertechnology.com/docs/drichie_UPITT_GPU_Symposium_20100630-novideo.pdf
Die GF100 hat tatsächlich reduzierte dp.... sry, dann ist das bei wiki falsch und ihr habt recht...
 
Zuletzt bearbeitet:
Sheeep schrieb:
Aber wenn du selber cuda programmieren willst lass dir gesagt sein, parallelprogrammieren ist nicht immer einfach...
wenn du vorhandene software nutzen willst.... es gibt immernoch wenig brauchbare cudasoftware...

Ich mach das schon etwas laenger... kein Problem ;)
 
@Sheeep
in der wikipedia muss das ja nicht richtig sein. das wurde mal eingetragen, nach dem nVidia den Fermi vorgestellt hat. Hat nachher keiner verbessert, nach dem nvidia offenbar über Marketingmitarbeiter und co. die frohe Botschaft über die beschnittene DP-Leistung verlauten ließ...
 
silent-efficiency schrieb:
@Sheeep
in der wikipedia muss das ja nicht richtig sein. das wurde mal eingetragen, nach dem nVidia den Fermi vorgestellt hat. Hat nachher keiner verbessert, nach dem nvidia offenbar über Marketingmitarbeiter und co. die frohe Botschaft über die beschnittene DP-Leistung verlauten ließ...
Hi,
Ich habs oben schon berichtigt, ich hab eine pdf präsentation gefunden, in der auf seite 3 eine grafik ist, die zeigt, dass die dp von der gtx 480 tatsächlich reduziert ist...

sry, wegen der fehlinformation....


MFG
Sheeep
 
@RodriguezFatz: Die S1070 ist aber keine Fermi-Karte du Genie... :D

Nur die C2050/S2050 und C2070/S2070 sind Fermi-Teslas, die der 1000er-Generation sind GT200-Teslas und die davor basieren noch auf dem G80.
 
Zuletzt bearbeitet:
AndrewPoison schrieb:
@RodriguezFatz: Die S1070 ist aber keine Fermi-Karte du Genie... :D

Ich weiss, lies dir mal alle posts durch, du Genie. Fermi Tesla Karten gibt es noch nicht auf dem Markt, bzw. es kann sein, dass sie gerade zur Zeit rauskommen. Jedenfalls kann man ja in den Benchmarks sehen, dass die Tesla Karten nicht schneller sind, als die Geforce Karten der gleichen Generation (280), das hab ich aber auch schon oben geschrieben...
 
RodriguezFatz schrieb:
Jedenfalls kann man ja in den Benchmarks sehen, dass die Tesla Karten nicht schneller sind, als die Geforce Karten der gleichen Generation (280), das hab ich aber auch schon oben geschrieben...

Hast du nicht:

480 (zumindest bei der Molekulardynamik) gut doppelt so schnell ist wie die Tesla S1070
Hier vergleichst du die 480 (Fermi) mit der S1070 (GT200).

Ganz nebenbei: mit Fermi hat sich die Architektur verändert. Erst seit dieser ist es so, dass die Tesla-Karten in DP schneller sind als ihre Geforce-Kollegen. Davor waren die Professionellen Karten den Desktop-Karten ebenbürtig, hatten aber wegen geringerer Taktraten und höherer Qualitätsanforderung am Ende weniger "Leistung".



....Genie :D
 
Ich hab mich aber auf deinen anderen Post bezogen (Post 27) ;)

Ist ja auch egal: der TE redet nun mal über die GTX480, und die ist eben Fermi - genau wie ihre Tesla-Kollegen. Da hilft es nichts mit Vergleichen anzukommen, die hier in die Irre führen.
 
@AndrewPoison
Weiter oben wurde mir von irgendwelchen zweifelhaften "Experten" empfohlen die professionellen Karten zu kaufen anstatt der 480er. Mein Vergleich hat nicht in die Irre gefuehrt, sondern nur gezeigt, wie schwachsinnig der Vorschlag war. Lies dir doch bitte den ganzen Thread durch, dann muss ich nicht alles zweimal erklaeren...
@silent-efficiency
Danke!
 
Ich habe durchaus gelesen dass Leute die Tesla-Karten empfohlen haben, anstatt der GTX480. Welche man da braucht, sei mal dahin gestellt (da der TE anscheinen eh kein DP nutzt, reicht ihm die GTX480 alle mal!).

Aber, und jetzt noch mal zum mitschreiben, bei einem Vergleich zwischen der GTX480 und einer Fermi-Tesla ist es eben nicht schwachsinnig darauf hinzuweisen, da seit der Fermi-Generation die Geforce-Karten künstlich gebremst werden. Wie gesagt, die ist für den TE immer noch optimal, aber du kannst schlicht und ergreifend nicht mit den alten Benchmarks ankommen und nach dem Motto "weils bei den alten Karten so war ist es auch bei den neuen so" Behauptungen aufstellen. Bei der Fermi-Generation sind die Teslas in DP schneller als ihre Geforce-Kollegen. Davor war das nicht so.

Aber du schreibst hier in dem Stil als wäre eine Tesla C2050/70 einer GTX480 unterlegen oder in DP maximal ebenbürtig - das ist schlicht und ergreifend falsch.

Was anderes habe ich übrigens nie behauptet.
 
Zuletzt bearbeitet:
So wie ich das sehe bringt es genauso wenig, eine GTX480 mit einer Karte zu vergleichen die es noch nicht gibt... ihm wurde zu der Tesla auf Basis des GT200 geraten.. und nich zu den Fermi-Teslas (die es wohl noch nicht gibt). Und somit sollte doch alles klar sein oder?
 
Naja ihm wurde ja zu vielem geraten ^^ (wobei ich schon denke, dass die neueren Teslas gemeint waren, nicht die alten)
Aber in dem Fall wäre die Tesla auf GT200-Basis natürlich langsamer als eine GTX480 (die 480er hat trotz der Drosselung noch mehr DP-Performance als die alte Generation, rund 50% glaube) und dazu noch teurer, also total nutzlos.

/edit: für den TE als Randnotiz, den es vlt. interessieren könnte was es bzgl. Tesla noch auf sich hat

Tesla 20-series (Fermi-based) products are designed for high performance
scientific and technical GPU computing.

They thus have features, testing, and support over and above our consumer
GeForce GTX 470 and 480 (Fermi-based) products such as:

- Double precision is 1/2 of single precision for Tesla 20-series, whereas double precision is 1/8th of single precision for GeForce GTX 470/480
- ECC is available only on Tesla
- Tesla 20-series has 2 DMA Engines (copy engines). GeForce has 1 DMA Engine. This means that CUDA applications can overlap computation and communication on Tesla using bi-directional communication over PCI-e.
- Tesla products have larger memory on board (3GB and 6GB)
- Cluster management software is only supported on Tesla products
- The TCC (Tesla Compute Cluster) driver for Windows is only supported on Tesla
- OEMs offer integrated workstations and servers with Tesla products only
- HPC ISV software is tested, certified, and supported only on Tesla products
- Tesla products are built for reliable long running computing applications and undergo intense stress testing and burn-in. In fact, we create a margin in memory and core clocks (by using lower clocks) to increase reliability and long life.
- Tesla products are manufactured by NVIDIA and come with a 3-year warranty
- Tesla customers receive enterprise support and have higher priority for CUDA bugs and requests for enhancements
- Tesla products have long availability cycles ranging from 18 to 24 months and NVIDIA gives its customers a 6 month EOL notice before discontinuing a Tesla product.
 
Zuletzt bearbeitet:
Lilz schrieb:
So wie ich das sehe bringt es genauso wenig, eine GTX480 mit einer Karte zu vergleichen die es noch nicht gibt... ihm wurde zu der Tesla auf Basis des GT200 geraten.. und nich zu den Fermi-Teslas (die es wohl noch nicht gibt). Und somit sollte doch alles klar sein oder?

Und von dem naechsten wird einem double precision wichtig geredet, die wir nicht brauchen :rolleyes:
 
RodriguezFatz schrieb:
@AndrewPoison
Weiter oben wurde mir von irgendwelchen zweifelhaften "Experten" empfohlen die professionellen Karten zu kaufen anstatt der 480er. Mein Vergleich hat nicht in die Irre gefuehrt, sondern nur gezeigt, wie schwachsinnig der Vorschlag war. Lies dir doch bitte den ganzen Thread durch, dann muss ich nicht alles zweimal erklaeren...
@silent-efficiency
Danke!

Du als TE sprachst ja auch von professionellem Arbeiten mit CUDA worauf Du Antworten bezüglich einer professionellen CUDA Arbeit erhalten hast. Hättest Du von Anfang an geschrieben, dass die CUDA Performance der von Dir in´s Auge gefassten GTX 480 voll und ganz ausreicht wäre diese Diskussion nicht im geringsten aufgekommen.

Und was den ganzen Thread durchlesen angeht, ich hab´s eben gemacht und mir nur gedacht, für jemanden der Hilfe sucht ein äußerst schnippisches Verhalten. Darum merke Dir für die Zukunft, mit Freundlichkeit (und genügend Infos im Eingangspost) kommt man meist schneller zum Ziel wie mit der "Kopf durch die Wand" Mentalität.

Was Deine Fragen selbst angeht, SLI wird nur für Beschleunigung der Grafikausgabe benötigt und ist für CUDA Programmierung daher irrelevant.

SLI and CUDA are orthogonal concepts. The first is for automatic distribution of rasterization, the second is for addressing direct execution of code on the GPU. CUDA is not used for rendering (on- or offscreen). That is when using CUDA you can simply list all available cards in the machine and directly submit code to execute. This code has nothing to do with shader code - it is C-like. So you have a lot more control of what happens where and when.
Quelle

Was die Anbindung der PCIe Steckplätze angeht so ist es abhängig davon, was für ein Mainboard Du Dir zulegen willst bzw. bereits zugelegt hast. Je nach Chipsatz werden hierbei die 16x PCIe Slots mit voller Anzahl an Lanes angesteuert oder entsprechend beschnitten. Eine Übersicht was die Chipsätze können findet man auf der Wikipedia: AMD, Nvidia und Intel

Ein anderer CUDA Programmierer hatte sich die selbe Frage auch schon gestellt, in seinem Blog findest Du seine Erkenntnis. Oder als Kurzfassung, CUDA Programme sind nicht so bandbreitenhungrig, als das man einen Unterschied von PCIe 8x auf PCIe 16x (bei PCIe 1.0 Specs) bemerken würde.
 
Zurück
Oben