News Nvidia Tesla K80 rechnet mit bis zu 8,7 TeraFLOPS

MichaG

Redakteur
Teammitglied
Registriert
Juli 2010
Beiträge
12.908
Ein Jahr ist vergangen, seitdem Nvidia mit der Tesla K40 das bis heute amtierende Flaggschiff im Bereich der GPU-basierten Beschleunigerkarten für Hochleistungsrechner vorstellt hat. Seit heute nimmt die Tesla K80 mit bis zu 8,7 TeraFLOPS bei einfacher und 2,9 TeraFLOPS bei doppelter Genauigkeit den Spitzenplatz ein.

Zur News: Nvidia Tesla K80 rechnet mit bis zu 8,7 TeraFLOPS
 
Auf was ist die wesentlich verhältnismäßig schlechtere DP- zur SP-Leistung bei NVIDA zurückzuführen? Architektur?
Vergleicht man diese mit AMD, ist diese ziemlich genau die Hälfte der SP-Leistung.
 
Also gibt es ihn doch, den ominösen GK210. Was mich natürlich zu der Frage bringt, wozu jetzt noch GK210 bringen, wenn doch scheinbar GM200 vor der Tür steht? Ein Schelm wer böses denkt.
 
Helibob schrieb:
Auf was ist die wesentlich verhältnismäßig schlechtere DP- zur SP-Leistung bei NVIDA zurückzuführen? Architektur?
Vergleicht man diese mit AMD, ist diese ziemlich genau die Hälfte der SP-Leistung.

die AMD ist single-chip. wird wohl daran liegen
 
possess schrieb:
Die AMD FirePro S9150 hat nur einen Hawaii-Chip nicht zwei wie im Text angegeben.
Eben. Schon komisch, wie man so einen Fehler machen kann ^^
 
Schön, dann hat es Nvidia endlich geschafft, mit 2 GPUs etwas besser zu sein als AMD mit einer Hawaii-GPU. :freak:
 
hmm die Tabellenwerte im Vergleich zu den 1-Chipigen AMD Karten sehen ja nicht schlecht aus ;-)
vielleicht sollte man der fairness halber aber auch noch stärker betont angeben, dass das bei Nvidia absolute Peak-werte sind
-> gerade der "GFLOPS (DP) pro Watt" Wert in der Tabelle sieht sonst etwas aus wie ausm Nvidia Marketing....
die Karte schafft auf Dauer nämlich eher so knapp 1,9TFLOPs DP....
und das sind dann ehr so "nur" 6,23 GFLOPS (DP) pro Watt.

sogar nvidia selber gibt das relativ transparent an:
http://www.nvidia.com/object/tesla-servers.html
 
Zuletzt bearbeitet:
Krass, auf dem Rechner in vollen Details und max. Auflösung DOOM zocken dürfen, das wärs... Wie viele FPS da wohl drin währen (Max Details)?
 
nitnoS schrieb:
Schön, dann hat es Nvidia endlich geschafft, mit 2 GPUs etwas besser zu sein als AMD mit einer Hawaii-GPU. :freak:
Soll das ein Versuch des Trollens sein?:D

Sorry, aber der ist mal gründlich schiefgegangen.
 
Nein, das war voller Ernst. Das steht sogar so im Artikel:

Damit übertrifft die Tesla K80 AMDs FirePro S9150 mit einer Hawaii-GPU, benötigt dafür aber mehr Strom und liegt bei der Effizienz hinter der AMD-Karte.
 
r4yn3 schrieb:
Also gibt es ihn doch, den ominösen GK210. Was mich 9natürlich zu der Frage bringt, wozu jetzt noch GK210 bringen, wenn doch scheinbar GM200 vor der Tür steht? Ein Schelm wer böses denkt.

Gut möglich dass ein einzelner GM200 langsamer, etwas langsamer ist. Der dürfte später kommen da NV offensichtlich noch viele große 28nm Chips loswerden will und muss, zudem ist 20nm oder darunter bei TSMC extrem teuer und derzeit auch nicht wirklich nötig.
 
estros schrieb:
Soll das ein Versuch des Trollens sein?:D

Sorry, aber der ist mal gründlich schiefgegangen.

oach da muss ich ihn mal unterstützen denn sooo nach hinten ging das ja nich los, bei ner Neuvorstellung die 6,23 GFLOPS (DP) pro Watt auf Dauer bringt ;-)
(Details s.o.)
 
Wenn man der Gerüchteküche glauben möchte, hat Nvidia anscheinend in letzter Minute den großen Maxwell gecancelt, und dann ist das jetzt nunmal genau das Konkurrenzprodukt zur S9150 und da sprechen die Werte nunmal für sich.
 
@hpvd, nitnos
Genau, weil ja die theoretisch maximal erreichbare Rechenleistung in 64 bit das einzige ist was so ein Rechenknecht ausmacht... :freak:
 
Helibob schrieb:
Auf was ist die wesentlich verhältnismäßig schlechtere DP- zur SP-Leistung bei NVIDA zurückzuführen? Architektur?

AMD nutzt 2 Shadereinheiten für DP Berechnungen. Eine CU mit 64 Shadereinheiten entspricht bei DP-Berechnung 32 Einheiten->2:1. Bei Nvidia sind extra FP64-Units verbaut. Auf 192 Cuda-Cores pro SMX-Block kommen 64 FP64-Units bei den großen Chips->3:1. Beim GK104 und kleiner kommen auf 192 Cuda-Cores nur noch 8 FP64-Units->24:1.
 
bensen schrieb:
@hpvd, nitnos
Genau, weil ja die theoretisch maximal erreichbare Rechenleistung in 64 bit das einzige ist was so ein Rechenknecht ausmacht... :freak:

sicher nicht alles. Hängt stark von der Anwendung ab. Von der Hardware Seite ist SP-Leistung je nach Anwendung auch wichtig.
Bei beidem ist natürlich die Effizienz/Watt ziemlich wichtig.
Auch die gebotenen Software drum herum hat einen großen Anteil (hier ist NV sehr gut!)
Aber auch die Unterstützung von vorhandenen offen Standards (OpenCL) ist/wird zunehmend wichtiger...
Keine Sorge wir wissen schon wovon wir sprechen - und würdigen das gesamt Paket :)
trotzdem muss man bei dieser neuen Hardware nicht unbedingt jubeln...
 
Zuletzt bearbeitet:
Zurück
Oben