News AMD FirePro W9100 mit 16 GB VRAM als neues Flaggschiff

Ach da ist nur eine GPU drauf? Unglaublich...nach der Ankündigung der Titan Z dachte ich, dass es sich hier auch nur um MGPU Modell handelt, und hab somit die News nur kurz überflogen.
Ziemlich beachtlich.

Wie genau funktioniert denn das mit dem DP:SP Verhältnis. Hawaii wurde schon von im vorhinein auf 1:2 konstruiert, und lediglich im Comsumerbereich bislang gedrosselt, sehe ich das richtig?
Wo liegt hier die technische Limitierung um nicht gleich ein 1:1 Design zu entwickeln?

Und tut zwar nichts zur Sache, aber hier werden ja dann scheinbar 32 4Gbit Chips verbaut. Gibts denn schon Infos zu 8Gbit Chips, oder sollen solche erst mit GDD6 kommen?
 
Man muss berücksichtigen, dass die NVIDIA GPUs ein wesentlich größeres Featureset haben als die AMD GPUs, da ist es m.E. nicht verwunderlich, dass die AMD GPUs auch etwas schneller sind.


Wo liegt hier die technische Limitierung um nicht gleich ein 1:1 Design zu entwickeln?

In dem Fall, dass es geteilte Rechenkerne für DP und SP gibt, ist es keine Limitierung sondern eine Optimierung. DP hat 64 bit pro Zahl, während SP 32 bit besitzt. Dadurch benötigt man für eine Rechenoperation zwischen zwei SP Zahlen in etwa halb so viele aber ansonsten identische Teilrechenschritte wie für DP. Deshalb ist es leicht machbar, die Rechenkerne so zu deisgnen, dass sie einen doppelt so hohen SP-Durchsatz erzielen.
 
Wo ist da jetzt das Featureset wesentlich größer? PhysX und Cuda mal ausgenommen, aber das macht wohl kaum was aus.
 
Es geht um das Hardwarefeatureset nicht um die API, wie CUDA oder Physx. Da ist AMD in etwa auf dem OpenCL 1.2 Niveau stehengeblieben, (abgesehen von einigen Hardwarefeatures die es wegen DX OGL besitzt und bislang auch nur dort verwendet) welches sich irgendwo zwischen einer Geforce 285 und dem Fermi befindet.
 
1. Selbst obwohl NVIDIA zwar mit prinzipiellen OpenCL 1.2 Support wirbt, so unterstützt sie momentan nur OpenCL 1.1 da NVIDIA seinen OpenCL nicht mehr weiterentwickelt.
2. Die Hardwarefeatures von OpenCL 1.2 waren afaik alle seit Fermi in NVIDIA GPUs vorhanden. Zusätzlich besassen die NVIDIA GPUs schon damals so einige Hardware-features welche man nur unter CUDA verwenden konnte und welche sich bis heute noch etwas erhöht haben.
 
Könntest du vielleicht etwas konkreter werden, was nVidia Chips denn nun können, was AMD nicht kann? So ist es nur fragwürdiges Wischiwaschi. Bei ECC und ähnlichem wurde ja schon mit Tahiti endlich aufgeholt.
 
So was mir spontan einfällt, ohne Garantie auf Vollständigkeit und ob AMD das vielleicht doch implementiert es jedoch momentan noch über keine API unterstützt:
Free/Malloc im Kernel auf der GPU, Rekursion, Dynamic Parallelism, Warp Vote Functions, Warp Shuffle Functions, UVA, ECC nicht nur für DRAM sondern auch für Register uns Shared Memory (hat AMD das auch?), Hardware-Profiling-Event-Counter

Aber ist halt wie überall: Braucht man die Features sind sie Gold wert, braucht man sie nicht, so sind sie nur unnötiger Balast, welcher Chipfläche kostet. Unter anderem eben deshalb kann man die Hardware nur sehr schlecht an ihrer Peak-FLOP-Zahl vergleichen; hinzu kommt, dass nicht nur die FLops sondern auch der übrige Hardwareaufbau die Performance beeinflussen kann (z.B. 1024 KB Cache bei r290x gegen 1536 KB Cache bei GK110 und 384 Bit Speicheranbindung bei GK110 gegenüber 512 Bit bei der r290x)
 
Zuletzt bearbeitet:
Aber ist halt wie überall: Braucht man die Features sind sie Gold wert, braucht man sie nicht, so sind sie nur unnötiger Balast, welcher Chipfläche kostet. Unter anderem eben deshalb kann man die Hardware nur sehr schlecht an ihrer Peak-FLOP-Zahl vergleichen; hinzu kommt, dass nicht nur die FLops sondern auch der übrige Hardwareaufbau die Performance beeinflussen kann (z.B. 1024 KB Cache bei r290x gegen 1536 KB Cache bei GK110 und 384 Bit Speicheranbindung bei GK110 gegenüber 512 Bit bei der r290x)

Ist dir überhaupt in klaren, in welchen Rechnern solche Karten werkeln, sicherlich nie oder höchst selten in einen selbst gebauten Rechner. Eben zu meist in Fertig-PCs wie die Celsius, HP Z Workstation und in wahrscheinlich bald in irgendeiner Form des Mac Pro. Die meisten nutzen solche GPGPU-Karten nicht mal für Autocad und Ähnliches, da in dem Bereich sogar einfache Low GPUs für die Beschleunigung genügen und die speziellen Funktionen der lizenzierten Treiber brauchen sind eine pure Minderheit, die nicht ansatzweise eine nennenswerte Größe besitzen.

Einzig und allein bei richtigen Renderaufgaben ist der Vorteil einer lizenzierten GPU überwiegend und bringen für den Kosten-Input auch etwas, bei allen anderen Sachen sind die Opportunitätskosten lächerlich und rentabilisieren keine Anschaffung einer Quadro oder FirePro und man muss nur die Benchmarks ansehen. Bei Rendersoftware wie Adobe Aftereffects und Sony Vegas zeigt sich das OpenCL eindeutig beliebter ist durch die Offenheit gegenüber allen Beteiligten Industriepartner und Entwickler im Gegensatz zu Cuda und so schneiden zu meist die FirePro überlegen ab.

Bei Supercomputer werden auch keine spezielle Treiber benötigt, da man Stack-Scheduler benutzt in Verbindung mit eigenen Fortran und Assembler Code.
 
Zurück
Oben