konkretor schrieb:
@Skysnake wäre es dir möglich eine Einschätzung abzugeben für diese Reihe. Du bist ja in dem Bereich mehr als Mittendrin. Falls es deine Zeit zu lässt
Danke
Ich kanns mal versuchen. 😉
Bei den 430X handelt es sich halt um echte HPC Karten die wirklich für den Markt konzipiert und nicht nur mit bedienen. FP64 ist noch immer verdammt wichtig, da die Algorithmen mit FP32 eben teils nicht konvergieren. FP64 ist da einfach ein guter Kompromiss aus Aufwand und Nutzen. Klar kann man oft auch FP32 verwenden, aber das erfordert dann wieder mehr Sorgfalt in der Validierung der Ergebnisse usw. Daher ist FP64 oft einfach die NoBrainer Lösung. Und ja es gibt Bereiche in denen dann auch mit FP128 oder noch mehr gearbeitet wird per CPU Emulation, aber das ist doch eher sehr sehr selten. Hatte ich aber auch schon gesehen.
Mir persönlich fehlt aber hier ganz klar die MI430A Variante. Die Vorteile in der Architektur sind einfach bestechend und mit der Menge an RAM wird es auch noch leichter. Würde auch gerne eine MI430C sehen. Hätte da so manche Anwendungsfälle für. Vielleicht hört AMD ja da mal noch auf mich...
Cabranium schrieb:
Das Feld maximale Genauigkeit ist auch irgendwie mir bei den ganzen News abhanden gekommen. In welchen konkretten Fällen würde man diese maximalle Genauigkeit benötigen?
Die ist nicht Maximal. Es ist einfach der Standard der normal noch in HW Implementiert wird da der Aufwand noch vertretbar ist. FP128 HW gibt/gab es auch aber nur sehr selten. Brauchen auch wirklich nur wenige während FP64 oft benötigt wird.
Benötigt wird das in allen möglichen Konstellationen. Kommt ganz auf dad Löserverfahren an und wie Steif die Probleme sind.
Cabranium schrieb:
Ich tippe jetzt einfach mal ins Blaue und sage sowas wie Wettersimulationen oder Lawienensimulation? Oh! Und natürlich alles was mit dem Weltraum zu tun hat. Kursberechnung usw. Jede Ungenauigkeit könnten da Tausende Kilometer am Ziel vorbei bedeuten. Denke ich in die richtige Richtung?
das wird für alles mögliche benötigt. Von der Verbrennung im Motor über Flugzeugflügeö und Windrose bis hin zu Ölschmierung von Zahnrädern. Wobei da vielleicgt sogar teils fp128 zum Einsatz kommt. Oder halt irgendwelche plastischen Verformungen aka crash Tests usw.
ETI1120 schrieb:
Vergleichen kann man immer. Die Frage ist in wie weit die Emulation tatsächlich echte F64 ersetzen kann.
Das ist die absolut spannende Frage. Wenn der IEERFP64 Standard eingehalten wird, dann ist die Emulation so gut wie die direkte Implementierung. Wenn nicht ist es in meinen Augen erstmal wertlos. Den Schuh zieht sich dann nämlich keiner an...
Btw ist die gleiche Diskussion wie mit Fastmath als Compilerflag.
Kann tun muss es aber nicht und dann hast du ein Problem. Aber das musst du erstmal validieren. Ich sehe nicht das auch nur ein kommerzieller Anbieter dad unterstützen wird wenn es nicht 100% IEEE konform ist. Und nvidia druckst da etwas rum. Vieles geht wohl, aber ein paar Corner Cases machen Ihnen wohl Kopfschmerzen wenn ich die Berichterstattung richtig verfolge. Unklar ist ob die Implementierung insgesamt langsamer wird wenn man diese Corner Cases nutzt oder ob es nur dann langsamer wird wenn man so einen Corner Case triggert. Je nachdem kann die Idee noch immer überragend sein oder im praktischen Einsatz an sich wertlos, abgesehen davon das man halt FP64 überhaupt nutzen kann mot einer gewissen HW die das nativ nicht kann.
ich kann da noch nicht abschätzen in welche Richtung es geht. Wenn nvidia das aber verbockt dann bleibt die H200 für Jahre das beste Angebot für sehr viel kommerzielle Software.
Und da könnte AMD sich dann ins gemachte Nest setzen können. Die Hersteller sind darüber dann nämlich alles andere als Glücklich.
Aber AMD muss das auch erst schaffen... die haben da ja auch einen gewissen "Trackball record" solche Gelegenheiten nicht zu nutzen...
ETI1120 schrieb:
Das Problem bei der Simulation von Wetter ist dass kleinste Abweichungen in den Daten zu komplett anderen Resultaten führen können. Deshalb werden die Modelle zigfach mit Variationen in den Eingangsdaten durchlaufen
Nicht nur das. Du hast zu wenig Inputdaten mit zu wenig Genauigkeit so das du eh den Input interpolierst. Du hast also schon eine gewisse Unsicherheit was denn überhaupt der Istzustand ist.