News Großauftrag: Nvidia setzt auch für kommende GPUs auf Samsung

xexex · 20. Dezember 2020

Unlimited1980 schrieb:
Die Realität heißt RX 6800 XT und die zeigt auf, welche gravierenden Vorteile 7nm in Wikrlichkeit hat...

Ja? Welche denn? Verbrauchen die AMD Karten etwa erheblich weniger Energie oder sind schneller als die Nvidia GPUs? Ist die Verfügbarkeit der Karten etwa besser? Wären die Vorteile so gravierend, dann hätte AMD weit davon ziehen müssen. In Wirklichkeit hat Nvidia "trotz" Samsung geliefert und AMD lässt noch immer im N7 Prozess herstellen.

Wenn jemand durchaus einen guten Vergleich zwischen den Prozessen ziehen kann, dann ist es wohl Nvidia. Sie stellen nun mal ihre Ampere GPUs für den Serverbereich im TSMCs N7 Prozess und die Ampere GPUs für den Grafikbereich in Samsung 8nm Prozess her.

Unlimited1980 · 20. Dezember 2020

xexex schrieb:
-Komplettzitat entfernt-
Wie es richtig geht, ist hier nachzulesen.

AMD hat die RX 6800 XT taktmäßig bei weitem nicht ausgereizt, zugunsten des Energieverbrauchs... und ja, sie verbraucht deutlich weniger bei serienbetrieb... Sie ist nichtmal beim Energieverbrauch ausgereizt: Du kannst die RX 6800 XT bei Serientaktung erheblich undervolten!!!!

Du hast also die Wahl, du bist bei AMD mega flexibel.
Wenn du auf Raytracing verzichten kannst, dann ist AMD der klare Winner bei Preis, Leistung, Effizienz!

Es gibt sogar so viel OC Potential: mit OC schlägt eine RX 6800 XT eine 3090 Ti in Rasterizing.
Das ist der helle Wahnsinn.
Die NV Karten bekommst du grade mal ein paar Mickerprozente OC, da sie einfach schon am absoluten Limit ausgeliefert werden. Diese Monsterkühler sind auch ein ZEichen dafür:
NV hat vielleicht Geld bei den CHips gespart, mussste das aber wieder in die komplexere Strpomversorgung und in die Monsterkühler reinverschwenden, da ist in Bilanz nicht viel/nichts gewonnen. Dazu noch der teuere RAM und der insgesamt teuere breitere Memorybusaufbau.
Dann verlgeich mal die Die Size (AMD) 520 mm² vs (NV) 628 mm².
Tjaaaaaaa.... das sieht nicht gut aus. Mehr diesize heißt auch es passen weniger chips auf einen Wafer, sprich die Produktion ist teuerer pro CHip und es kommt hinzu, dass die Wahrscheinlichkeit für Fehler mit jedem mm2 zum quadrat ansteigt.

Nicht nur wegen der diesize, auch durch den Betrieb am Limit gehe ich davon aus, dass auch einiges an der MArge verloren durch die schlechtere CHipausbeute. NV wird sich, denke ich künftig von der LUxusmarge verabschieden müssen, die sie gewohnt sind. Genauso bei INtel.
Ich denke, es war von NV niemals geplant, die 3080 so nah am LImit zu betreiben und dadurch all die zusätzlichen o.g. Kostenfaktoren zu haben.
AMD hat NV dazu gezwungen... nachdem die NV-Chips schon fertig waren.
Mehr geht einfach nicht mit diesen CHips. derzeit.

Ich denke unterm Strich ist die Marge bei AMD Karten besser, obwohl sie billiger sind.

Allerdings, wie gesagt, ich finde es dennoch super gut, dass dank NV gerade mit Samsung ein zweites hoffentlich tragfähiges Bein im HighendGPU-Chipmarkt herangezüchtet wird. ABer auch hier: wenn Samsung besser wird, werden sie auch selbstbewusster und werden safe die Preis anheben, sobald sie erstmal den Fuß in der Türe haben. Ich denke mal, genauso wie die CHips, sind die Preise aus Sicht von Samsung derzeit auch am absoluten Limit kalkuliert... die diesize ist da ein klarer Hinweis drauf... größerer Chip und billigere Fertigung, das lohnt sich nicht auf Dauer so wirklich für Samsung. Die Preise werden nicht so bleiben können: Samsung wollte einfach diese Fertigung machen, um fast jeden Preis. Markteintritt ist niemals kostenlos. Aber wenn man mal drin ist, dann werden die Preis angehoben.

X8Koenig · 20. Dezember 2020

andr_gin schrieb:
1.) 7nm TSMC ist nicht gleich 7nm TSMC.

GA100 hat 65 Mio. Transistoren pro mm²
Radeon 6800XT hat 50 Mio. Transistoren pro mm²
Die 5700 XT hat 40 Mio. Transistoren pro mm²
Alles in 7nm TSMC gefertigt.

Zum Vergleich GA102 in Samsung 8nm hat 45 MTrans/mm²

Das hat mit dem Prozess, ja - aber erstmal bedingt was zu tun wie Du es sagts, also die theoretische Packdichte wird gerne für RAM oder sehr regelmäßige Zellstrukturen angegeben. Das wirkliche Design sieht aber oft anders aus. Und das wichtigste dabei ist: Man muß es routen können (jede Zelle braucht VDD, Ground, Clk, Din, Dout, etc...) und das Placement muss passen(ein Block einer Schaltung muß ja physikalisch iregendwo liegen. Ein und Ausgangssignale müssen da ja irgendwie hinkommen - Stichwort Metal layer -routing eben) . Daher weichen die tatsächlichen Packdichten pro Design erheblich ab.... Und welche Anforderungen an das Timing gestellt werden, hat auf beides grossen Einfluss (also grob gesagt, ob ich meine Schaltung auf 2,2GHz max Clk auslege oder 2.5GHz)....

Ach und nochwas: da sind natürlich noch analoge Schaltungsteile drauf (die PHY's für z.B Memory und PCIe) und die skalieren nich mit dem Prozeß (z.b.12nm Analog ist nicht wesentlich größer als 7nm analog) , deswegen wundert es micht nicht, das die großen Chips die höheren Pakungsdichten haben... der Analogteil ist gemessen an der Gesamtgröße kleiner.

andr_gin schrieb:
2.) Das Märchen vom schlechten Yield bei Samsung glaubt doch nicht ernsthaft jemand. Samsung setzt 10nm (deren 8nm sind ein Marketingname für 10nm++) schon seit Mitte 2017 in der Massenfertigung ein. Das ist ein ausgereifter Prozess.

Das Märchen von schlechten Yield war meiner Meinung nach keins, das war schon real in der Vergangenheit, nur langsam glaube ich so einfach ist das im Falle von Samsung nicht.... es ist nicht egal wie groß ein Chip ist und wie er mit dem Thema Defect density umgehen kann.... auffällig ist jedenfalls, das recht wenig Firmen Samsungs leading edge Prozesse benutzen...und das obwohl die signifikant günstiger sind..... speziell denke ich da an 7nm, passt jetzt nicht ganz aber....... aber auch 8nm wer benutzt das denn...

andr_gin · 20. Dezember 2020

1.) Dass man die Packdichte von SRAM Zellen nicht 1:1 vergleichen kann sollte klar sein aber wenn man eine GPU mit der anderen vergleicht dann bekommt man hier schon ein ganz gutes Bild.

2.) Das mit den analogen Bauteilen mag zwar in der Theorie stimmen aber bei einem High End Chip um die 600mm² oder mehr hat das keine großen Auswirkungen mehr. Hier mal ein Vergleich:
GA102: 45,06 Mtrans/mm²
GA104: 44, 27 Mtrans/mm²

3.) Klar sind die Chips groß aber gerade bei der 3080 hat man doch mehr als genug ungenutzte Shader, die man bei Defekt abschalten kann.

4.) Intel hat seine eigene Fertigung, AMD ist von GF gleich auf TSMC 7nm gewechselt und für die den Mobilmarkt sind 10nm einfach nicht stromsparend genug. Das wären dann mal die bekanntesten Abnehmer.

Diablokiller999 · 21. Dezember 2020

mkossmann schrieb:
Nö, sie haben vermutlich nur die profitablere Alternative gewählt.
Nehmen wir an das Angebot von Samsung wäre gewesen : Wir können 15000 ( ausreichend gute) GA102 pro Monat für 10$/Stück liefern. Und von TSMC 10000 (bessere) GA102 pro Monat für 15$/Stück.
Welches Angebot würdest du als Entscheider bei NVidia wählen ?

Man macht das pro Wafer, nicht pro Chip.
Samsung kann weniger Chips pro Wafer liefern, die aber schlechter bei hohen Taktraten sind.
Ergo gibt es beim hoch prügeln des Chips (sieht man an der TDP der Karten, im Sweetspot sind die sicher nicht) weit mehr Abwärme, was in einem teureren Kühlsystem endet. Dadurch wohl auch die extrem guten Kühler bei den FEs, was aber den Boardpartnern wieder nicht schmecken wird.
Da hat Nvidia vielleicht ein paar Dollar in der Chipfertigung gezahlt, lässt dafür beim Kühler mächtig Federn, so eine Vapor-Chamber ist nämlich nicht günstig. Zumal auch die Frage ist, wie der Yield bei Samsung so ist, die haben keine große Erfahrung mit GPUs in ihren Straßen und so hohen Takt können die Teile nicht fahren.

foo_1337 · 21. Dezember 2020

Unlimited1980 schrieb:
Es gibt sogar so viel OC Potential: mit OC schlägt eine RX 6800 XT eine 3090 Ti in Rasterizing.
Das ist der helle Wahnsinn.

Ja, der helle Wahnsinn. Hast du dir neben der Clickbait Überschrift auch die Slides im Video angeschaut?
Ich suche sie mal raus. Der einzige relevante Benchmark, wo die OC 6800XT die 3090 schlägt, ist in pupg bei 1440p. In 4k sieht sie bei weitem kein Land.
Seltsam ist in diesem Benchmark zudem, dass die 3090 schlechter als die 3080 in 1440p ist. Vermutlich vertauscht.

X8Koenig · 21. Dezember 2020

andr_gin schrieb:
2.) Das mit den analogen Bauteilen mag zwar in der Theorie stimmen aber bei einem High End Chip um die 600mm² oder mehr hat das keine großen Auswirkungen mehr. Hier mal ein Vergleich:
GA102: 45,06 Mtrans/mm²
GA104: 44, 27 Mtrans/mm²

hmm... schlecht gewähltes Beispiel um meinen Punkt zu entkräften. GA104 hat ein 256bit breites Speicher Interface GA102 ein 384 bit breites, da sind die PHY's schon deutlich kleiner (GA104).... ...hier mal ein Die Shot von Navi 10... die Memory PHY's sind analoge Blocke und die von PCIe und vom Display IF auch, die PLL wird das Graue in der Mitte sein ....also das ist alles nur Theorie? Macht schon was aus von der Die Fläche, oder?

andr_gin · 22. Dezember 2020

Das Speicherinterface wird annähernd linear mit dem Rest des Chips skalieren. Bei 50% mehr Shader wird auch ein um 50% breiteres Speicherinterface verwendet werden.
Natürlich gibt es hier immer kleinere Abweichungen. Eventuell kann man mit dem sehr kompakten Infinity Cache und noch der Unterschied zwischen den 40 MTrans bei der 5700 XT vs. 50 MTrans bei der 6800 XT erklären aber mit Sicherheit nicht den Unterschied zwischen 40 MTrans bei z.B. der Radeon VII und den 65 MTrans beim GA100. Diese starken Abweichungen von +60% hat es bei keiner der vorhergehenden Generationen gegeben egal ob AMD oder Nvidia oder wie groß der Chip war.

Hier mal ein weiteres Beispiel mit 12nm TSMC:
GV100: 25.9MTrans/mm²
TU102: 24.6MTrans
TU104: 25 MTrans
TU106: 23.8 MTrans

X8Koenig · 23. Dezember 2020

andr_gin schrieb:
Das Speicherinterface wird annähernd linear mit dem Rest des Chips skalieren. Bei 50% mehr Shader wird auch ein um 50% breiteres Speicherinterface verwendet werden.

Nein - eher nicht -> 2060 Super 256bit -> 3080 320bit um mal eben diese merkwürdige Verallgemeinerung in Frage zustellen .. oder RX 5700XT vs 6800XT - 256bit zu 256bit....Performance Unterschiede sollten bekannt sein....

andr_gin schrieb:
Natürlich gibt es hier immer kleinere Abweichungen.

Ja gibt es.

andr_gin schrieb:
mit Sicherheit nicht den Unterschied zwischen 40 MTrans bei z.B. der Radeon VII und den 65 MTrans beim GA100. Diese starken Abweichungen von +60% hat es bei keiner der vorhergehenden Generationen gegeben egal ob AMD oder Nvidia oder wie groß der Chip war.

..... überlege mal, warum ist das bloß so? Vega 10 (und damit auch Vega 20) basiert auf CGN 5, eine Archtiektur die für 14nm GF designed war und 2017 schon 1 Jahr zu spät in Serie ging. Die Urspünge dieser Archtektur sind ziemlich veraltet und waren nie für 7nm designed.... und da wunderst Du Dich das die Packungsdichte so schlecht ist in 7nm TSMC?....ich jedenfalls nicht.

Das war ein reiner Shrink auf 7nm einer anderen Technologie mit minimalem Aufwand. Kleines Design Team, kleines Budget keinerlei "unötige" Optimierungen, (RTL/Verilog) Code so wenig wie möglich anfassen, schnellstmöglich timing clean kriegen ..... das war der 7nm Testchip für AMD, den man auch kaufen konnte....und den vergleichst Du mit GA100, einer 826mm2 Scherbe.... für high end computing mit aktueller Archtektur designed für 7nm?

Und zum Thema Skalierung mal ein Statement von TSMC... (Beispiel 5nm)

https://fuse.wikichip.org/news/3398/tsmc-details-5-nm/

Unlimited1980 · 24. Dezember 2020

foo_1337 schrieb:
-Komplettzitat entfernt-
Wie es richtig geht, ist hier nachzulesen.

Lool.. ja da stimmt echt was nicht wenn man 3080/3090 vergleicht!
Ist mir tatsächlich nicht aufgefallen, da ich nur AMD und NV verglichen habe...

Allerdings ändert sich dadurch an der Ausaage nichts, dass die 6800 XT oc die 3090 schlägt bzw an sie rankommt

Unlimited1980 · 25. Dezember 2020

NguyenV3 schrieb:
-Komplettzitat entfernt-
Wie es richtig geht, ist hier nachzulesen.

Also die Sache mit dem Steam Survey ist echt ein Argument

Suche

News Großauftrag: Nvidia setzt auch für kommende GPUs auf Samsung

xexex

Fleet Admiral Pro

Unlimited1980

Lieutenant

X8Koenig

Lt. Junior Grade

andr_gin

Commander

Diablokiller999

Captain

foo_1337

Gast

Anhänge

X8Koenig

Lt. Junior Grade

Anhänge

andr_gin

Commander

X8Koenig

Lt. Junior Grade

Unlimited1980

Lieutenant

Unlimited1980

Lieutenant