Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
NewsAngebliche Packaging-Probleme: Nvidia Rubin Ultra reizt CoWoS-L von TSMC aus
Seit Wochenbeginn wird spekuliert, ob Nvidias Rubin Ultra wirklich wie geplant Ende 2027 kommen wird. Laut aktuellen Gerüchten, die sich auf Analysten berufen, scheint es Probleme beim Packaging bei TSMC zu geben. Demnach ist das Produkt wohl zu groß und zu komplex und überreizt so das CoWoS-Design.
Warum? Die einzige Metrik, die hier relevant ist, ist Flops/Watt, und das nicht pro GPU berechnet sondern pro Datacenter. Und das wird immer besser, auch wenn (oder eher gerade weil) der Verbrauch pro GPU steigt.
Als Reticle-Size-Limit in der Branche gilt die Maximalgröße eines einzelnen Chips, der mit gängigen Belichtungsmaschinen Kantenlängen von bis zu 26 × 33 mm bzw. 858 mm² haben kann.
Ich verstehe noch nicht, was Belichtungsmachinen mit Recticlegröße (zumindest in dieser Größenordnung) zu tun haben.
Werden Wafer nicht immer noch im Ganzen belichtet?
Oder ist das ein Yieldproblem?
Warum? Die einzige Metrik, die hier relevant ist, ist Flops/Watt, und das nicht pro GPU berechnet sondern pro Datacenter. Und das wird immer besser, auch wenn (oder eher gerade weil) der Verbrauch pro GPU steigt.
Oder, um einen Vergleich mit CPUs zu wagen: Es ist besser, eine CPU mit einem 16-Channel-I/O-DIE und 16 CCDs zu konstruieren als in gleicher Gen ein Dual-Sockel-Board mit zwei 8-Channel-I/O-DIEs und 8CCDs. Ersteres wird zwar als einzelnes Package betrachtet das doppelte an Strom schlucken, die Plattform insgesamt wird aber weniger brauchen und höhere Performance bringen. (da die Latenzen auf Grund der reduzierten Distanz geringer ausfallen)
Warum sollte das so sein? Ich finde Nutzen/W z.B. viel relevanter. Wobei "Nutzen" natuerlich nicht so leicht zu messen und sehr abhaengig von der Art der Nutzung ist. Jedenfalls steigt in vielen Bereichen der Nutzen nicht linear mit dem Aufwand. Wenn z.B. ein typischer Nutzen von AI der ist, dass ein Arbeitgeber 20% seiner Belegschaft kuendigen kann und (vorerst) dafuer weniger an Big Tech abliefern muss als die Lohnkosten dieser 20% vorher waren, und er mit den hoeherverbrauchenden AI-Chips jetzt 21% kuendigen kann, wird der Mehrertrag fuer Big Tech dann tatsaechlich so stark steigen wie die zusaetzlichen Energiekosten?
Warum sollte das so sein? Ich finde Nutzen/W z.B. viel relevanter. Wobei "Nutzen" natuerlich nicht so leicht zu messen und sehr abhaengig von der Art der Nutzung ist. Jedenfalls steigt in vielen Bereichen der Nutzen nicht linear mit dem Aufwand.
Das ist aber anwendungs-, anwender- und vor allem auch interpretationsabhängig. Was du als schlecht ansiehst, sieht der nächste als guten Nutzen an. Rechenleistung/W ist halbwegs objektiv (auch bedingt anwendungsabhängig) - was mit der Rechenleistung getan wird, kann dann jeder selbst entscheiden.
Warum? Die einzige Metrik, die hier relevant ist, ist Flops/Watt, und das nicht pro GPU berechnet sondern pro Datacenter. Und das wird immer besser, auch wenn (oder eher gerade weil) der Verbrauch pro GPU steigt.
Kein wunder das immer mehr Leaker sagen, 3nm RTX 6000 für Gamer kommt evtl erst 2028.
Ganz schöne durststrecke, von 2022 bis 2028 den gleichen Prozess für RTX GPU,s bei Nvidia.
Energie sind Wattstunden, Leistung sind Watt. Ein Chip mit 3000 W Leistungsaufnahme, der für 1s läuft, um eine Berechnung durchzuführen, "verballert" absolut weniger Energie als ein Chip mit 300 W Leistungsaufnahme, der für die gleiche Berechnung eine Minute benötigt. Darum ist es sehr viel ökonomischer, bei z.B. Folding@Home eine 600 W RTX 5090 zu nutzen als eine 160 W RTX 2060.
erstmal ist es mehr pro Chip und wieviel besser als bisherige Chips kann den Rubin die anstehenden "KI"-Aufgaben lösen? Aufgrund der Beschränkung des "I" vermute ich mal, daß hier mit Atombomben auf den Spatzen-Grenznutzen geschossen wird.