Sam Altman DRAM Deal

Der Artikel (bzw das Video) ist sogar schon vom 1. Oktober und wurde auch schon von anderen Seiten und Zeitungen aufgegriffen. Ein Gerücht würde ich es auf Grund der Faktenlage nicht nennen, scheint schon Fakt zu sein. Ob es aber 40% des Marktvolumens sind bleibt zweifelhaft, würde aber die aktuelle Lage ein stückweit erklären.
 
  • Gefällt mir
Reaktionen: Scheinriese und Fragger911
OpenAI isn’t even bothering to buy finished memory modules! No, their deals are unprecedentedly only for raw wafers — uncut, unfinished, and not even allocated to a specific DRAM standard yet. It’s not even clear if they have decided yet on how or when they will finish them into RAM sticks or HBM! Right now it seems like these wafers will just be stockpiled in warehouses
Ist das echt?
Edit: Ok, die Quelle sagt, dass es da wirklich um Wafer geht. Zu Bloomberg (die Primärquelle?) bin ich nicht durchgedrungen. Die haben eine Paywall.
Edit 2: Samsung sagt selber, dass der Deal bis zu 900k Wafer umfassen kann.

Wie soll das überhaupt alles verarbeitet werden? 40% der Welt-RAM-Produktion kann man ja nicht mal eben in der Garage in zwei, drei Wochen zu 'nem Riegel verlöten. Man braucht da entsprechende Fabriken, die diese Mengen auch in annehmbarer Zeit in nutzbare Produkte weiterverarbeiten können. Da muss es noch mehr Deals geben.
Was machen denn die anderen Firmen (z. B. Packaging und weiß-der-Geier), die jetzt 40% weniger Chips bekommen, um sie weiterzuverarbeiten? Auf der Katastrophenskala liegt das gleich hinter Vulkanausbruch, Überschwemmung und Krieg.
 
Falls man die Wafer überhaupt weiter verarbeiten will und nicht einfach nur anderen wegnehmen möchte.
Es macht doch n überhaupt keinen Sinn das so zu kaufen…
Wenn OpenAI die Wafer nicht verwendet, dann fände ich das schon kriminell,
 
  • Gefällt mir
Reaktionen: Scheinriese
Ist doch schon länger klar warum es teurer wird. Wer da was kauft ist eigentlich nebensächlich.
 
Ja aber die Erwartungen an der KI wird maßlos überschätzt. Ich denke in 6 Monaten haben wir ein Überangebot von RAM und RTX5090 und all das andere Zeugs.
 
K3ks schrieb:
2. Ich halte nicht viel von MLID.
aber er hat doch schon das komplette zen 6 und zen 7 lineup vorgestellt und vor ein paar jahren hatte er schon mal recht. Mega gute Quelle und man weiß genau welche Produkte in den nächsten 5 Jahren auf den Markt kommen. Mega gute und belastbare Quelle.
Was 1 Typ im Internet sagt ist immer 100% korrekt (:
Ergänzung ()

Independent schrieb:
Ja aber die Erwartungen an der KI wird maßlos überschätzt.
Ja, aber die Erwartungen an KI werden maßlos überschätzt.

LLMs haben ihre validen Anwendungsfälle.

Der Bedarf an Compute für Inferenz und Reinforcement Learning steigt derzeit noch exponentiell. Gerade Agentic AI kann sehr nützlich sein, wird derzeit jedoch noch fast nirgendwo in großem Maßstab eingesetzt.

Das ChatGPT-Webinterface und die Apps sind ein winziger Bruchteil dessen, was gebraucht wird.

Diese Last wird nicht einfach verschwinden, höchstens die Wachstumsrate wird in den nächsten Jahren abflachen.

Der RAM-Teil kann durch Architekturverbesserungen besser werden. Da fallen direkt Dinge wie Tiny Recursive Models, MoE und das, was zum Beispiel DeepSeek bei Key-Value-Caches gemacht hat, ein. Aber all das geht mit mehr benötigter Rechenleistung einher.

Es werden weitere ASICs von x Anbietern kommen. Jeder Hyperscaler und so gut wie jede relevante Firma in der Halbleiterindustrie arbeitet daran.

Klar, Nvidia bekommt da in den nächsten 2–3 Jahren ordentlich Konkurrenz, und auch CUDA wird sie nicht ewig schützen. Wenn das Beinahe-Monopol von Nvidia aufweicht, wird es vermutlich an der Börse unangenehm. Sollte das bei anderen Unternehmen zu Umsatzeinbrüchen führen, kann es schon sein, dass die benötigte Leistung einbricht.

Aber:

Gerade fehlt es an allen Ecken an Kapazität, und das, was gerade genutzt wird, wird nicht einfach wieder verschwinden. Der Trend geht auch zu Modellen mit mehr, aber weniger aktiven Parametern. Das geht vor allem auf den RAM, auch wenn es hilft, Interconnect-Bandbreite zu sparen.

Auf Openrouter wurden vor einem Jahr noch 300 Milliarden Token Pro Woche verarbeitet. Inzwischen sind es 7 Billionen. Das ist faktor 20 mehr Nutzung bei einer sehr kleinen Plattform. OpenAI spielt hier nicht einmal eine Rolle.

Dennoch stimme ich dem Teil, den ich von dir zitiert habe, zu: Endkunden wird mehr versprochen, als mit Transformern alleine realisierbar sein wird.
Viele Tools die gerade entstehen, sind mit entsprehcenden Leitplanten sinnig und immer mehr Menschen gewoehnen sich daran.
Ergänzung ()

Krik schrieb:
Wie soll das überhaupt alles verarbeitet werden? 40% der Welt-RAM-Produktion kann man ja nicht mal eben in der Garage in zwei, drei Wochen zu 'nem Riegel verlöten. Man braucht da entsprechende Fabriken, die diese Mengen auch in annehmbarer Zeit in nutzbare Produkte weiterverarbeiten können.
Yep. Verfahren wie CoWoS, die hier u.a genutzt werden, sind auch am limit und wurden die letzten 2-3 Jahre schon deutlich ausgebaut.
 
Zuletzt bearbeitet:
Auf der Katastrophenskala liegt das gleich hinter Vulkanausbruch, Überschwemmung und Krieg.
Hab ich mir auch gedacht, das ist jetzt die Woche schon die zweite Medien Hiobsbotschaft die ich gelesen habe, erste war Netflix kauft Warner, zweite ist die hier.

Irgendwie geht es nur noch Richtung Monopole
 
  • Gefällt mir
Reaktionen: madmax2010
Deimonos schrieb:
Irgendwie geht es nur noch Richtung Monopole
Ich glaube der LLM Bereich ist der einzige, in dem gerade immer Mehr Konkurrenz entsteht, jedoch arbeiten bis auf wenige innovative Ausnahmen, wie sakana.ai, mit den gleichen Paradigmen.

Aber ja die generelle Monopoltendenz in BigTech geht mir gehörig auf den Keks :)
 
Deimonos schrieb:
Michael Burry ist wieder am shorten. :evillol:
Der hat von den letzten 5 crashes 20 zuverlässig vorhergesagt.




Deimonos schrieb:
Wie passt das überhaupt zusammen 40% vom weltweiten DRAM kaufen und und hundert Millionen Kunden haben die nicht bezahlen ?
Normal. Bei startups geht es nicht um Profite sondern Marktanteile und kundenbindung.
Ebenfalls muss Geld möglichst schnell investiert werden
Bringt den Investoren kurzfristig mehr Profite, da durch Marktmacht die Anteile mehr werden und dadurch, und durch hohe Ausgaben, weitere Finanzierungsrunden werden.
Hier können Anteile dann besonders profitabel angestoßen werden, und Das Unternehmen wird höher bewertet.

Sie könnten free accounts auch schließen und profitabel arbeiten. Dann sinkt Ihre Bewertung, weil andere mehr Zugriffe bekommen.
Profitabel erhöhen Sie nicht das Kapital und Anteile werden nicht neu bewertet

Startups sind weird.
 
Falls das hier kaputt gehen wird, ist weltweit rund um AI schon mehr Geld drin als bei den Häusermarktwetten bei der Finanzkrise 2007 ?
 
  • Gefällt mir
Reaktionen: Hatsune_Miku
Deimonos schrieb:
Falls das hier kaputt gehen wird, ist weltweit rund um AI schon mehr Geld drin als bei den Häusermarktwetten bei der Finanzkrise 2007 ?
Eindeutig ja! Der Wert aller damaligen Subprime Kredite lag bei ca. 1,3 Billionen €. Nvidia toppt das mit seiner Marktbewertung schon alleine.
Selbst wenn die AI-Blase Luft verliert wird das aber nichts an der Speicherpreisen ändern. Ich befürchte die sind gekommen um zu bleiben. Vielleicht nicht so hoch wie aktuell, aber die den Grafikkarten (Top-Modelle) ist ja auch schon so. 3000€ sind der Durchschnittspreis für eine 5090 und abgesehen von einem Schnapper hier und da wird das auch so bleiben.
Sollte die AI-Blase komplett zerfallen würde das die Hardwarepreise aufgrund von Überkapazitäten natürlich spürbar verbilligen, besonders gebrauchte Hardware. Aber selbst bei mehrfachem Volumen wie die Bankenkrise 2007, wird es kein systemisches Platzen wie 2007 geben. Die Banken wären davon ja nicht betroffen. Es würde halt die großen Techkonzerne treffen.
 
Zuletzt bearbeitet:
Zurück
Oben