News KI-Boom und Speicherkrise: Apple schränkt RAM des Mac mini und Mac Studio weiter ein

@KeinNutzerName Der Grund dafür ist, dass es faktisch keine (preislich vergleichbare) Alternative gibt. Der Mac Studio bietet mit seinen 512GB RAM verhältnismäßig günstig extrem viel GPU Speicher für sehr große lokale LLMs. Eine Alternative wäre z.B. eine Nvidia DGX Workstation, welche aber jenseits 300.000€ kostet. Wenn man lediglich Inferenz betreiben möchte und keine eigenen Modelle trainiert, führt kein Weg an einem Mac Studio für den Preis vorbei.
 
  • Gefällt mir
Reaktionen: TomH22, Hexxxer76, iSight2TheBlind und 3 andere
user_zero schrieb:
Der Mac Mini in Basis Konfiguration 16/256 war mit 599 EUR Straßenpreis ein preis-leistungstechnischer Nobrainer, der hier bei CB und auch auf Reddit gerne empfohlen wurde.
Ich kaufte ihn letztes Jahr gar für 555 € (war eine befristete Rabatt-Aktion) und es ist mein erster Apfel, mit dem ich bisher recht zufrieden bin.
user_zero schrieb:
Ich denke schon, dass es für Apple schmerzhaft ist, sich diese Käufergruppe abzuschneiden. Denn mit 949 EUR UVP ist die Nobrainer-Zeit perdu.
In der Tat! Bei nun fast dem doppelten Einstiegspreis werden viele, die früher günstige "NUC-artige" Kleincomputer gekauft haben, nicht mehr bei Apple zugreifen.
user_zero schrieb:
Aber Du hast Recht: Bekommen sie keine Ware mehr, oder wollen sie den gestiegenen Preis nicht aufrufen und gleich Upselling zur größeren Konfiguration betreiben. Weiß man nicht.
Ich vermute, beides dürfte der Fall sein. ;)
Ergänzung ()

aid0nex schrieb:
Die Frage ist nur: Kann Apple diese Speicheroptionen einfach nur nicht mehr zu realistischen Preisen anbieten oder bekommen sie so viel Speicher überhaupt gar nicht mehr?
Die Antwort liegt wahrscheinlich dazwischen. Apple müsste die Preiserhöhungen vermutlich so an die Kunden weitergeben, dass Maximalkonfigurationen schnell die Preise von Mittelklasseautos überbieten. Und dann ist das ja "nur" ein MacStudo und nicht mal ein MacPro (auch wenn dieser mittlerweile eingestellt wurde). ;)

Was mich mal interessieren würde: Wie viel Prozent der Kunden wählten beim Studio bisher 512 GB RAM? Das dürfte im 0,x Promillebereich gelegen haben.

Was ich mir vorstellen könnte: Wenn man sich gegenüber Apple als "KI-Firma" vorstellt, kann man die alten Konfigurationen weiterhin inoffiziell ordern, dann aber zu astronomischen Preisen.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: iSight2TheBlind und user_zero
aid0nex schrieb:
Die Frage ist nur: Kann Apple diese Speicheroptionen einfach nur nicht mehr zu realistischen Preisen anbieten oder bekommen sie so viel Speicher überhaupt gar nicht mehr? 🤔 Einerseits kann ich mir kaum vorstellen, dass der quasi größte Player am Markt schon nicht mehr genügend Speicher geliefert bekommt, andererseits hatte Apple nach oben hin noch nie Probleme extreme Preise einzufordern, die waren was das anging immer schon sehr selbstbewusst. Ich meine, wer Rollen für ein PC Gehäuse für 850€ und eine Displayhalterung für 1.100€ verkauft, der hat auch kein Problem damit für einen Rechner mit fett viel RAM mitten in einer Speicherkrise epochale Preise zu fordern.
Weder noch, die "Engpässe" betreffen nur die Auslaufmodelle wie den M3 Ultra Mac Studio oder den M4 Mac mini. Apple verkauft den Restbestand aktuell ab und produziert keine neuen mehr, da M5 Ultra Mac Studio und M5 Mac mini bald kommen. Dort wird es die größeren Speicheroptionen sehr wahrscheinlich wieder geben.
 
  • Gefällt mir
Reaktionen: stevefrogs, stefan92x und aid0nex
Mit 60% Reingewinn hätte denen ein wenig Verzicht bei moderater Angleichung des Preises auch nicht geschadet.
 
KeinNutzerName schrieb:
Wenn soundsoviele Leute im Mac Studio 512GB Ram haben wollen und Aple sagt ... nö ...dann würde ich mich doch als Professioneller Anwender (Wo es nicht unbedingt um Geld geht) nach Alternativen umschauen.
Um es nochmal etwas deutlicher zu schreiben als @Slowz:

Tl;Dr:
Diese Alternative gibt es nicht. Den M3 Ultra mit 512 GiB gibt es aktuell noch neu für 16.000. Vorher war er fuer 12.000 bei Apple zu haben.
5x Blackwell 6000 haben 480 GiB und kosten knapp 50.000.

LLM auf CPUs ist wesentlicher langsamer
Die einzige alternative APU ist die AMD 395 (Max: 128 GiB), der Nachfolger 495 wird maximal 192 GiB unterstützen.
GPUs mit 512 GiB kosten deutlich mehr.

Zudem ist das Setup "Mac Studio kaufen" wesentlich aufwändiger als "PC mit 5x/6x Blackwell 6000 aufstellen".
 
  • Gefällt mir
Reaktionen: KeinNutzerName und stevefrogs
950 € für einen Mac mini. Man kann es auch übertreiben.
 
lächerlich, die preise für ram/ssd bei apple sind aktuell 3-4x so hoch wie die übertriebenen scalperpreise, welche schon 2-5x so hoch sind wie die preise davor.
 
w0mbat schrieb:
Weder noch, die "Engpässe" betreffen nur die Auslaufmodelle wie den M3 Ultra Mac Studio oder den M4 Mac mini.
Und gerade beim großen RAM ist es ja so, dass der besonders beliebt ist für LLMs etc. Kann gut sein, dass die größten Modelle einfach als erstes ausverkauft sind und Apple halt schon die neuen M5 vorproduziert, also wirklich diese nicht mehr auf Lager hat.

Man muss halt bedenken, CPU und RAM bilden bei Apple ein gemeinsames Package, das muss Apple schon bei der Chipfertigung festlegen wie viel mit welcher Speicherausstattung produziert werden soll. Praktisch alle anderen CPUs können viel später mit der gewünschten Menge RAM kombiniert werden (wenn wir über "normale" Desktop-Systeme reden ja sogar noch jederzeit durch Austausch von DIMMs).
 
  • Gefällt mir
Reaktionen: iSight2TheBlind und stevefrogs
KeinNutzerName schrieb:
Was ich nicht verstehe, als nicht Mac User.. Wenn soundsoviele Leute im Mac Studio 512GB Ram haben wollen und Aple sagt ... nö ...dann würde ich mich doch als Professioneller Anwender (Wo es nicht unbedingt um Geld geht) nach Alternativen umschauen. Wenn Hersteller XY mir nicht das gibt, was ich haben möchte / brauche, dann wechsle ich doch mit einem freundlichen Lächeln zu einem, der mir bietet, was ich möchte. :confused_alt:
Du kannst nicht einfach so die Plattformen wechseln. Was meinst du was da zum Teil noch irre Lizenzkosten dazukommen bei Software. Evtl. gibt es die Software auch gar nicht auf der anderen Plattform etc.
 
  • Gefällt mir
Reaktionen: Hexxxer76 und KeinNutzerName
prayhe schrieb:
OpenCore Legacy Patcher :) Wobei man es trotzdem nicht übertreiben darf mit den Versionen. Irgendwann reicht die Leistung halt wirklich nicht mehr und das Gerät quält sich nur noch.
wobei jetzt mit tahoe da auch ende sein wird,
wenn dann im kommenden macos dann der ganze intel kernel rausfällt.
weiß einer wann oclp denn tahoe offiziell unterstützen wird.
 
Mh, dann schauen wir mal wenn sie den Mac Mini M5 vorstellen. Wenn das nur ein unnötigen Upsampling wird, damit man für resoucen zahlt die man gar nicht braucht, dann muss ich umplanen.

Die Vorstellung sollte doch anfang juni sein oder?
 
MGFirewater schrieb:
weiß einer wann oclp denn tahoe offiziell unterstützen wird.
Könnte noch eine Weile dauern oder auch gar nicht geschehen. Einer der Hauptentwickler ist letztes Jahr zu Apple gegangen.
Es gibt jedoch den OCLP-Mod fork, der unterstützt Tahoe, aber kann dir da nicht sagen wie gut.
 
  • Gefällt mir
Reaktionen: MGFirewater
Schnack schrieb:
Der M5 zieht bald in den Mini und Studio ein. Speicherkrise ist hier alleine nicht der Grund.
Sagt wer?
Es gibt dazu derzeit absolut keine Gerüchte. Es scheint eher darauf hinauszulaufen, dass es sobald keine M5-Modelle des Mini und Studio geben wird und man hier erst wieder mit dem M6, der ja im Herbst eigentlich schon wieder auf der Agenda steckt, nachliefert.
Ich würde die das wegstutzen von Optionen durchaus als Reaktion auf die Speicherkrise verstehen.

Das ist ja genau das, was alle machen, die RAM-Bausteine verbauen: Die Ressourcen entsprechend umverteilen und priorisieren.
 
Slowz schrieb:
Wenn man lediglich Inferenz betreiben möchte und keine eigenen Modelle trainiert, führt kein Weg an einem Mac Studio für den Preis vorbei.
Sweepi schrieb:
Die einzige alternative APU ist die AMD 395 (Max: 128 GiB), der Nachfolger 495 wird maximal 192 GiB unterstützen.
GPUs mit 512 GiB kosten deutlich mehr.

Zudem ist das Setup "Mac Studio kaufen" wesentlich aufwändiger als "PC mit 5x/6x Blackwell 6000 aufstellen".
stefan92x schrieb:
Und gerade beim großen RAM ist es ja so, dass der besonders beliebt ist für LLMs etc.

man muss aber auch relativieren: mehr ram bedeutet, man kann ein größeres modell mit weniger quantisierung benutzen. aber die geschwindigkeit ist auch ein aspekt.

hier ein benchmarkvergleich zwischen nvidia und apple mit unterschiedlichen modellgrößen:
https://github.com/XiongjieDai/GPU-Benchmarks-on-LLM-Inference

mal rausgepickt: 3070 8gb, einzelne/doppelte 4090 24gb, m2ultra mit 76c gpu und 192gb ram:
(oom=modell passt nicht in den ram, also nicht benutzbar)

llama3 ram verbrauch:
| Model | Quantized size (Q4_K_M) | Original size (f16) |
|------:|--------------------:|-----------------------:|
| 8B | 4.58 GB | 14.96 GB |
| 70B | 39.59 GB | 131.42 GB |

llama3 tokengenerierung:
| GPU | 8B Q4_K_M | 8B F16 | 70B Q4_K_M | 70B F16 |
|----------------------------|-----------|--------|------------|---------|
| 3070 8GB | 70.94 | OOM | OOM | OOM |
| 4090 24GB | 127.74 | 54.34 | OOM | OOM |
| 4090 24GB * 2 | 122.56 | 53.27 | 19.06 | OOM |
| M2 Ultra 76-Core GPU 192GB | 76.28 | 36.25 | 12.13 | 4.71 |

llama3 tokenverarbeitung:
| GPU | 8B Q4_K_M | 8B F16 | 70B Q4_K_M | 70B F16 |
|----------------------------|-----------|---------|------------|---------|
| 3070 8GB | 2283.62 | OOM | OOM | OOM |
| 4090 24GB | 6898.71 | 9056.26 | OOM | OOM |
| 4090 24GB * 4 | 9609.29 | 12304.19| 898.17 | OOM |
| M2 Ultra 76-Core GPU 192GB | 1023.89 | 1202.74 | 117.76 | 145.82 |

also wenn man ein llm mit 131gb verwenden will, dann müsste man 6 4090 verwenden. wenn man allerdings das gleiche modell quantisiert und es nur noch 40gb braucht, sind 2 4090 schneller als der m2ultra. und zwar deutlich: bei der generierung 60% schneller und bei der verarbeitung 660% schneller.

der m2ultra hat ca 12000euro gekostet und die 4090 ca 1800, also 6 davon und noch cpu/ram/ssd etc ist preislich gar nicht so weit voneinander entfernt. aber 2 4090 sind für gewisse einsatzzwecke schon schneller und billiger.
wenn ein kleines llm reicht, ist sogar eine einzelne 3070 bei der generierung wenig langsamer, aber bei der verarbeitung doppelt so schnell. sehr interessant finde ich auch, dass bei der generierung die doppelte gpu minimal langsamer ist als eine einzelne statt doppelt so schnell, da limitiert dann vllt pcie.

dank quantisierung und neuen komprimierungsverfahren von deepseek und google wird mittlerweile nicht mehr soviel ram benötigt.

das fazit vom test lautet:
Buy NVIDIA gaming GPUs to save money. Buy professional GPUs for your business. Buy a Mac if you want to put your computer on your desk, save energy, be quiet, don't wanna maintenance, and have more fun.
 
fineline schrieb:
950 € für einen Mac mini. Man kann es auch übertreiben.
Man muss Apple schon zugestehen, dass ihr Upselling funktioniert. 250 EUR für 256 GB sind schon stattlich. Nicht für mehr RAM, sondern für SSD-Speicher.

Die 256 GB kriegt man schneller voll, als man denkt, einmal wenn 2 Nutzer das Gerät nutzen und mindestens ein User richtiger Apple-Nutzer ist.

Was ein Glück, dass ich mir das Macbook Neo 512 GB geholt habe, wo 256 GB samt Touch ID 100 mehr kosten (wenn man bei Apple kauft, was man nicht macht).
 
Zurück
Oben