TeamViewer Motive 4

Neuer LLM Knecht

chr1zZo schrieb:
GPU Load natürlich. CPU ist zu Lahm.
Fuer inferenz ist es sogar kaum relevant. Was dich bei LLMs limitiert ist vor allem die Speicherbandbreite.
Wenn es eine Nvidia GPU sein ist die RTX 3090 IMO das was das beste preis-leistungverhaeltniss liefert.

Mit deinem Budget und 8 stunden Nutzung am Tag kannst du auch 2-3 Jahre Nvidia H100 mit 80GB VRAM haben.
 
Zuletzt bearbeitet:
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: iron_monkey und Syntax_41
KnolleJupp schrieb:
Zitat: "Money spielt keine Rolle, das Teil erwirtschaftet 500k bis 1Mio."

Dann würde ich mich bestimmt nicht mit Consumer-Hardware herumplagen...

Denke ich mir auch gerade. Würde da eine Lösung von Nvidia vorziehen, weil KI braucht VRAM, nicht der normale RAM, der ist zu langsam.
Ergänzung ()

madmax2010 schrieb:
Fuer inferenz ist es sogar kaum relevant. Was dich bei LLMs limitiert ist vor allem die Speicherbandbreite.
Wenn es eine Nvidia GPU sein ist die RTX 3090 IMO das was das beste preis-leistungverhaeltniss liefert.

Mit deinem Budget und 8 stunden Nutzung am Tag kannst du auch 2-3 Jahre Nvidia H100 mit 80GB VRAM haben.

Nö mac mini ist da besser
Ergänzung ()

Für das Budget, das du da ausgibst, kannst du kleine Modelle starten.
Ich würde Mac Mini Studio mit 196 GB RAM nehmen.
oder
Alte A100 Chips holen.
und
Wenn’s unbedingt „Gaming“-Hardware sein muss, würde ich den AMD Threadripper 7000 nehmen.
Wegen den Lanes der prozessor von dir hat 24 lanes (die die 4090er verstopfen) der hier 128
 
Zuletzt bearbeitet:
@abcddcba Ich würde für zuhause solche hardware nehmen aber nicht um ernsthaft damit ein KI Modell beruflich laufen lassen

Bei meinen Teil ist das teure ja die Garantie aber dafür wenn was kaputt geht kriege ich sofort ersatz, bei einer Million Umsatz denke ich mal das das teil 24h läuft auf voller last was den stromverbrauch in die höhe treibt
 
Syntax_41 schrieb:
Nö mac mini ist da besser
Beim M4 Max kommt man mit LLAMA 3 70BQ4 auf ~8 Token pro sekunde. Bei einer H100 eher 150.
"Besser" ist schon relativ.
Wenn man so billig es geht maximal viel RAM haben will -> Mac Mini
Maximale Speicerbandbreite -> GPU nach Wahl
Der DGX Spark in der Mitte davon ist auch fair platziert
 
@madmax2010 Für das Geld was man für die Grafikkarten mit mehr vRAM ausgibt, kriegt man einen Mac Mini mit viel mehr RAM

Wenn man noch die Stromkosten nimmt ist der Mac Mini noch preiswerter als Grafikkarten

Ich würde aber generell auf eine spezialisierte Lösung zurückgreifen wie A100, h200
 
Mit dem Kasten werden Millionen verdient, ob das Ding jetzt 20 oder 30kEUR kostet ist völlig wurscht, auch die Stromkosten sind völlig irrelevant, selbst wenn das Ding 5kW pro Stunde verbrät und man einen Haushaltsstromtarif hat.
Also kann die Antwort mMn. nur lauten, dass man da die größtmöglichste GPU-Rechenleistung reinpackt, die man kaufen dann. Die CPU muss diese GPUs nur genug füttern können.
 
  • Gefällt mir
Reaktionen: konkretor und KarlsruheArgus
Es sollen angeblich damit bis zu 1 Mio verdient werden, dann aber so einen besseren Gaming-PC dafür kaufen wollen. Den dann auch noch mit ganz viel langsamen CPU-gebunden RAM vollstopfen für LLM, die über die GPU laufen.
Sorry, da sind soviele Ungereimtheiten, dass man das kaum ernst nehmen kann.
Wer mit Hardware komerziell arbeitet, der mietet sich ein System mit Pro-Komponenten (z.B. RTX 6000 Blackwell) über ein Systemhaus. Die Ausrede, dass keins vor Ort ist, ist billig. Systemhäuser handeln auch über Ortsgrenzen hinaus.
Dann wird Hardware gemietet im B2B. Sie ist schnellebig und die Steuervorteile sind deutlich höher bei Miete gegenüber Erwerb im B2B.
Vielleicht erstmal einen richtigen Businessplan machen, bevor man von den Millionen träumt.
 
  • Gefällt mir
Reaktionen: iron_monkey und KarlsruheArgus
HerrRossi schrieb:
Mit dem Kasten werden Millionen verdient, ob das Ding jetzt 20 oder 30kEUR kostet ist völlig wurscht, auch die Stromkosten sind völlig irrelevant, selbst wenn das Ding 5kW pro Stunde verbrät und man einen Haushaltsstromtarif hat.
Also kann die Antwort mMn. nur lauten, dass man da die größtmöglichste GPU-Rechenleistung reinpackt, die man kaufen dann. Die CPU muss diese GPUs nur genug füttern können.
Das würde ich nicht so unterschreiben weil ist ja geld was man verbrät, aber für das geld der gaming hardware bekommt man schon besseres dediziertes, ich würde nur gerne wissen was die KI machen soll dann kann man das Gerät darauf hin spezialisieren.

Aber beruflich auf gaming hardware zu setzen die 24h läuft auf voller power denke nicht das das lange gut geht
Ergänzung ()

Stovi schrieb:
Wer mit Hardware komerziell arbeitet, der mietet sich ein System mit Pro-Komponenten (z.B. RTX 6000 Blackwell) über ein Systemhaus. Die Ausrede, dass keins vor Ort ist, ist billig. Systemhäuser handeln auch über Ortsgrenzen hinaus.
Dann wird Hardware gemietet im B2B. Sie ist schnellebig und die Steuervorteile sind deutlich höher bei Miete gegenüber Erwerb im B2B.
Vielleicht erstmal einen richtigen Businessplan machen, bevor man von den Millionen träumt.

Kann teurer werden als eigene Hardware, und vom sicherheitsaspekt mal abgesehen kann jeder unbemerkt an deine daten und bei 500k-1 Millon ist die versuchung schon groß
 
  • Gefällt mir
Reaktionen: madmax2010
Syntax_41 schrieb:
ich würde nur gerne wissen was die KI machen soll dann kann man das Gerät darauf hin spezialisieren.
Hat er doch eh gesagt:
chr1zZo schrieb:
Videos/Reels/Bilders etc.
chr1zZo schrieb:
Natürlich hat das in erster Linie nichts mit dem Hauptgeschäft zutun, das läuft über ganz andere Kanäle. Das hier ist ein SideQuest
Für mich riecht das bissl wie 'der ITler hat Geld gerochen und ein paar Tutorials zum Erstellen von automatisiertem AI Slop'-gefunden. Ich hoffe nur das ist innerhalb des Unternehmens geklärt...
 
  • Gefällt mir
Reaktionen: iron_monkey und Syntax_41
Okay was will er dann mit den wenigen vram? da braucht er erheblich mehr für...

Aber für spam slop bin ich nicht zu haben bin raus hier
 
  • Gefällt mir
Reaktionen: Tenferenzu
@Syntax_41 Wieso laufen dann schon diverse Workloads auf meinen älteren LLMs mit erheblich weniger VRAM und machen trotzdem was Sie sollen?

@Tenferenzu Nein, die IT hat hier kein Geld gerochen. Ich habe bereits 2 LLMs die folgendes machen: Image/Video/Sprite und Vectorgrafiken Erstellung für SocialMedia sowie Gamegrafiken, Spieleentwicklungen für Godot, UE5, Roblox Studios und Unity (Steam, iOS, Android), Entwicklungen von ERP/CSM Systemen oder je nach Kundenwunsch, Agentenentwicklungen, Rust Berechnungen (AVX, CPU) + StreamLit, XGBoost, Neural Engines, Zapier + n8n, Engines und Bots für den Stock/Crypto sowie PolyMarket mit massiven Backtester Engines. Komplette Automatisierungsprozesse in ziemlich allen Bereichen.

Es läuft derzeit alles auf Gaming Hardware. Und ja, es gibt auch einen gemieteten DGX Spark. Die neue Maschine soll einfach weitere Aufgaben übernehmen, teilweise wieder auf diverse Bereiche sowie Kundenstamm separiert.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: iron_monkey
chr1zZo schrieb:
@Syntax_41 Wieso laufen dann schon diverse Workloads auf meinen älteren LLMs mit erheblich weniger VRAM und machen trotzdem was Sie sollen?


Vernünftige Grafiken? in annehmbarer zeit? Wage ich zu bezweifeln

DGC Spark gemietet und dann noch auf Gaming-Hardware setzen, ich weiß ja nicht, irgendwas stimmt hier nicht, aber wie gesagt, ich bin raus. Kein vernünftiger Itler setzt auf Gaming-Hardware, wenn Geld angeblich keine Rolle spielt.
 
chr1zZo schrieb:
Wieso laufen dann schon diverse Workloads auf meinen älteren LLMs mit erheblich weniger VRAM und machen trotzdem was Sie sollen?
Wäre natürlich eine sinnvolle Information zu wissen, wie viel RAM auf der GPU gebraucht wird. Dann kauf 6x 5070 mit 12GB und skalier dein Projekt hoch.
Ergänzung ()

Syntax_41 schrieb:
Aber beruflich auf gaming hardware zu setzen die 24h läuft auf voller power denke nicht das das lange gut geht
Warum? Wenn was kaputt geht sind es meistens die Lüfter, die kann man im Aftermarket kaufen oder man schnallt Gehäuselüfter drauf. Wenn die Karten ordentlich eingestellt sind (va. Undervolting), dann laufen die auch ewig, hat man doch im Miningboom gesehen. Sollte so eine Karte wirklich komplett ausfallen, dann kann man günstig Ersatz kaufen, falls der RAM Bedarf pro Karte nicht sehr hoch ist. 12GB gibt es bei der 5070 für 570 EUR.
 
Zuletzt bearbeitet:
HerrRossi schrieb:
Warum? Wenn was kaputt geht sind es die Lüfter, die kann man im Aftermarket kaufen oder man schnallt Gehäuselüfter drauf. Wenn die Karten ordentlich eingestellt sind (va. Undervolting), dann laufen die auch ewig, hat man doch im Miningboom gesehen. Sollte so eine Karte wirklich komplett ausfallen, dann kann man günstig Ersatz kaufen, falls der RAM Bedarf pro Karte nicht sehr hoch ist. 12GB gibt es bei der 5070 für 570 EUR.

Auch da sind sehr viel ausgefallen, warum denkst du haben wir für unseren Cluster das doppelte bezahlt für Garantieaustausch sofort

Er gibt an 500k-1 Million erwirtschaften zu wollen im Jahr, mit Grafiken auf alten modellen die wegen des geringen Vrams (und der total falschen CPU (( 24 Lanes)) ) ich sage mal durchnittliche ergebnisse liefert dazu müsste das 24h laufen 7 tage die woche und 365 tage im Jahr auf volllast


naja wie er denkt
 
Syntax_41 schrieb:
Auch da sind sehr viel ausgefallen...
Wie viele denn ohne Lüfterschäden? Aber selbst wenn es sehr viele waren, hat es sich gelohnt und darauf kommt es doch an.

Vergleiche mal die beiden Karten: https://geizhals.de/?cmp=3501613&cmp=3488409&active=1

Ja, die Profikarte hat mehr RAM (was evtl. nicht gebraucht wird), aber weniger RAM Durchsatz und auch sonst weniger Leistung. Für den Preis der Profikarte bekommt man aber 2 Consumerkarten. Nie im Leben verrecken zwei Karten über die Nutzungsdauer der Karten, nach drei Jahren sind die sowieso abgeschrieben. Und dann gibt es ja auch noch Gewährleistung und Garantie.

Imho lohnen sich die Profikarten für LLM nicht, anders sieht es aus, wenn ein zertifizierter Grafiktreiber benötigt wird.
 
@HerrRossi Wie viele hat man danach auf eBay gefunden, wo der RAM durch war? Oder der Chip? Lüfter und Kondensatoren lassen sich ja noch einfach tauschen. Solche Karten eignen sich für Agenturen etc., aber wenn’s darum geht, 24h die KI rendern zu lassen, sind die total ungeeignet.

Wir haben nicht aus Spaß an der Freude den Cluster angeschafft. Auch wir hatten am Anfang die Idee, 4x 5090 bzw. das Workstation Pendant zu verwenden. Haben uns dann zum Glück für etwas Professionelles entschieden.
 
Syntax_41 schrieb:
Wie viele hat man danach auf eBay gefunden, wo der RAM durch war? Oder der Chip? Lüfter und Kondensatoren lassen sich ja noch einfach tauschen.
Keine Ahnung. Es ging aber nicht um einen evtl. Wiederverkauf, sondern ob die Dinger überhaupt durchhalten.
Syntax_41 schrieb:
Haben uns dann zum Glück für etwas Professionelles entschieden.
Ist ja auch völlig okay, jeder wie er will.
 
Zurück
Oben