RTX 5090 für K.I. Fine-Tuning und RAG

Rockhound

Lt. Commander Pro
Registriert
Jan. 2003
Beiträge
1.665
[Bitte fülle den folgenden Fragebogen unbedingt vollständig aus, damit andere Nutzer dir effizient helfen können. Danke! :)]


1. Wie viel Geld bist du bereit auszugeben?
  • Das Minimum für eine RTX 5090

2. Möchtest du mit der Grafikkarte spielen?
  • Ja, aber nix anspruchsvolles: WoW, Overwatch, BF1, Red Dead Redemption... später vielleicht BF6/GTA6
3. Möchtest du die Grafikkarte für spezielle Programme & Anwendungen (z.b. CAD) nutzen? Als Hobby oder bist du Profi? Welche Software wirst du nutzen?
  • KI-Fine-Tuning, KI-Modelle lokal testen
  • Blender
  • DaVinci Resolve
  • After Effects

4. . Wieviele und welche Monitore möchtest du nutzen? Wird G-Sync/FreeSync unterstützt? (Bitte mit Link zum Hersteller oder Preisvergleich!)
  • Alienware AW3821DW - 3840 x 1600px - GSync

5. Nenne uns bitte deine aktuelle/bisherige Hardware:
  • System: 5950X, 64GB RAM, 4TB SSD
  • Aktuelle/Bisherige Grafikkarte (GPU): RTX 4070
  • Netzteil(Genaue Bezeichnung): Enermax 500W (sehr alt)
  • Gehäuse: Fractal Design Meshify 2 Compact mit 2 Frontlüftern, 1 Top-Lüfter und 1 Rücklüfter
6. Hast du besondere Wünsche bezüglich der Grafikkarte? (Lautstärke, Anschlüsse, Farbe, Hersteller, Beleuchtung etc.)
  • Nein

7. Wann möchtest du die Karte kaufen? Möglichst sofort oder kannst du noch ein paar Wochen/Monate warten?
  • Jetzt

Meine Interessen (Privat+Beruflich) gehen stark in Richtung K.I.
Bin derzeit viel am testen mit "Fine-Tuning", "RAG" und die Modelle einsetzen mit n8n, ollama usw..
Die 4070 reicht mir dicke fürs Gaming, aber macht schlapp wenn es um den K.I.-Einsatz geht.
Von daher muss eine dickere Karte rein. Die "RTX PRO 6000 Blackwell Workstation-Edition" ist für daheim zu teuer, daher soll es eine 5090 werden.

  1. Spricht etwas dagegen die derzeit günstigste zu nehmen: MSI GeForce RTX 5090 Ventus 3X OC ?
  2. Und welches Netzteil sollte ich dazu bestellen? Corsair RMe Series 2025 RM850e
  3. Ist Mindfactory ein guter Händler?
Danke.
 
Nur mal so eine Frage: Wie genau möchtest du RAG machen? Interessiert mich, da es keine easy Sache ist.
 
oicfar schrieb:
Nur mal so eine Frage: Wie genau möchtest du RAG machen? Interessiert mich, da es keine easy Sache ist.
Steige da gerade erst ein. Ich nutze auf meinem Unraid-Server n8n. Da gibt es gute RAG-Starter-Templates. n8n greift dann über die KI-Agent-Node auf meinen Gaming-PC zu auf dem Ollama läuft.
Firefly2023 schrieb:
Wenn dir die Lautstärke egal ist, dann spricht nix dagegen.
Was wäre denn eine gute Alternative? Die GPU läuft ja bei der K.I. Nutzung immer auf 100%.
 
oicfar schrieb:
Interessiert mich, da es keine easy Sache ist.
Naja, von dem ganzen AI Slop ist RAG das noch am besten dokumentierte. Beispiel: Du jagst deine Dokumente durch einen chunker, packst die in einem Vektor-Store mit einem passenden embedding model, zb ada002 wenn du dann chatten willst, nimmst deine Frage, evaluierst die gegen das embedding model, nimmst den Vektor, suchst chunks die "nahe" genug dran sind und schiebst die chunks + deine Frage + System prompt in eins der großen LLMs. Raus kommt mehr oder wenig nützlicher AI Slop.

Mit den aktuellen Modellen die riesige Kontexte verstehen, brauchst ggf nicht mal mehr ein embedding model wenn du anderweitig die Dokumente reduzieren kannst. Kostet zwar x mal mehr und dauert y mal länger pro Frage, liefert aber ggf bessere Ergebnisse, da die Fehlerquelle chunking weg ist.
Ergänzung ()

Rockhound schrieb:
Was wäre denn eine gute Alternative?
Deshroud und 2-3 große noctua Lüfter drauf, macht je nach Bericht 5-7dB aus
 
  • Gefällt mir
Reaktionen: Rockhound
Zurück
Oben