Anzeige Nvidia RTX AI-PC: Nutze die Power deines PCs für lokale statt Cloud-KI [Anzeige]

Nvidia Corp.

Nvidia Corp.
Registriert
Juni 2020
Beiträge
7
Für viele ist der Griff zur AI mit dem Gang in die Cloud und damit oftmals mit Datenschutzbedenken oder Abogebühren verknüpft. Mit Nvidias RTX AI-PCs lassen sich KI-Anwendungen aber auch lokal auf dem Desktop-PC oder Notebook ausführen. Die KI-Bildgenerierung mit ComfyUI + FLUX.2 und OpenClaw als KI-Assistent sind Beispiele.

Zur Anzeige: Nvidia RTX AI-PC: Nutze die Power deines PCs für lokale statt Cloud-KI [Anzeige]
 
  • Gefällt mir
Reaktionen: BorstiNumberOne, mnoe02, Mr Peanutbutter und 5 andere
Auch wenn das Werbung ist, empfehle ich dazu mal die KI Videos von Keno von ct'3003

 
  • Gefällt mir
Reaktionen: BorstiNumberOne, lynx007, silentdragon95 und 8 andere
Ich nutze auch noch Claude (CoWork vor allem und Chat), heute habe ich vor allem Codex von OpenAI genutzt um meinen Raspberry Pi endlich als AirPrint Druckerserver einzurichten für meinen Fotodrucker.
Aktuell hat mir Claude geholfen meine lokalen Modelle zu steuern um meine alte Webseite mit einem alten Wordpress Theme hin in ein neues Divi Theme zu migrieren.
Befehle kommen von Claude und dann rein ins Lokale. Irgendwann ganz Lokal mit N8N.io für die Buchhaltung & Co.
Gerade geht's echt gut ab auf dem Sektor!

Und richtig krass sind die beiden Webseiten in den letzten 24h mit Claude Design. Abgefahren!
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: BorstiNumberOne und nighteeeeey
Gaming Fertig PCs als beworbene AI PCs mit einer 8GB RTX5060 und High-End mit der RTX5080, obwohl die RTX5070TI die bessere Wahl wäre, wenn es nicht gleich die RTX5090 ist, deren Chips und VRAM entlötet in Asien auf Custom AI Platinen landen. Für lokale LLM lassen sich nicht mal die Chinesen vom Nvidia AI Marketing veräppeln, denn die wissen auch ganz genau welche Hardware man im Rechenzentrum und lokal für AI braucht. So tief kann nicht mal eine RTX5070 12GB im Preis für Gaming und LLM fallen.
 
  • Gefällt mir
Reaktionen: JarlBallin, usernamehere, monstar-x und 2 andere
Haha, ne 5060 als einstiegs AI PC zu bewerben ist schon irgendwie lustig.

Auch mit ner 5070 wird man wenig Freude haben. Dann besser eine 5070ti

16 GB, sollte es für lokale AI schon sein. Ansonsten sind die Einschränkungen einfach zu groß.

Tipp: ne gebrauchte 3090 ist ein guter Kompromiss aus Ai-Performance, VRam und Preis.
 
  • Gefällt mir
Reaktionen: JarlBallin, monstar-x, rambodieschen und eine weitere Person
Witzig wie eine GeForce RTX 4090 mit FP8 so viel schneller als mit FP4 ist.
Dass das abrunden allerdings die Performance um 100% verschlechtert ist schon bemerkenswert.
 
Hallo nvidia, schickt mir doch mal einen DGX Sparc und eine 5090 zum Testen! Ich schreib dann auch einen Leserartikel hier!
 
  • Gefällt mir
Reaktionen: butchooka
Aber reichen die 8 GiB der RTX 5060 wirklich für die KIs aus?

Da sollte man wohl besser ein paar Euro drauflegen für die RTX 5060ti mit 16 GiB.
 
  • Gefällt mir
Reaktionen: butchooka
Sorry, aber Chat-GPT hätte mal den Text schreiben, und die Hardware dafür vorschlagen sollen.
Haben TEAM-A KI Abteilung und Team-B Gaming Abteilung nicht miteinander gesprochen?
 
  • Gefällt mir
Reaktionen: JarlBallin
openclaw lokal? ja klar, kannste ja gleich deine ganzen daten auf die straße legen.

sowas hat seinen sinn, aber dann auf einem VPS.

für bildgenerierung geh ich mit, comfyui ist ungeschlagen.
 
  • Gefällt mir
Reaktionen: monstar-x
lazsniper schrieb:
openclaw lokal? ja klar, kannste ja gleich deine ganzen daten auf die straße legen.

sowas hat seinen sinn, aber dann auf einem VPS.
Auf dem VPS wird man aber kaum das dazugehörige LLM zum Laufen bringen können (was in diesem Werbeartikel ja gemeint ist), mit einer entsprechend leistungsfähigen GPU im Rechner geht das aber sehr wohl ;)

...Wobei man ehrlicherweise dazu sagen muss, dass 8GB VRAM (zumindest noch) nicht im Ansatz für Modelle ausreichen, die sich für eine solche allgemeine Verwendung eignen würden - einfache Aufgaben wie "im Internet eine Information suchen" oder "Home Assistant bedienen" sind damit gut möglich, aber nichts komplexes. Mit 16GB ist man dann in einem Bereich, wo entsprechend spezialisierte Modelle durchaus auch bei Dingen wie z.B. Coding helfen können, aber ich glaube bis man da ein für OpenClaw taugliches Modell drauf bekommt muss noch etwas Zeit vergehen.
 
Ich kann als KI Agent "Hermes" empfehlen läuft mit gemma4 sehr schnell in meinem setup
 
Wo sind die attraktiven Karten mit 32 GB+ von Nividia für LLM@Home? Die 5090 ist als FE quasi nicht zu bekommen und hat immer noch das Stecker Problem. Werde deswegen woh eher zu einer AMD Radeon™ AI PRO R9700 32 GB greifen...
 
Klingt ja in der Theorie alles schön und gut, aber so ein normaler "High-End"-Rechner mit 32GB RAM und 16GB Grafikkarte ist einfach zu klein, um bessere Modelle mit einem großen Kontextfenster auszuführen.

Schauen wir uns z.B. Gemma 4 an, nur das kleinere E4B Modell läuft auch ohne starke Quantifizierung und mit einem großen Kontextfenster gut auf einer 5080. Also hier habe ich mit meiner schon über 120 Token pro Sekunde gemessen. Das ist super.

Aber, das nächstbessere Modell wäre das 26b A4B Modell und da sieht die Sache schon anders aus. Das passt auch mit 4 Bit Quantifizierung und kleinem Kontextfenster kaum auf die 5080. Das läuft auf dem Rechner zwar schon noch irgendwie, aber Teile müssen in den System-RAM ausgelagert werden, wodurch es deutlich langsamer läuft. Hier komme ich noch auf rund 40 Token pro Sekunde, das ist noch brauchbar, aber der Arbeitsspeicher des Systems ist dann auch schon fast voll bis zur Kotzgrenze und die Eingabe-Token sind stark begrenzt, sodass es für Dinge wie Softwareentwicklung oder gar OpenClaw eher nicht zu gebrauchen ist. Jetzt bräuchte man im Grunde schon einen zweiten Rechner, auf dem man dann arbeitet, während das andere System nur die KI ausführt und sonst nichts.

Andere Modelle wie Qwen 3.6 35b-A3B brauche ich da gar nicht mehr ausprobieren. Da bräuchte man schon mindestens eine 3090 oder besser eine 5090, damit das vernünftig läuft. Und diese sind aktuell quasi unbezahlbar.

Immerhin, erfahrungsgemäß erzeugt z.B. das kleine E4B Modell von Gemma 4 schon bessere Ergebnisse als das größere GPT-OSS 20b Modell von OpenAI (welches in etwa die Obergrenze für ne 16GB Grafikkarte ist) oder auch Qwen 3.5 27b. Daher bin ich zuversichtlich, dass wir immer bessere Modelle sehen werden, die auch mit 16GB Speicher gute Ergebnisse erzielen. Aber bisher sind die Modelle meist entweder auf kleinere oder größere Hardware ausgerichtet. Gemma E4B beispielsweise würde auch auf 8GB noch einigermaßen laufen und verschenkt somit Potential, wenn man es mit einer größeren Karte ausführt. Dann kann man zwar auf 8 Bit Quantifizierung hoch gehen, aber ob das am Ende so viel bringt?
 
  • Gefällt mir
Reaktionen: Dr.lud.Zock, Anullu und coxon
@Marcel55 ein Vorteil für das kleinere Modell ist jedenfalls auch, dass natürlich auch mehr Modelle zeitgleich im Speicher sein können, oder die GPU auch für andere Dinge noch verwendet werden kann und so nicht nur exklusiv für die eine Anwendung gehalten werden sollte.
 
Ja genau, mit ner 16GB Karte machen wir mal OpenClaw. Da ich mir genau für diesen UseCase eine 5060 Ti mit 16GB RAM zugelegt habe, kann ich nur sagen: Nein. Auch wenn Qwen 3.5 9B echt mega ist, für das was es ist - aber viel mehr als ne Wettervorhersage und ein paar Forumlieruns-Tipps würde ich mir da nicht abholen. Image-Gefummel geht gut mit dem VRAM, aber für einen echten KI Assistenten müssen es derzeit schon mal mindestens 32 GB und eher sogar 64GB VRAM sein.

Also Nvidia, dann liefert mal die Hardware zum brauchbaren Preisen und bringt mal das NVLink Interface zurück, dann könnte man sogar mit ein paar 16GB Karte was anfangen.
 
@GrooveXT
Probier mal Gemma 4 E4B aus, ich habe damit deutlich bessere Erfahrungen gemacht als mit Qwen 3.5. Qwen denkt bei mir und denkt und am Ende kommt nur was halbgares bei raus. Vielleicht falsch eingestellt...aber gerade durchs Thinking sollte es ja bessere Ergebnisse liefern dachte ich mir.
Da war ich im Kern selbst mit Ministral und GPT-OSS zufriedener als mit Qwen 3.5.
 
  • Gefällt mir
Reaktionen: Jan
ameisenbaer schrieb:
Inzwischen ist ja 3.6 raus...
ja, aber in keiner Größe die auf eine 16GB Karte passen würde
 
Was wäre denn für ein Modell zu empfehlen um große PDF zu analysieren und Infos rauszufiltern? Bestimmt 300-400 Seiten mit Grafiken und Tabellen und halt viel Text.
Optimaler weise auch mit Word Ausgabe auf meine Fragen zum Text.

5090 und 64gb ram mit 9800x3d
 
Sapphire Forum
Zurück
Oben