Snakeeater
Captain
- Registriert
- Aug. 2004
- Beiträge
- 3.187
Wollen wir nichtmal einen Sammelthread erstellen? Im Zuge der weiter steigenden Kosten für Abos und dem generellen Trend beim Thema KI sollte das Interesse doch recht groß sein lokalem LLMs zu betreiben wenn die GPU dafür ausreicht. Ich nutze aktuell eine RT 7900 XT und versuche mit llama.cpp einen lokalen Chatbot zum laufen zu kriegen.
Leider ist das ein pures Trial & Error Prinzip.
ROCm bekomme ich bei mir irgendwie nicht zum laufen, evtl. liegt es hier an Tumbleweed, ich bin daher nun auf Vulkan umgestiegen.
Als Modell wollte ich eigentlich irgend ein passendes Qwen Modell, aktuell hat mich Grok dazu angehalten folgendes zu nutzen: Qwen3.5-27B-Q4_K_M.gguf
Ich habe auch noch gar keinen Plan welchen Systemprompt ich tatsächlich nutzen soll für einen lokalen Chatbot.
Hat hier jemand Erfahrungen sammeln können und evtl. Hinweise und Tipps?
Leider ist das ein pures Trial & Error Prinzip.
ROCm bekomme ich bei mir irgendwie nicht zum laufen, evtl. liegt es hier an Tumbleweed, ich bin daher nun auf Vulkan umgestiegen.
Als Modell wollte ich eigentlich irgend ein passendes Qwen Modell, aktuell hat mich Grok dazu angehalten folgendes zu nutzen: Qwen3.5-27B-Q4_K_M.gguf
Ich habe auch noch gar keinen Plan welchen Systemprompt ich tatsächlich nutzen soll für einen lokalen Chatbot.
Hat hier jemand Erfahrungen sammeln können und evtl. Hinweise und Tipps?