Lokale KI fürs Programmieren?

Krik · 29. Mai 2026

Moin zusammen,

kennt jemand KI-Modelle, die für das Programmieren gut geeignet sind und eine API für den Zugriff durch eine IDE bieten? Die müssten in 16 GB VRAM passen und am besten in Pinokio verfügbar sein.

Vielleicht gibt es sogar welche, die gezielt auf einzelne Programmiersprachen ausgerichtet sind? Für mich müsste es eine für Bash, C# und vielleicht auch Python sein.

Ich habe bisher nur die "gängigen" Chat-KIs gefunden. Ich will aber nicht über Gott und die Welt sappeln und tausche daher gerne das "Allgemeinwissen" gegen Programmierfähigkeiten ein.

Gruß
Krik

JumpingCat · 29. Mai 2026

Suchst du so was die LM Studio / Ollama + OpenCode / VS Code?

chr1zZo · 29. Mai 2026

Qwen3.5-35B-A3B oder Qwen 3.6-27B
GPT-OSS 20B
Gemma 4 26B MoE

JennyCB · 29. Mai 2026

Frag doch deine KI?

adfsrg · 29. Mai 2026

Krik schrieb:
KI-Modelle, die für das Programmieren gut geeignet sind und eine API für den Zugriff durch eine IDE bieten

Die Modelle bieten doch kein API.

Krik schrieb:
am besten in Pinokio verfügbar sein

Pinokio ist kein LLM-Runner

Krik schrieb:
Ich will aber nicht über Gott und die Welt sappeln und tausche daher gerne das "Allgemeinwissen" gegen Programmierfähigkeiten ein.

Meinst du mit "Programmierfähigkeiten" dass das Modell als Agent selbständig programmieren soll oder willst du mit dem Modell nur chatten?

Krik · 29. Mai 2026

Ich habe bisher immer per Hand kleine Code-Stückchen in diverse ChapGPT-Varianten geworfen und die KI das modifizieren lassen. Für mal eine kleine Sache geht das, aber man kommt da schnell an verschiedene Grenzen.
Wenn ich aber eine lokale KI habe, auf die z. B. Rider zugreifen kann, wäre das top!

adfsrg schrieb:
Meinst du mit "Programmierfähigkeiten" dass das Modell als Agent selbständig programmieren soll oder willst du mit dem Modell nur chatten?

Sie sollte im Idealfall selber als Agent programmieren können.

Ergänzung (29. Mai 2026)

adfsrg schrieb:
Pinokio ist kein LLM-Runner

Ok, dann ist das schon mal das falsche Programm. Ich bin darauf gekommen, weil man darin auch Chat-KIs laufen lassen kann.

oicfar · 29. Mai 2026

Krik schrieb:
Moin zusammen,

kennt jemand KI-Modelle, die für das Programmieren gut geeignet sind und eine API für den Zugriff durch eine IDE bieten? Die müssten in 16 GB VRAM passen und am besten in Pinokio verfügbar sein.

Habe eine RTX 4060 Ti mit 16GB VRAM und habe mir so was in den letzten 2 Jahren angesehen.

Meine Meinung: vergiss es. Damit kommst du nicht weiter. Und es wird langsam.

Krik schrieb:
Vielleicht gibt es sogar welche, die gezielt auf einzelne Programmiersprachen ausgerichtet sind? Für mich müsste es eine für Bash, C# und vielleicht auch Python sein.

Für Bash und Python gehen viele kleine Modelle. C# wird schon problematischer.

Gizzmow · 29. Mai 2026

In VS-Code kann man m.W.n. Agenten erzeugen die dann auf ein lokales Modell zugreifen, ob die dann Zugriff auf deinen Code/Ordner dann bekommen und autonom schreiben können weiß ich nicht.

Krik · 29. Mai 2026

oicfar schrieb:
Damit kommst du nicht weiter.

Warum? Es geht nur um echt kleine Projekte, sagen wir mal <5000 Zeilen Code.

oicfar schrieb:
Und es wird langsam.

Das erwarte ich.
Wie langsam eigentlich? Bei mir läuft eine 9070XT, die hat etwas mehr Dampf.

adfsrg · 29. Mai 2026

Krik schrieb:
Sie sollte im Idealfall selber als Agent programmieren können.

Also das wird nicht so gut funktionieren wie bei einem Cloud-Modell, selbst wenn das Modell auf Werkzeuge trainiert ist.

Krik schrieb:
Ich bin darauf gekommen, weil man darin auch Chat-KIs laufen lassen kann.

Du kannst in Pinokio die Anwendungen, die die Chat-KIs laufen lassen, laufen lassen

Ich würde für deinen Anwendungsfall aber LMStudio nutzen. Du kannst damit Chatten und LMStudio macht es auch per API verfügbar (was die Anwendungen in Pinoki die Chat-KIs laufen lassen aber auch idR tun)

Probier's mal aus. kostet ja nichts. Die o.g. Modelle sind ok, die hätte ich auch empfohlen.

chr1zZo · 29. Mai 2026

Oder du nimmst halt Geld in die Hand und kaufst dir einen AI Model Hub oder ein AI Model Studio oder ein Claude Abo, dann halt aber gleich Max, weil mit Pro wirst nicht weit kommen. Weil wenn du deinen PC vollbelastest bei deiner Hardware, dann macht es auch damit kein Spass

Enurian · 29. Mai 2026

Dir muss bewusst sein, dass das nur Sinn macht, wenn du dich da aus Spaß einarbeiten willst, oder wenn du da so sensible Daten füttern willst, dass die auf keinen Fall deinen Rechner verlassen dürfen.
Cloudmodelle sind nicht nur besser, sie sind in vielen Fällen auch günstiger, selbst wenn du 1:1 API-Preise (z.B. über OpenRouter) zahlst. Und ich rede hier nur von Stromkosten fürs lokale Ausführen.

nutrix · 29. Mai 2026

Krik schrieb:
Warum? Es geht nur um echt kleine Projekte, sagen wir mal <5000 Zeilen Code

Das ist für so eine lokale LLM schon an sich zuviel mit 16 GB.

Ergänzung (29. Mai 2026)

oicfar schrieb:
Habe eine RTX 4060 Ti mit 16GB VRAM und habe mir so was in den letzten 2 Jahren angesehen.

Selbst mit einer 3/4/090 mit 24 und 5090 32 GB RAM wird es eng. Besser ist es mit einer Nvidia Spark, AMD Strix Halo oder Apple Mac Studio M3 Ultra etc., wo Du ca. 100-110 GB RAM für die LLM verwenden kannst. Sind zwar die Antwortszeiten teilweise langsam, aber die Qualität ist deutlich besser.

Bevor man sich aber hier in Unkosten stürzt, ist jedes Abo im Endeffekt günstiger.

https://claude.com/pricing

Für ein Jahr mit 12*100€ = 1200 € bekommst Du weder eine dicke Nvida GPU noch die oben genannten Geräte.

swage · 29. Mai 2026

Würde LMStudio empfehlen weil bringt gleich Serverfunktionalität mit. Da kannst du direkt ein Programm (App) oder eine Webseite verknüpfen und das ganze im Netzwerk bereitstellen, ganz wie die großen. Dann hast du einen KI Server auf den du von Workstations aus zugreifen kannst.

Qwen ist ein schönes Modell, es gibt aber auch größere Gemma 4 Modelle. Gemma hat den Vorteil vision enabled zu sein. Da kann man auch Screenshots rüberreichen anstatt es nur wüst Textoutput analysieren zu lassen. Es kann sich Resultate "sehen".

Nebenbei, wenn man ein kleines Whisper Modell dazu nimmt das Geräusche in Text umwandelt kann jedes LLM "hören".

oicfar · 29. Mai 2026

Krik schrieb:
Warum? Es geht nur um echt kleine Projekte, sagen wir mal <5000 Zeilen Code.

Du kannst es für Bash und Python schon machen und schauen, ob dir das reicht. Meistens ist aber so, dass man dann doch mehr machen will, wenn es gut läuft und dann kommt die Enttäuschung. Und Tools wie OpenCode brauchen schon LLMs mit mind. 32k Kontext. Darunter läuft es nicht.

C# wird eher scheitern. Da braucht du schon was anderes.

nutrix schrieb:
Für ein Jahr mit 12*100€ = 1200 € bekommst Du weder eine dicke Nvida GPU noch die oben genannten Geräte.

Eben.

Aber warten wir noch die Börsengänge ab und schauen, ob die Abos so günstig bleiben.

JumpingCat · 29. Mai 2026

Krik schrieb:
Die müssten in 16 GB VRAM passen

Muss denn alles lokal laufen?

Ansonsten würde ich die kostenlosen Stufen von Windsurf/ GitHub Copilot nutzen.

Tornhoof · 29. Mai 2026

Aus eigener Erfahrung, c# funktioniert erst seit etwa GPT 5.4 oder Claude Opus 4.5 bzw Sonnet 4.5 einigermaßen, die aktuellen qwen Modelle (auf 5090) gehen aktuell für Skriptgröße, alles über etwa 500 Zeilen wird da schon nervig. Wenn es Skriptgröße werden soll, würde ich eher eine andere Sprache empfehlen, Python oder so.

Suche

Lokale KI fürs Programmieren?

Krik

Fleet Admiral Pro

JumpingCat

Vice Admiral

chr1zZo

Commodore

JennyCB

Lt. Commander

adfsrg

Lieutenant

Krik

Fleet Admiral Pro

oicfar

Captain

Gizzmow

Lieutenant

Krik

Fleet Admiral Pro

adfsrg

Lieutenant

chr1zZo

Commodore

Enurian

Commander

nutrix

Vice Admiral

swage

Ensign

oicfar

Captain

JumpingCat

Vice Admiral

Tornhoof

Captain

Ähnliche Themen