Visual Studio 2026: lokale LLMs als Copilot-Ersatz für C#-Agent-Work? Empfehlungen?

adfsrg · 1. Juni 2026

Hi zusammen,

ich nutze seit längerem GitHub Copilot direkt in Visual Studio für C#-Entwicklung und vor allem für agentisches Coding. Durch die neue Abrechnung bin ich gerade am Überlegen, ob ich auf ein lokales Setup umsteige.

Wichtig ist mir:

Nutzung in richtigem Visual Studio, nicht VS Code
möglichst ähnlicher Workflow wie Copilot Chat
gute Unterstützung für C#, Refactoring, Projektkontext und Dateiänderungen
idealerweise lokal über LM Studio oder ein ähnliches Setup
läuft auf einer RTX 4090

Meine Fragen:

Welche Extensions für Visual Studio 2026 sind aktuell empfehlenswert?
Gibt es brauchbare lokale Alternativen mit Chat + Agent-Workflow?
Welche Modelle funktionieren für C# und agentisches Coding am besten lokal?
Hat jemand Erfahrungen mit LMLocal oder ähnlichen Plugins in Visual Studio?

Ich bin offen für Empfehlungen, aber bitte nichts nur für VS Code — ich suche wirklich Lösungen für das volle Visual Studio.

Danke euch!

Tornhoof · 1. Juni 2026

Kannst du komplett vergessen aktuell (meiner Meinung nach). Die ganzen Hobbyprojekte wie LMLocal sind nicht gut integriert, afaik ist z.b. LMLocal auch schon wieder aufgegeben worden.
Selbst Jetbrains hat mit Junie aktuell noch keine Integration für Visual Studio geliefert.

Desweiteren wirst du C#, MSBuild Skripte, Projektdateien nur schwer mit lokalen LLMs gut bedienen können, die Menge an Daten die eingelesen wird überschreitet sofort jedes lokale Kontextfenster.

So oder so ist die Integration von LLMs in Visual Studio 2026 effektiv Monate hinter der Integration in VsCode oder gar Copilot CLI, einfach weil VS andere Releasezyklen und Testzyklen fährt, wird aber zugegebenermaßen besser.
Damit nutzt du jetzt schon nur einen Bruchteil der Agentfähigkeiten von Copilot aus.

Ich glaube du musst dir ernsthaft einen anderen Workflow überlegen und angewöhnen, ich bin von VS für die AI integration komplett auf Copilot CLI gewechselt.

chr1zZo · 1. Juni 2026

Eine Lokale LLM mit entsprechender Power kostet paar Scheine

Ansonsten nutze ein Cloud Basierten Dienstleister wo du auf alle AIs zugreifen kannst und via API koppeln kannst. IONOS Momentum / AI Model Hub ist da ganz praktisch.

adfsrg · 1. Juni 2026

chr1zZo schrieb:
IONOS Momentum / AI Model Hub ist da ganz praktisch.

Aber da hab ich doch auch wieder die tokenbasierte Abrechnung, die ich ja vermeiden will. Oder seh ich das falsch?

madmax2010 · 1. Juni 2026

adfsrg schrieb:
läuft auf einer RTX 4090

nope. Das ist spielzeug
Da du programmieren kannst:
Was spricht gegen terraform+ansible und bei bedraf pro session AMD/Nvidia compute minutenweise mieten und deployen?
https://app.primeintellect.ai/dashb...ation=Cheapest&gpu_type=B200_180GB&quantity=1
fuer 50 cent pro stunde wird es besser, bei 1-2 euro/stunde kommst du bei brauchbaren modellen raus und bist auch schnell billiger als tokenbasierter abrechnung

adfsrg · 1. Juni 2026

Tornhoof schrieb:
ich bin von VS für die AI integration komplett auf Copilot CLI gewechselt.

Das würde mir doch nichts bringen, oder? Die Abrechnung ist doch gleich, oder ist CLI da anders?

Ergänzung (1. Juni 2026)

madmax2010 schrieb:
nope. Das ist spielzeug

genau dafür wurde sie ja auch angeschafft

madmax2010 · 1. Juni 2026

ja, schon klar. guter.

was ich sagen will, wenn du ernsthaft damit arbeiten willst, ist der VRAM bei den modellen die wir gerade nutzen koennen zu wenig. Das macht keine freude

the_nobs · 1. Juni 2026

Also wir haben es getestet und es funktioniert grundsätzlich
als Client nutzen wir https://aider.chat/ und als LLM haben wir Openlama laufen.
Das coole daran ist, du kannst OpenLama auf einen "Server" laufen lassen und nicht auf deiner haupt work station.

Benchmarks haben wir keine Laufen lassen. Nur so einfache Tests und die gingen einwandfrei.

Nachdem das alles Open Source ist empfehle ich ein wenig rumzuspielen damit.
Vielleicht reicht es. und bei Aider kannst sogar recht einfach umschalten. Also immer Lokal arbeiten und wenn du was großes brauchst, nimmst eine Kostenpflichtige Variante

Tornhoof · 1. Juni 2026

adfsrg schrieb:
Das würde mir doch nichts bringen, oder? Die Abrechnung ist doch gleich, oder ist CLI da anders?

Jo, nur insgesamt effizientere Nutzung von tools, was VS (aktuell) noch nicht kann, VS liest immern och sehr viele Dateien komplett ein, also z.b. mit grep/sed/find tools nur die Zeilen zu lesen die es braucht.
Das meinte ich mit dem ganzen Block dass du nur einen Bruchteil nutzt.

G0ku⁷³⁷ · 1. Juni 2026

Was Coding angeht ist das beste, was man aktuell lokal auf einer 24GB GPU betreiben kann, Qwen 3.6. Entweder mit 35B als MoE oder 27B als Dense Variante.

Beides musst du aber in quantisierter Form (4/3 Bit) laufen lassen, damit es zusammen mit dem Context in den VRAM passt.

Als alternative könntest du dir mal abo Modelle ansehen. Da ich die Plugins in VS nicht kenne und nur in VS Code unterwegs bin, muss man da schauen welche auch Abo Anbieter supporten. Über Abos kann man deutlich mehr Token nutzen als API Calls mit Token genauer Abrechnung für das selbe Geld.

Über die Alibaba Cloud kann man z.B. über die Coding Pläne aktuelle Modelle wie Qwen 3.6 Plus, GLM 5, MiniMax M2.5 oder Kimi K2.5 nutzen.

AAS · 1. Juni 2026

madmax2010 schrieb:
ja, schon klar. guter.
was ich sagen will, wenn du ernsthaft damit arbeiten willst, ist der VRAM bei den modellen die wir gerade nutzen koennen zu wenig. Das macht keine freude

Genau, das ist ein besseres Auto Complete.

Brauch die RTX für eine Vektordatenbank (RAG) und bau dir einen Agentic RAG, lasse deine Skills z.B. mit https://github.com/microsoft/SkillOpt verbessern aus "Lessons Learned"
Wenn du Produktiv arbeiten willst, löse dir ein Max Abo oder gehe in die chinesische Cloud.

Nutze die Energie und bau dir einen vernünftigen Agentic Stack, der was cachen kann, dann verballerst du auch nicht unnötig Token:

Was einfaches zum Anfangen:
https://github.com/GiovanniPasq/agentic-rag-for-dummies

Suche

Visual Studio 2026: lokale LLMs als Copilot-Ersatz für C#-Agent-Work? Empfehlungen?

adfsrg

Lieutenant

Tornhoof

Captain

chr1zZo

Commodore

adfsrg

Lieutenant

madmax2010

Fleet Admiral

adfsrg

Lieutenant

madmax2010

Fleet Admiral

the_nobs

Commander

Tornhoof

Captain

G0ku⁷³⁷

Lt. Commander

AAS

Commander