Fireplace April 2026

Visual Studio 2026: lokale LLMs als Copilot-Ersatz für C#-Agent-Work? Empfehlungen?

adfsrg

Lieutenant
Registriert
Dez. 2024
Beiträge
647
Hi zusammen,

ich nutze seit längerem GitHub Copilot direkt in Visual Studio für C#-Entwicklung und vor allem für agentisches Coding. Durch die neue Abrechnung bin ich gerade am Überlegen, ob ich auf ein lokales Setup umsteige.

Wichtig ist mir:
  • Nutzung in richtigem Visual Studio, nicht VS Code
  • möglichst ähnlicher Workflow wie Copilot Chat
  • gute Unterstützung für C#, Refactoring, Projektkontext und Dateiänderungen
  • idealerweise lokal über LM Studio oder ein ähnliches Setup
  • läuft auf einer RTX 4090
Meine Fragen:
  1. Welche Extensions für Visual Studio 2026 sind aktuell empfehlenswert?
  2. Gibt es brauchbare lokale Alternativen mit Chat + Agent-Workflow?
  3. Welche Modelle funktionieren für C# und agentisches Coding am besten lokal?
  4. Hat jemand Erfahrungen mit LMLocal oder ähnlichen Plugins in Visual Studio?
Ich bin offen für Empfehlungen, aber bitte nichts nur für VS Code — ich suche wirklich Lösungen für das volle Visual Studio.

Danke euch!
 
  • Gefällt mir
Reaktionen: SomeDifferent
Kannst du komplett vergessen aktuell (meiner Meinung nach). Die ganzen Hobbyprojekte wie LMLocal sind nicht gut integriert, afaik ist z.b. LMLocal auch schon wieder aufgegeben worden.
Selbst Jetbrains hat mit Junie aktuell noch keine Integration für Visual Studio geliefert.

Desweiteren wirst du C#, MSBuild Skripte, Projektdateien nur schwer mit lokalen LLMs gut bedienen können, die Menge an Daten die eingelesen wird überschreitet sofort jedes lokale Kontextfenster.

So oder so ist die Integration von LLMs in Visual Studio 2026 effektiv Monate hinter der Integration in VsCode oder gar Copilot CLI, einfach weil VS andere Releasezyklen und Testzyklen fährt, wird aber zugegebenermaßen besser.
Damit nutzt du jetzt schon nur einen Bruchteil der Agentfähigkeiten von Copilot aus.

Ich glaube du musst dir ernsthaft einen anderen Workflow überlegen und angewöhnen, ich bin von VS für die AI integration komplett auf Copilot CLI gewechselt.
 
Eine Lokale LLM mit entsprechender Power kostet paar Scheine :) Ansonsten nutze ein Cloud Basierten Dienstleister wo du auf alle AIs zugreifen kannst und via API koppeln kannst. IONOS Momentum / AI Model Hub ist da ganz praktisch.
 
chr1zZo schrieb:
IONOS Momentum / AI Model Hub ist da ganz praktisch.
Aber da hab ich doch auch wieder die tokenbasierte Abrechnung, die ich ja vermeiden will. Oder seh ich das falsch?
 
Tornhoof schrieb:
ich bin von VS für die AI integration komplett auf Copilot CLI gewechselt.
Das würde mir doch nichts bringen, oder? Die Abrechnung ist doch gleich, oder ist CLI da anders?
Ergänzung ()

madmax2010 schrieb:
nope. Das ist spielzeug
genau dafür wurde sie ja auch angeschafft ;)
 
  • Gefällt mir
Reaktionen: madmax2010
ja, schon klar. guter. :D
was ich sagen will, wenn du ernsthaft damit arbeiten willst, ist der VRAM bei den modellen die wir gerade nutzen koennen zu wenig. Das macht keine freude
 
  • Gefällt mir
Reaktionen: oicfar und konkretor
Also wir haben es getestet und es funktioniert grundsätzlich
als Client nutzen wir https://aider.chat/ und als LLM haben wir Openlama laufen.
Das coole daran ist, du kannst OpenLama auf einen "Server" laufen lassen und nicht auf deiner haupt work station.

Benchmarks haben wir keine Laufen lassen. Nur so einfache Tests und die gingen einwandfrei.

Nachdem das alles Open Source ist empfehle ich ein wenig rumzuspielen damit.
Vielleicht reicht es. und bei Aider kannst sogar recht einfach umschalten. Also immer Lokal arbeiten und wenn du was großes brauchst, nimmst eine Kostenpflichtige Variante
 
  • Gefällt mir
Reaktionen: adfsrg
adfsrg schrieb:
Das würde mir doch nichts bringen, oder? Die Abrechnung ist doch gleich, oder ist CLI da anders?
Jo, nur insgesamt effizientere Nutzung von tools, was VS (aktuell) noch nicht kann, VS liest immern och sehr viele Dateien komplett ein, also z.b. mit grep/sed/find tools nur die Zeilen zu lesen die es braucht.
Das meinte ich mit dem ganzen Block dass du nur einen Bruchteil nutzt.
 
Was Coding angeht ist das beste, was man aktuell lokal auf einer 24GB GPU betreiben kann, Qwen 3.6. Entweder mit 35B als MoE oder 27B als Dense Variante.

Beides musst du aber in quantisierter Form (4/3 Bit) laufen lassen, damit es zusammen mit dem Context in den VRAM passt.

Als alternative könntest du dir mal abo Modelle ansehen. Da ich die Plugins in VS nicht kenne und nur in VS Code unterwegs bin, muss man da schauen welche auch Abo Anbieter supporten. Über Abos kann man deutlich mehr Token nutzen als API Calls mit Token genauer Abrechnung für das selbe Geld.

Über die Alibaba Cloud kann man z.B. über die Coding Pläne aktuelle Modelle wie Qwen 3.6 Plus, GLM 5, MiniMax M2.5 oder Kimi K2.5 nutzen.
 
Zuletzt bearbeitet:
Zurück
Oben