News GitHub Copilot: Coding-Assistent soll KI-Guthaben effizienter nutzen

Die wilde Inge · Gestern um 19:22

GitHub arbeitet daran, Copilot effizienter mit KI-Guthaben umgehen zu lassen. Dafür soll der Assistent in längeren Sitzungen weniger wiederkehrende Informationen erneut verarbeiten und zugleich besser entscheiden, welches KI-Modell für die jeweilige Aufgabe passend ist.

Zur News: GitHub Copilot: Coding-Assistent soll KI-Guthaben effizienter nutzen

MaverickM · Gestern um 19:28

Na das liest sich doch schon mal nicht schlecht, auch wenn ich in VS Code die KI bisher nur wenig nutze. Token musste ich bisher noch keine Aufladen.

dermoritz · Gestern um 19:35

... ist bitter nötig. Nach der Preisanpassung hat Github eine verdreifachung der kosten prognotiziert. Wir sind inzwischen stark drüber, teilweise sind wir bei 200$ pro Entwickler und Monat - und der Monat ist noch nicht rum.
Keine Ahnung wo das hinführt - weiß noch nicht mal ob das gut ist.

R O G E R · Gestern um 19:38

Die sollen wieder den Edit Modus zurück bringen.

Also der Chat ist ja gut für Fragen nur mit dem Agent Modus werde ich nicht warm. Ich will schon wissen was der da so macht.
Habe mir jetzt einen eigenen Agenten erstellt der Quasi den Editmodus abdeckt aber warum muss man sowas machen.

Tornhoof · Gestern um 19:51

dermoritz schrieb:
Wir sind inzwischen stark drüber, teilweise sind wir bei 200$ pro Entwickler und Monat

Hehe, die GitHub Credits wurden für eine Organisation alle in einen Topf geschmissen, im unserer Organisation sind es grobe 3000 Leute, fifo Prinzip, daher wurde bei uns GitHub Copilot gesperrt bis das Topf Problem gelöst ist

lugge · Gestern um 19:59

Hm, bin mal gespannt. Hatte früher immer schon auf "Auto" gestellt um die 10% Rabatt auf die Nutzung zu bekommen. War dann nach der Abrechnungsweise von Github (Zu Anfang Juni?) aber doch etwas geschockt, als meine Nutzung innerhalb von 2-3 Tagen (war auch intensive Nutzung) auf 30 % hochgeschossen bin, weil der wohl irgendwelche teuern Modelle verwendet hat. Vielleicht liegt es auch daran, dass die Modelle generell teurer geworden sind.

SheepShaver · Gestern um 20:08

Tornhoof schrieb:
Hehe, die GitHub Credits wurden für eine Organisation alle in einen Topf geschmissen, im unserer Organisation sind es grobe 3000 Leute, fifo Prinzip, daher wurde bei uns GitHub Copilot gesperrt bis das Topf Problem gelöst ist

Nicht ganz richtig. GitHub Copilot kann auch individuelle Budgets pro Nutzer vergeben. Bei uns hat jeder sein eigenes Kontingent an Premium-Requests. Kann man individuell wieder auffüllen. Kein gemeinsamer Topf für die ganze Org. Ist also Konfigurationssache, kein generelles Copilot-Verhalten.

@Topic
Die News ist irreführend. Es geht um den VS-Code-Harness, nicht um Copilot generell. Prompt-Caching und Tool-Search sind laut GitHub-Blog explizit VS-Code-Harness-Logik. Auto/HyDRA läuft bisher nur in VS Code, github.com und mobil.
Wer GitHub Copilot in anderen Harnesses nutzt, wird davon nichts mitbekommen.

Brrr · Gestern um 20:17

Ein bisschen Offtopic: Ich habe die letzten Wochen mit GPT 5.5 gepröbelt und fand es leicht besser als Claude Opus 4.8. Heute habe ich mich mal an Chinesische Modelle gewagt, GLM 5.2 grad (gehostet auf Europäischen Servern angeblich, Opencode Go). Bei der Aufgabe die ich ihm grad gegeben habe, hat es auf Anhieb den besseren Vorschlag gemacht als GPT 5.5 auf xhigh. Die nächsten Wochen mal weiter experimentieren.
Falls die Chinesischen Modelle wirklich so nah an den führenden Modellen sein sollten, dann hat es sich mit den hohen Firmenbewertungen von Anthropic und OpenAI.

Kizarou · Gestern um 20:22

@Brrr wo läuft GLM 5.2 denn? Passende Hardware?

ponchofiesta · Gestern um 20:26

Irgendwie vermisse ich in dem Artikel eine Quellenangabe.

oiisamiio · Gestern um 20:30

Nachdem Opus gesperrt wurde habe ich direkt gekündigt.
Mit der Umstellung auf das neue Abrechnungssystem völlig uninteressant.

Keine Ahnung, was gibt es eigentlich noch für eine Daseinsberechtigung für Github Copilot?
Die Gewohnheit?

Brrr · Gestern um 20:48

Kizarou schrieb:
@Brrr wo läuft GLM 5.2 denn? Passende Hardware?

Hätte ich gerne aber für GLM 5.2 braucht man ziemlich dicke Hardware. Habs hierüber ausprobiert: https://opencode.ai/de/go

Crizzo · Gestern um 20:54

ponchofiesta schrieb:
Irgendwie vermisse ich in dem Artikel eine Quellenangabe.

Du meinst solche eine:

Steht bei uns immer unten links.

Spriti · Gestern um 20:58

R O G E R schrieb:
Also der Chat ist ja gut für Fragen nur mit dem Agent Modus werde ich nicht warm. Ich will schon wissen was der da so macht.

Schau dir mal die Erweiterung ZooCode an, dort gibt es unter anderem einen Architect Modus. Der erstellt einen Plan, Rückfargen, etc, der anschließend im Code Modus umgesetzt werden kann.

Fighter1993 · Gestern um 21:00

Ich hab generell mal ne Frage. Antworten hier eigentlich nur Programmierer und Software Entwickler? Also Code Schreiber?!

Ich lese zwar fleißig mit, verstehe aber nur Bahnhof weil ich einfach nicht auf sowas angewiesen bin.

Spike S. · Gestern um 21:04

Ich werfe mal noch cortecs.ai in die Runde, europäischer Router bietet die "Großen" und auch in Europa gehostete Modelle, darunter GLM-5.2.

Muss mir auch mal mehr die Alternativen anschauen. GPT-5.5 im Copilot ist manchmal echt mühsam. Heute erst drei mal die instructions.md ignoriert. Bei einem Punkteplan werden gerne Punkte vergessen oder nicht ganz so wie besprochen umgesetzt...

Spriti · Gestern um 21:08

Brrr schrieb:
Die nächsten Wochen mal weiter experimentieren.

Kann nur jedem empfehlen verschiedene Modelle zu verwenden.

Nutze im Moment primär für Planung Deepseek V4 Pro Max und für die Umsetzung V4 Pro, wobei auch V4 Flash die meisten Dinge nach Vorgaben im Plan sehr gut umsetzt.
Visuelle Eingaben (Bilder) funktionieren mit Minimax M3.

Bei komplexeren Anforderungen dann mal ein höheres Modell wechseln um zu Debuggen oder den Plan erstellen zu lassen und dann wieder in Pro Max umsetzen lassen.

Das sparrt so immens viel Geld.
Für die meisten Aufgaben braucht man man nämlich kein High End Claude.

Unterschätzt wird von den meisten der Cache, alle gucken nur auf Input- / Output-Kosten. Bei Deepseek ist die Cache-Nutzungs spotbillig und damit bleiben die Gesamtkosten gering. Hab teilweise >80% Cache-Hit-Rate über einen Arbeitstag verteilt, das haut bei teuren Modellen richtig rein.

Siehe: https://openrouter.ai/compare/deeps...ek-v4-pro/minimax/minimax-m3/qwen/qwen3.7-max
über 70x ist z. B. Qwen3.7 Cache teurer als DS V4 und von Claude & Co. reden wir besser nicht.

Brrr · Gestern um 21:12

Spriti schrieb:
Unterschätzt wird von den meisten der Cache, alle gucken nur auf Input- / Output-Kosten.

Danke für deinen Beitrag. Interessant. Cache... das bedeutet dann aber auch die Speichern deine Daten für eine Weile, oder? Wie lange ist der Cache gültig? Kann man das Steuern also den Cache selber leeren?

derMutant · Gestern um 21:15

MaverickM schrieb:
Na das liest sich doch schon mal nicht schlecht, auch wenn ich in VS Code die KI bisher nur wenig nutze. Token musste ich bisher noch keine Aufladen.

wie ist es mit der Datenverarbeitung, wenn man das Angebot nutzt? Die werden doch sicherlich zum Training verwendet nehme ich an. Bei sensiblen Repos also eher abzuraten?

Brrr · Gestern um 21:16

derMutant schrieb:
Die werden doch sicherlich zum Training verwendet nehme ich an.

Zumindest bei OpenAI und Anthropic kann man das ausschalten. Persönlich glaube ich sie machens trotzdem.

News GitHub Copilot: Coding-Assistent soll KI-Guthaben effizienter nutzen

Redakteur

20k Fleet Admiral Pro

Lt. Commander Pro

Vice Admiral

Commander

Lt. Junior Grade

Commodore

Lt. Commander Pro

Cadet 4th Year

Ensign

Lieutenant

Lt. Commander Pro

Redakteur Pro

Lieutenant

Admiral Pro

Commander

Lieutenant

Lt. Commander Pro

Captain

Lt. Commander Pro