Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
NewsGitHub Copilot: Coding-Assistent soll KI-Guthaben effizienter nutzen
GitHub arbeitet daran, Copilot effizienter mit KI-Guthaben umgehen zu lassen. Dafür soll der Assistent in längeren Sitzungen weniger wiederkehrende Informationen erneut verarbeiten und zugleich besser entscheiden, welches KI-Modell für die jeweilige Aufgabe passend ist.
... ist bitter nötig. Nach der Preisanpassung hat Github eine verdreifachung der kosten prognotiziert. Wir sind inzwischen stark drüber, teilweise sind wir bei 200$ pro Entwickler und Monat - und der Monat ist noch nicht rum.
Keine Ahnung wo das hinführt - weiß noch nicht mal ob das gut ist.
Also der Chat ist ja gut für Fragen nur mit dem Agent Modus werde ich nicht warm. Ich will schon wissen was der da so macht.
Habe mir jetzt einen eigenen Agenten erstellt der Quasi den Editmodus abdeckt aber warum muss man sowas machen.
Hehe, die GitHub Credits wurden für eine Organisation alle in einen Topf geschmissen, im unserer Organisation sind es grobe 3000 Leute, fifo Prinzip, daher wurde bei uns GitHub Copilot gesperrt bis das Topf Problem gelöst ist
Hm, bin mal gespannt. Hatte früher immer schon auf "Auto" gestellt um die 10% Rabatt auf die Nutzung zu bekommen. War dann nach der Abrechnungsweise von Github (Zu Anfang Juni?) aber doch etwas geschockt, als meine Nutzung innerhalb von 2-3 Tagen (war auch intensive Nutzung) auf 30 % hochgeschossen bin, weil der wohl irgendwelche teuern Modelle verwendet hat. Vielleicht liegt es auch daran, dass die Modelle generell teurer geworden sind.
Hehe, die GitHub Credits wurden für eine Organisation alle in einen Topf geschmissen, im unserer Organisation sind es grobe 3000 Leute, fifo Prinzip, daher wurde bei uns GitHub Copilot gesperrt bis das Topf Problem gelöst ist
Nicht ganz richtig. GitHub Copilot kann auch individuelle Budgets pro Nutzer vergeben. Bei uns hat jeder sein eigenes Kontingent an Premium-Requests. Kann man individuell wieder auffüllen. Kein gemeinsamer Topf für die ganze Org. Ist also Konfigurationssache, kein generelles Copilot-Verhalten.
@Topic
Die News ist irreführend. Es geht um den VS-Code-Harness, nicht um Copilot generell. Prompt-Caching und Tool-Search sind laut GitHub-Blog explizit VS-Code-Harness-Logik. Auto/HyDRA läuft bisher nur in VS Code, github.com und mobil.
Wer GitHub Copilot in anderen Harnesses nutzt, wird davon nichts mitbekommen.
Ein bisschen Offtopic: Ich habe die letzten Wochen mit GPT 5.5 gepröbelt und fand es leicht besser als Claude Opus 4.8. Heute habe ich mich mal an Chinesische Modelle gewagt, GLM 5.2 grad (gehostet auf Europäischen Servern angeblich, Opencode Go). Bei der Aufgabe die ich ihm grad gegeben habe, hat es auf Anhieb den besseren Vorschlag gemacht als GPT 5.5 auf xhigh. Die nächsten Wochen mal weiter experimentieren.
Falls die Chinesischen Modelle wirklich so nah an den führenden Modellen sein sollten, dann hat es sich mit den hohen Firmenbewertungen von Anthropic und OpenAI.
Schau dir mal die Erweiterung ZooCode an, dort gibt es unter anderem einen Architect Modus. Der erstellt einen Plan, Rückfargen, etc, der anschließend im Code Modus umgesetzt werden kann.
Ich werfe mal noch cortecs.ai in die Runde, europäischer Router bietet die "Großen" und auch in Europa gehostete Modelle, darunter GLM-5.2.
Muss mir auch mal mehr die Alternativen anschauen. GPT-5.5 im Copilot ist manchmal echt mühsam. Heute erst drei mal die instructions.md ignoriert. Bei einem Punkteplan werden gerne Punkte vergessen oder nicht ganz so wie besprochen umgesetzt...
Kann nur jedem empfehlen verschiedene Modelle zu verwenden.
Nutze im Moment primär für Planung Deepseek V4 Pro Max und für die Umsetzung V4 Pro, wobei auch V4 Flash die meisten Dinge nach Vorgaben im Plan sehr gut umsetzt.
Visuelle Eingaben (Bilder) funktionieren mit Minimax M3.
Bei komplexeren Anforderungen dann mal ein höheres Modell wechseln um zu Debuggen oder den Plan erstellen zu lassen und dann wieder in Pro Max umsetzen lassen.
Das sparrt so immens viel Geld.
Für die meisten Aufgaben braucht man man nämlich kein High End Claude.
Unterschätzt wird von den meisten der Cache, alle gucken nur auf Input- / Output-Kosten. Bei Deepseek ist die Cache-Nutzungs spotbillig und damit bleiben die Gesamtkosten gering. Hab teilweise >80% Cache-Hit-Rate über einen Arbeitstag verteilt, das haut bei teuren Modellen richtig rein.
Danke für deinen Beitrag. Interessant. Cache... das bedeutet dann aber auch die Speichern deine Daten für eine Weile, oder? Wie lange ist der Cache gültig? Kann man das Steuern also den Cache selber leeren?
wie ist es mit der Datenverarbeitung, wenn man das Angebot nutzt? Die werden doch sicherlich zum Training verwendet nehme ich an. Bei sensiblen Repos also eher abzuraten?