Fireplace
Mobile Footer Layer

News Zu wenig Computing-Kapazitäten: Anthropic blockiert Drittanbieter-Agenten wie OpenClaw

@Lynacchi
Das mit den Claude Limits war schon damals bei der Einführung von den 3.x Versionen. Bis dahin hatte ich auch das kleine Paket abonniert gehabt und war von den damaligen Fähigkeiten im Bereich Coding schon begeistert. Aber die Limits waren nach so wenigen Anfragen erreicht. Ich hatte es seitdem nicht mehr abonniert und würde es heute auch nicht tun, weil es nicht besser wurde mit den Limits.

Nun zahle ich einfach 0,12 $ pro Opus 4.6 Anfrage mit Github Copilot Premium. Bzw. in den 10 Dollar Monatsgebühr sind 100 Anfragen davon enthalten. Damit komme ich schon weit und wenn es noch 10 oder 30 $ zusätzlich sind im Monat, ist das auch ok. Ich glaube das direkte Nutzen der API wäre teurer. Vorteil über Github Copilot, ich kann in 5 Stunden so viel machen, wie ich will und habe keine Wartezeit. Mit dem Claude Abo müsste ich für die Sachen wahrscheinlich wegen der Limits dieselben Aufgaben über mehrere Tage verteilen.

@Syranite
Das gemma4 habe ich tatsächlich heute sehr viel genutzt, um aus Spass eine Vereinswebseite die nur in .html war, mal etwas aufzuhübschen. Das geht echt super aber das 31B Modell ist recht langsam. Die 20 GB verursachen noch so viel weiteren Speicherbedarf fürs Reasoning, da brauch es mehr als 32 GB. Das 26B geht aber gut.

Hoffentlich reduziert die neue nVidia Kompression von Texturdateien nicht den VRAM zukünftiger Grafikkarten, weil der Speicherbedarf nun so sinken könnte. Für LLMs kann man nicht genug VRAM haben.
 
  • Gefällt mir
Reaktionen: WauWauWau und Skidrow1988
Ich habe mein Abo auch gekündigt. Trotz Abo erreiche ich das Limit nach ca 10 Minuten und muss dann 5h warten bis es zurückgesetzt wird.
Bei OpenAI bin ich noch nie an ein Limit gestoßen (ich wusste bis Claude gar nicht, dass man überhaupt eins hat bei einem bezahlten Abo)
 
  • Gefällt mir
Reaktionen: Skidrow1988
Zuviel Turingmaschinen angeschlossen? Kann ja nichts bei rauskommen. :p
 
  • Gefällt mir
Reaktionen: Sebbe
Das hat man davon wenn die Modelle einen dazu anstiften noch 5 andere Sachen in den Code einzubauen mit ihrem "möchtest du nicht noch X haben?" in den Antworten ;)

Irgendwo müssen die Investitionen wieder reinkommen und ganz ehrlich wenn die Leute nur rumspielen mit ihren KI Agenten, geht Mischkalkulation nicht auf.
 
  • Gefällt mir
Reaktionen: jotecklen
TeeKayEV schrieb:
Da unterliegst du einem Denkfehler: Es ist noch fast nichts der Ankündigungen fertig gebaut, der Großteil nichtmal begonnen worden. Inwiefern die begonnenen Bauprojekte bei Projektfertigstellung die Kapazitätsengpässe beheben werden, ist daher derzeit noch unbekannt.


Trotzdem sind die Preise für Token im fallen
Also wenn sie nicht genug Datencenter haben und sie keine/nicht genug neue bauen.

Und angeblich nicht compute Leistung verfügbar ist. Warum fallen die Preise weiter und warum kann man aus einem 300USD Abo basierend auf den inkl Token knapp 1200 USD Token value raus ziehen?
 
DeusExMachina schrieb:
und warum kann man aus einem 300USD Abo basierend auf den inkl Token knapp 1200 USD Token value raus ziehen?
Weil es alles stark subventioniert ist. Man macht alle abhängig und nimmt dann die wirklichen Preise


Wenn mich die Erinnerung nicht trübt, wurde es hier thematisiert. Auch warum die Börsen nicht eingebrochen sind, obwohl nur 50% aller Rechenzentren gebaut werden.
 
  • Gefällt mir
Reaktionen: Seppuku, Renegad3, jotecklen und 4 andere
@herby53 Das Ding mit VS Code und GitHub Copilot kenne ich, habe da auch eine ganze Weile ein Abo gehabt. Das ist definitiv besser, als Claude mit einem normalen Pro-Abo zu nutzen. Das wusste ich aber beim Wechsel von Copilot zu Claude noch nicht. Man könnte jetzt sagen, dass ich auch einfach wieder zurückwechseln könnte, mir geht es aber auch darum, neben dem Coding-Aspekt einen KI-Begleiter für allen möglichen Mist zu haben. Und da bin ich gerade mit GPT (zumindest soweit ich das in den letzten 3-4 Tagen testen konnte) besser bedient.

Ich muss aber gestehen, dass mir der Stil, wie Claude schreibt, grundsätzlich besser gefällt. Claude kann auch hervorragend zwischen ernsten Lagen und humorvollen Situationen unterscheiden und seinen Tonfall dementsprechend anpassen. GPT bleibt da immer gleich stumpf. Man kann das Verhalten zwar festlegen, sei humorvoll, dann lacht sich GPT bei einem Todesfall den Arsch ab, oder stell es auf nüchtern und trocken, und selbst bei den krassesten Memes kommt nicht ein Augenzwinkern. GPT scheint da wirklich stocksteif auf seine Voreinstellung zu beharren. Wobei Claude auch grundsätzlich einfach "schöner" schreibt.

Aber das ist jetzt wohl zu OT, daher belass ich es mal dabei.
 
KeinNutzerName schrieb:
[:confused_alt:
Und was haben diese Leute vor 10 Jahren gemacht ? :schluck::heilig:
Vor 10 Jahren brauchte man jemanden der sich auskennt.
Ich habe mit Grok in 2 Tagen eine. Auswertung per Excel erstellt über Arbeitszeitverstöße, Einhaltung der Arbeitszeiten Feiertagsausgleiche usw.
Die Tabelle die irgendwer vor x Jahren mal gemacht hat war komplett manuell zu füttern. Jetzt pakc ich einfach die Daten aus den verschiedenen Systemen in einen Ordner und hab mit dem Öffnen der Datei meine Daten. Spart jede Woche 1,5h Arbeit.
 
  • Gefällt mir
Reaktionen: WauWauWau und bobitsch
Tomsenq schrieb:
Vor 10 Jahren brauchte man jemanden der sich auskennt.
Ich habe mit Grok in 2 Tagen eine. Auswertung per Excel erstellt über Arbeitszeitverstöße, Einhaltung der Arbeitszeiten Feiertagsausgleiche usw.
Das wichtige ist bei allen Arten von wiederkehrenden Tätigkeiten. Einmal Arbeit Reinstecken und dann läuft es offline und automatisch.
Ob das jetzt die KI baut oder der Mensch ist nicht entscheidend, wichtig ist dass die Ergebnisse reproduzierbar sind, die Logik klar und man nicht stets im Abo nochmal weiter bezahlt für den nächsten Vorgang.
Sonst zahlt man am Ende drauf.
 
Wichtig ist das die Ergebnisse stimmen

Egal wer es macht
 
  • Gefällt mir
Reaktionen: JP-M, GameOC, jotecklen und 2 andere
Syranite schrieb:
Mit gemma4 hat man jetzt auch was lokal. Jetzt brauch ich nur noch ne Graka mit 32GB... Die kleineren Modelle laufen aber auch auf ner CPU echt schnell.

Du kannst auch Qwen 3.5 27B in 5-bit GGUF quant nehmen. Das ist genauso gut wie Gemma4. Kann man perfekt mit 32k Kontextfenster in LM Studio mit ner 24GB Grafikarte und 35 token/s nutzen.
 
  • Gefällt mir
Reaktionen: schneeland, Belter, Kuristina und eine weitere Person
Habe mal duck.ai Mistral ausprobiert was die da abliefert wäre mir aktuell kein Geld wert.
Oft veraltete Ergebnisse z.B. wenn man die nach einem PC fragt wird Intel 12700K oder AMD 5800X3D empfohlen, ja mit der aktuellen RAM Krise verständlich aber ich habe das vor der Krise gefragt.
Oder der Bildgenerator liefert in 9 von 10 Fällen gar keine Ergebnisse. Nichts wofür ich Geld ausgeben würde.
 
  • Gefällt mir
Reaktionen: HOCLN2
@Andy
Anthropic hatte Ende März verkündet, dass die Nutzungslimits begrenzt werden.
Die Nutzungsbegrenzung wird begrenzt? "..., dass die Nutzungen begrenzt werden". <- das hier ergibt von der Grammatik Sinn. Man kann also nicht ein Limit nochmals begrenzen – das wäre so wie „Verbote werden verboten" oder „Grenzen werden begrenzt".
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Andy
@Spock55000

Die Nutzungsgrenzen.

Altes Limit 1000, neues Limit 100 (rein fiktive Zahlen). Limit wurde begrenzt. Passt schon mmn nach.
 
wagga schrieb:
Habe mal duck.ai Mistral ausprobiert was die da abliefert wäre mir aktuell kein Geld wert.
Oft veraltete Ergebnisse z.B. wenn man die nach einem PC fragt wird Intel 12700K oder AMD 5800X3D empfohlen, ja mit der aktuellen RAM Krise verständlich aber ich habe das vor der Krise gefragt.
Oder der Bildgenerator liefert in 9 von 10 Fällen gar keine Ergebnisse. Nichts wofür ich Geld ausgeben würde.
Ist ja auch ein kleine KI mit limitiertem Featureset und ohne Zugriff aufs Web. Was erwartest du dir hier ? Bewertest du Mercedes und sein F1-Team auch auf Basis eines durchgerosteten C220 CDI vom Schrottplatz ?🤣

"Nichts wofür ich Geld aus geben würde". Ja ach nee. Ist ja auch gratis und "you get what you pay for". :rolleyes:
 
  • Gefällt mir
Reaktionen: GameOC
wagga schrieb:
Oft veraltete Ergebnisse
wagga schrieb:
ja mit der aktuellen RAM Krise verständlich aber ich habe das vor der Krise gefragt.
Also vor einem halben Jahr getestet mit einer Aufgabe, für die LLM eher ungeeignet sind. Wenn du dich mit der Funktionsweise ernsthaft befasst hättest, dann hättest du dem System die letzten 100 Kaufberatungen im Forum als Kontext gegeben und dann auch eine vernünftige Ausgabe bekommen.
 
Alphanerd schrieb:
Man macht alle abhängig und nimmt dann die wirklichen Preise.
This! Ich habe privat Claude Max, am meisten stört mich diese Intransparenz. Keiner weiß, wie der Verbrauch berechnet wird. Anthropic dreht an der Limitschraube wie es ihnen beliebt, für ein bereits bezahltes Produkt.

Das fühlt sich in der Benutzung wie ein einarmiger Bandit an, wo man nicht weiß, was am Hebel ziehen kostet.
 
  • Gefällt mir
Reaktionen: ThirdLife, schneeland, Alphanerd und eine weitere Person
Lynacchi schrieb:
teilweise haben da schon einfache Umbauanfragen 25-50% vom 5h Limit mit
Ich habe meinen Spaß mit Markdown Files optimiert... hatte ihm nämlich die Tage gesagt "hier ist mein Plan, bau mal", nach 15 Minuten war er fertig und zack, 30% weg... Dann habe ich mich mit seinem Gedächtnis etwas befasst. Mein Projekt nochmal gelöscht, gesagt "mach mal" und dann waren es nur noch 17%... Man kann das auf jeden Fall optimieren, ist halt wie ein Azubi, dem man was beibringen und erklären muss.

Was mir aber vor Wochen schon aufgefallen war... Thema 5 Std. Limit... waren das nicht mal 4 Std.?

Bezüglich der Nutzung von OpenClaw und Anthropic, irgendwo wurde schon öfters erwähnt, dass das wohl nicht erlaubt sein soll, aber scheinbar nutzen es doch einige. Sehr spannend.

OpenClaw muss ich mir auch irgendwann nochmal anschauen... vielleicht auch mal mit einem lokalen LLM verbinden und gucken, ob er das kann was ich für meine billow Sachen so mache. Zeit hab ich ja :D

KeinNutzerName schrieb:
Und was haben diese Leute vor 10 Jahren gemacht ?
Die haben einfach nicht gearbeitet... konnten sie ja nie. Gab ja keine KI! :D

Ich habe schon oft von Leuten erfahren, dass es Mitarbeiter in Unternehmen gibt, die hätten gerne Zugang zu KI und wenn man sie fragt, warum sie dieses benötigen, gibt es Argumente wie "weil alle KI nutzen" oder "damit ich arbeiten kann" :D
 
Das mit den Limits erwischt mich aktuell ständig, aber ich nutze Claude nur im Terminal - ohne OpenClaw und anderen kram!

Alleine schon das Erstellen eines Plans für meine Anime-Datenbank App die ich von WPF nach AvaloniaUI portieren will, killt die Hälfte meines Pro-Limits und wenn er dann loslegt, dann bricht er auch recht schnell ab - obwohl er schon effizient die kleinsten Klassen zuerst implementiert.

Habe das ganze auch mal mehrfach mit ollama und claude mit dem lokalen Model Gwen 3.5 35B laufen lassen - das passt gerade so in meine GPU. Aber die Ergebnisse sind nicht so toll, vor allem schafft er es nicht vorhandene Dateien anzupassen auf anhieb (kommt ein roter Fehler) und brauch einige Versuche bis es dann klappt. Dazu ignoriert er, die bereits schon existierende Klassen BindableBase und ViewModelBase zu verwendsen und implementiert INotifyPropertyChanged direkt. Auch bei den Collections macht er komische Dinge...

Gut man muss auch hinzufügen, die WPF App ist recht komplex aufgebaut - obwohl der Core-Teil komplett abstrahiert ist.

Im Endeffekt muss ich warten bis das Limit von Claude-Pro resettet ist... weil Gwen 3.5 es nicht hinbekommt.
 
Zurück
Oben