Die Ratatouille-KI: Coding ohne Coder: Vom Lesezeichen-Manager bis zur Datenanalyse
2/4Der Einstieg fällt leicht. Bedienen lässt sich Claude Code trotz Terminal-Fenster ohne größere Probleme, weil Chatbot-Eingaben wie gewohnt möglich sind. Man steuert den KI-Assistenten mit natürlicher Sprache. Insbesondere bei Coding-Projekten ist es aber empfehlenswert, den Prompt zunächst über den herkömmlichen Chat-Assistenten wie Claude zu entwickeln. So lassen sich verschiedene Optionen prüfen, Wünsche konkretisieren und ein Prompt erstellen, der technische Unterpunkte detailliert beschreibt.
Das Vorgehen beim ersten Projekt kann dann so aussehen:
- Einen lokalen Ordner erstellen, in dem Claude Code Schreibrechte erhält.
- Das GitHub-Konto mit Claude verbinden.
- Installation der Claude-Erweiterung für Chrome, damit Claude Code den Browser steuern kann.
- Prompt eingeben und dann laufend die Eingaben bestätigen, wenn Claude dazu auffordert.
- Wenn man bestimmte Aspekte nicht versteht, kann man die entsprechende Meldung einfach in den regulären Chat-Assistenten kopieren. Genauso wie Fehlermeldungen oder alle anderen Hinweise.
Standardmäßig startet Claude Code mit dem Alltagsmodell Sonnet. Bei komplexen Aufgaben kann man auf das Top-Modell Opus wechseln, damit erreicht man aber schnell die Token-Grenze. In der Regel reicht Sonnet aber aus und bietet deutlich mehr Spielraum. Seit Anthropic Ende März die Token-Limits reduziert hat, ist jedoch gerade zu typischen Bürozeiten schnell Schluss – etwa, wenn zwei Agenten parallel arbeiten. Reduziert werden sollten die Limits vor allem zu Stoßzeiten, Nutzerberichten zufolge kommt es dabei insbesondere bei den kostspieligen Abo-Stufen wie Max zu Problemen. Anthropic untersucht die Vorfälle derzeit.
Eine eigene Webseite
Der Auftakt für die Testreihe ist zunächst ein relativ simples Projekt: Eine persönliche Webseite für den Autor, die biografische Angaben und aktuelle Artikel aus einem RSS-Feed darstellt. Und das Erstellen der Webseite geht auch tatsächlich schnell von der Hand. Vom ersten Entwurf bis zum Upload auf GitHub – der ebenfalls komplett automatisiert erfolgt – dauert es kaum 30 Minuten. In diese Zeitspanne fällt auch die Registrierung bei GitHub.
Bereits im zweiten Anlauf ist das Resultat zufriedenstellend, die Qualität des Codes erscheint so weit in Ordnung. Prüft man die Webseite mit dem w3-Validator, zeigt dieser in der ursprünglichen Fassung lediglich einen Fehler an: Im Bildtitel der Porträtaufnahme befinden sich Leerzeichen. Es reicht aber, die Fehlermeldung in Claude Code zu kopieren. Mit dem Befehl „Fix it“ wird dieser dann automatisch korrigiert und der Agent führt zudem im Browser direkt einen weiteren Testlauf mit dem w3-Validator durch, um das Ergebnis zu prüfen.
Was Experten auffällt: Claude Code hat die Webseite von sich aus mit einem CORS-Proxy programmiert, um den RSS-Feed abzurufen. Das ist bei vielen Feeds erforderlich, weil vom Browser ausgeführtes JavaScript aus Sicherheitsgründen nicht in die Ressourcen (hier das Feed) hineinschauen darf, die es von anderen Websites lädt (sogenannte Same-Origin-Policy), es sei denn diese Website erlaubt das explizit durch Senden eines „Access-Control-Allow-Origin“-Headers. Ein zwischengeschalteter CORS-Proxy ergänzt diesen Header. Im Fall von ComputerBase ist das aber nicht nötig, weil ComputerBase den Header ohnehin mitsendet. Der Agent nutzte also von Haus aus einen Workaround, ohne zu testen, ob dieser überhaupt erforderlich ist. Per Aufforderung lässt sich der CORS-Proxy aber ohne Weiteres entfernen.
Nicht von Haus baut der Agent allerdings ein Impressum ein, obwohl in Deutschland eine Impressumspflicht besteht. Neben dem mangelnden Code-Verständnis ist das für Laien eine weitere Baustelle: Rechtliche Beratung liefert der KI-Assistent (zunächst) nicht, erst auf konkrete Nachfrage gibt es entsprechende Hinweise. Für die Bürokratie ist man selbst verantwortlich.
Produktivitätshelfer: Lesezeichenmanager mit RSS-Feed und Artikel-Zusammenfassungen
Wenn man als Redakteur tätig ist, sind exzessive Lesezeichen-Sammlungen ebenso naheliegend wie ein RSS-Feed, um die Nachrichtenflut im Blick zu behalten. Beides in einem Tool zu kombinieren, ist also naheliegend. Außerdem soll der Lesezeichen-Manager noch in der Lage sein, automatisiert eine bestimmte Auswahl von Artikeln in einer Word-Datei zusammenzufassen, sodass man direkt mit einem Bericht starten kann.
Die erste Erkenntnis bei diesem Projekt: Die App läuft und lässt sich laufend verbessern. Es macht enormen Spaß, iterativ an so einem Projekt zu arbeiten, Schwachstellen auszumerzen und am Workflow zu schrauben.
Die zweite Erkenntnis: Nur weil man die App generieren kann, heißt es nicht, dass sie tatsächlich alltagstauglich ist. Man bekommt das Design, das man sich wünscht – im guten wie im schlechten. Funktionale Software entsteht nicht auf Knopfdruck. Fehler, die im Prozess auftauchen, lassen sich in der Regel gut mit den KI-Assistenten ausmerzen. Wenn das Benutzer-Interface unausgegoren ist, wäre es hingegen schon sinnvoll, mit zentralen Konzepten der Software-Entwicklung vertraut zu sein.
Und die dritte Erkenntnis: Wenn die eigene Lesezeichen-Sammlung so etwas wie ein Recherche-Grundgerüst ist, will man es nicht direkt in einem Agenten-System verwalten, das aus irren Gründen womöglich plötzlich alles löscht oder Einträge manipuliert. Nach Jahren des Halluzinierens fehlt das Vertrauen.
Claude Code weist auf Sicherheitsmängel hin
Zweifel an der Code-Qualität sind indes überschaubar. Eine mit Claude Code generierte App wirkt im Zeitalter der Enshittification nicht anfälliger als beispielsweise ein Web-Dienst, bei dem man seine Daten eingibt. Und während des Coding-Prozesses fällt auf, dass der KI-Assistent darauf dringt, bestimmte Sicherheitsvorgaben einzuhalten. Mehrfach folgte etwa die Aufforderung, einen Claude-API-Key zu wechseln, der ins Chat-Fenster eingegeben wurde.
Security note: You may want to rotate this key since it's now visible in our conversation history. You can generate a new one at https://console.anthropic.com/ and update it via Settings in the app.
Solche Hinweise erfolgen generell, wenn Passwörter involviert sind. So entsteht zumindest das Gefühl, dass Anthropic Maßnahmen ergreift, um die Sicherheit der Nutzer zu schützen.
RAM-Preise überwachen
Angesichts der aktuellen Preiskrise bei RAM und Speicher war es naheliegend, ein Skript zu entwickeln, das bestimmte Produkte auf den Preisvergleichsportalen überwacht. Realisieren lässt sich so etwas. Weil Preisvergleichsportale den Zugang aber mit Rate-Limits begrenzen, ist es aufwändiger. Der Haken ist aber vor allem ein ethischer: Statt Workarounds zu entwickeln, die Rate-Limits umgehen, hätte eigentlich die Botschaft sein müssen, dass Scrapper im AI-Zeitalter nicht sonderlich beliebt sind.
Ein Aspekt, der zu einem weiteren Grundsatz-Problem der Coding-Assistenten führt: Technisch hat man weitreichende Möglichkeiten. Vorstellungen über die Schäden, die man potenziell anrichten kann, haben aber nur Experten, die mit der Materie vertraut sind. Technische Kompetenz als Hürde für Dummheiten und Sorglosigkeiten entfällt ein Stück weit.
Datenanalysen und Budget-Verwaltung: Agenten im Büroalltag
Was sich im Alltag als besonders hilfreich erweist, sind die Fähigkeiten zur Datenanalyse. Zahlen waren lange Zeit eines der Probleme der KI-Systeme, die den praktischen Nutzen enorm schmälerten. Die Sprünge in den letzten Monaten sind jedoch enorm. Zuverlässige Ergebnisse liefert Claude etwa beim Test, die Angebote für eine Haussanierung in eine Excel-Tabelle zu übertragen.
Ohnehin ist das Bearbeiten von Excel-Tabellen ein Bereich, der gut funktioniert. Bei Budget-Tabellen lässt sich etwa ein Reiter für das aktuelle Jahr anlegen, der zentrale Informationen und die Formatierung aus dem Vorjahr übernimmt. Aktuelle Rechnungen lassen sich dann einfach einfügen, indem man Produktname und Preis eingibt. Änderungen über mehrere Reiter hinweg sind ebenfalls mit einer einzelnen Eingabe möglich. Manchmal hakt es noch bei der Formatierung und dem Design, Prompt-Eingaben sind dann mehrfach erforderlich. Ein Zeitgewinn ist aber jetzt schon messbar.
Auch spezifische Daten aus mehreren Datenquellen zu erfassen und zu analysieren, klappt mittlerweile zuverlässig. Ein Beispiel: Im Datensatz (Excel-Datei) des Breitbandatlas' der Bundesnetzagentur wird etwa zwischen dicht besiedelten, mitteldicht besiedelten und dünn besiedelten Gemeinden unterschieden. Pro Gemeinde gibt es den Wert für die Glasfaserausbau-Quote. Die Aufgabe war nun, die Durchschnittswerte für die einzelnen Raumkategorien zu berechnen und die Entwicklung über drei Erhebungen in 1,5 Jahren zu ermitteln. Die Agenten mussten also in drei Dateien die passenden Spalten filtern und dann die Daten korrekt herausziehen.
Das Ergebnis kurzum: Es funktioniert. So lassen sich dann auch Aufgaben in weniger als 15 Minuten bewältigen, für die bis dato Stunden fällig sind.
Keine offensichtlichen Halluzinationen im Testzeitraum
Nicht aufgefallen sind im Testzeitraum offensichtlich fehlerhafte und halluzinierte Ergebnisse, für die die KI-Assistenten bis dato berühmt und berüchtigt sind. Kleinere Abweichungen und Mängel treten hin und wieder auf, Fehler sind aber nicht gravierend. So passte bei einer Budget-Tabelle zunächst die grafische Formatierung nicht; als das Problem gelöst werden sollte, wurden bei der Gesamtsumme die 19 Prozent Umsatzsteuer zweifach hinzugerechnet.
Solche Fehler erkennt man aber, wenn man ein Gefühl für die Daten und Tabellen hat. Beim Kern der Analysen waren die Ergebnisse im Testzeitraum hingegen korrekt. Wie zuverlässig die Datenanalysen im großen Maßstab sind, lässt sich so nicht sagen. Erneut ist es das Vertrauen und die Verantwortlichkeit, die beim Einsatz immer wichtiger werden.
Generell ist bei den Datenanalysen empfehlenswert, nicht mit der CLI-Version zu arbeiten, sondern die Desktop- oder Web-App zu nutzen. Diese liefern die Ergebnisse binnen kurzer Zeit, während die CLI-Version des Agenten längere Zeit rechnet.
Weitere Anwendungen, die sich so realisieren lassen
Die Einsatzzwecke sind enorm, abgedeckt wird praktisch alles, was in irgendeiner Form unter Web- oder Datenanalyse fällt. Zu den Beispielen, die im KI-Podcast der ARD genannt werden, zählen etwa das Sortieren von Bildern nach Standorten oder das Ausfüllen von Online-Dokumenten. Das Erstellen privater Datenbanken für Texte oder Bilder ist ebenso möglich wie das Überwachen von bestimmten Webseiten oder Online-Shops.