Du verwendest einen veralteten Browser. Es ist möglich, dass diese oder andere Websites nicht korrekt angezeigt werden. Du solltest ein Upgrade durchführen oder einen alternativen Browser verwenden.
100% zu erreichen wird nicht möglich sein.
Also was ist schneller?
1000 Anfragen und dann von Hand überprüfen oder gleich 1000 anfragen richtig einordnen?
Ich arbeite in einem kleinen Verkehrsunternehmen und nutze ChatGPT für Unternehmen.
Ich habe ca.1000 Anfrage weitergeleitet bekommen, welche ich mit Hilfe der KI kategorisieren soll.
Es gibt 8 Kategorien, wo die ca.1000 Anfragen (2-3 Sätze/Anfrage) eingeordnet werden sollen.
Ja, KI ist nicht gleich KI, es gibt "bessere" und "schlechtere" Modelle Deine gleiche Anfrage in einem anderen LLM, funktioniert tadellos. In meinem Fall hab ich den Promt in Gemini probiert. Und das hat dann das verllorene Vertrauen in "sonstiges" einsortiert.
Leider hab ich das nicht als PDF exportieren können, daher der Link zum Chat.
Ja, KI ist nicht gleich KI, es gibt "bessere" und "schlechtere" Modelle Deine gleiche Anfrage in einem anderen LLM, funktioniert tadellos. In meinem Fall hab ich den Promt in Gemini probiert. Und das hat dann das verllorene Vertrauen in "sonstiges" einsortiert.
Leider hab ich das nicht als PDF exportieren können, daher der Link zum Chat.
Das Modell tut, was du von ihm verlangst, und versteht es halt trotzdem falsch.
In deinem Beispiel versteht das Modell halt nicht, dass das "Vertrauen" kein Gegenstand ist, den man in Bahn und Bus "verliert".
Wenn Du von den Anfragen ein paar nimmst, die eigentlich eine eindeutige Zuordnung zuließen, beobachtest Du das Problem weiterhin? Klingt für mich nach einer Form von "Laziness" und sowas habe ich bei vergleichbaren Aufgabentypen bereits beobachtet. Das scheint immer noch eine der Schwachstellen von LLMs zu sein. Ich glaube nicht, dass man hier allein durch besseres Prompting weiterkommt, sondern nur mit organisatorische Maßnahmen (wie Aufsplitten der Aufgabe).
Willst du die Nachricht in Kategorien einsortieren, oder das Anliegen des Kunden? Das sind ja zwei verschiedene Dinge. Darüber hinaus möglichst jede Nachricht in einem eigenen Request an das LLM schicken. Je mehr Nachrichten du versuchst, in einem Request zu bearbeiten, um so höher wird die Wahrscheinlichkeit, das Käse raus kommt.