Hallo,
ich brauche etwas Input, welche Prompts ich nutzen soll, um die Erzeugug von Fake-Daten zu vermeiden. Ein konkretes Beispiel: Ich habe eine Website, die Informationen enthält, die ich analysieren muss (wie Zeiten, Namen usw.). Da es keine Exportfunktion für die Daten gibt, habe ich das HTML gespeichert und sowohl Claude Sonet 4.0 als auch ChatGPT 4.1 (über Perplexity Pro) gebeten, den Code zu analysieren und die Daten so zu extrahieren, dass ich sie in Excel kopieren/einfügen kann. Ich musste die Datei zuerst in .txt umbenennen, da .html nicht akzeptiert wurde, aber OK..
Jetzt zu meinem Problem: Beim Überprüfen der Daten habe ich festgestellt, dass beide Modelle gefälschte Einträge generiert haben!
Mir ist bewusst, dass KI-Modelle dazu neigen, beim Recherchieren zu „lügen“, aber ich bin erstaunt, dass das sogar passiert, wenn sie vorhandene Daten analysieren sollen. Das macht das Ganze völlig unbrauchbar.
Gibt es eine Möglichkeit, ein solches Verhalten durch spezielle Prompts zu vermeiden? Ist eines der Modelle besser für die Datenanalyse /-Aufbereitung geeignet als andere?
Danke!
ich brauche etwas Input, welche Prompts ich nutzen soll, um die Erzeugug von Fake-Daten zu vermeiden. Ein konkretes Beispiel: Ich habe eine Website, die Informationen enthält, die ich analysieren muss (wie Zeiten, Namen usw.). Da es keine Exportfunktion für die Daten gibt, habe ich das HTML gespeichert und sowohl Claude Sonet 4.0 als auch ChatGPT 4.1 (über Perplexity Pro) gebeten, den Code zu analysieren und die Daten so zu extrahieren, dass ich sie in Excel kopieren/einfügen kann. Ich musste die Datei zuerst in .txt umbenennen, da .html nicht akzeptiert wurde, aber OK..
Jetzt zu meinem Problem: Beim Überprüfen der Daten habe ich festgestellt, dass beide Modelle gefälschte Einträge generiert haben!
Mir ist bewusst, dass KI-Modelle dazu neigen, beim Recherchieren zu „lügen“, aber ich bin erstaunt, dass das sogar passiert, wenn sie vorhandene Daten analysieren sollen. Das macht das Ganze völlig unbrauchbar.
Gibt es eine Möglichkeit, ein solches Verhalten durch spezielle Prompts zu vermeiden? Ist eines der Modelle besser für die Datenanalyse /-Aufbereitung geeignet als andere?
Danke!