- Registriert
- Dez. 2014
- Beiträge
- 2.824
@abcddcba Das allein kannst du schon nicht gewaehrleisten wenn du einfach nur externe LLMs ueber Provider wie OpenRouter nimmst
Warum nicht? Begründung mit quelle wenn möglich danke
Ansonsten, Code kurz ueberflogen - machst nix neues/anderes, Agent mit Planning, Search Tool, Context Engineering, Compression und self-assessment.
Stimmt. Wie jedes andere Deep Research Tool auch. Was genau ist die Kritik?
Warum du dann nicht auf ein Agentic Framework aufsetzt waere noch interessant. Weder LangGraph noch Pydantic AI. Beide waeren eigentlich ganz passend, aber wolltest du wohl nicht, vermutlich willst du dich gegen andere Software Stacks aufstellen und vergleichen?
a) einen eigenen ansatz zu finden und b) keine abhängigkeiten. Agenten auf n8m zusammenklicken das kann jeder. Etwas eigenes Bauen nicht.
Und ich behaupte, das Tool hat fuer dich ein KI Tool gebaut, nennen wir "ihn" mal hm "Claude"? - was nun? Du bist und warst kein Entwickler (laut eigenen Angaben). Ganze "Projekt" zusammenbauenlassen in 3 Tagen
https://de.wikipedia.org/wiki/Vibe_Coding Ich verweise einfach mal hierin. Und ja. Vor 7 Monaten War ich noch kein Entwickler. Inzwischen bin ich es als Quereinsteiger. Auch hier sehe ich die Kritik nicht.
So. Hier ist der direkte Benchmark:
https://lutum-veritas.neocities.org/
Alle vier Tools der Big Player. Dieselbe Query. Gleiche Bedingungen.
Was drin steht:
Was das NICHT ist: Ein inhaltlicher Vergleich. Die Qualität der Berichte muss jeder selbst lesen und bewerten.
Was das IST: Ein objektiver, durch Zahlen gestützter Benchmark. Messbar. Nachvollziehbar. Verifizierbar.
Meine Claims stehen jetzt nicht mehr als Behauptungen im Raum - sie sind dokumentiert. Wer sie widerlegen will: Die Daten liegen offen. Ich warte.
Warum nicht? Begründung mit quelle wenn möglich danke
Ansonsten, Code kurz ueberflogen - machst nix neues/anderes, Agent mit Planning, Search Tool, Context Engineering, Compression und self-assessment.
Stimmt. Wie jedes andere Deep Research Tool auch. Was genau ist die Kritik?
Warum du dann nicht auf ein Agentic Framework aufsetzt waere noch interessant. Weder LangGraph noch Pydantic AI. Beide waeren eigentlich ganz passend, aber wolltest du wohl nicht, vermutlich willst du dich gegen andere Software Stacks aufstellen und vergleichen?
a) einen eigenen ansatz zu finden und b) keine abhängigkeiten. Agenten auf n8m zusammenklicken das kann jeder. Etwas eigenes Bauen nicht.
Und ich behaupte, das Tool hat fuer dich ein KI Tool gebaut, nennen wir "ihn" mal hm "Claude"? - was nun? Du bist und warst kein Entwickler (laut eigenen Angaben). Ganze "Projekt" zusammenbauenlassen in 3 Tagen
https://de.wikipedia.org/wiki/Vibe_Coding Ich verweise einfach mal hierin. Und ja. Vor 7 Monaten War ich noch kein Entwickler. Inzwischen bin ich es als Quereinsteiger. Auch hier sehe ich die Kritik nicht.
Ergänzung ()
So. Hier ist der direkte Benchmark:
https://lutum-veritas.neocities.org/
Alle vier Tools der Big Player. Dieselbe Query. Gleiche Bedingungen.
Was drin steht:
- Original-Links zu allen vier Deep Research Durchläufen (ChatGPT, Perplexity, Gemini, Lutum)
- Zeichenlänge, Quellenanzahl, Kosten pro Query
- Quellen-Effizienz (wie viele der gefetchten Quellen tatsächlich genutzt werden)
- Dokumentierte Schwächen der Konkurrenz - mit Nachweisen
Was das NICHT ist: Ein inhaltlicher Vergleich. Die Qualität der Berichte muss jeder selbst lesen und bewerten.
Was das IST: Ein objektiver, durch Zahlen gestützter Benchmark. Messbar. Nachvollziehbar. Verifizierbar.
Meine Claims stehen jetzt nicht mehr als Behauptungen im Raum - sie sind dokumentiert. Wer sie widerlegen will: Die Daten liegen offen. Ich warte.
Zuletzt bearbeitet: