News Google mit zwei „P“: Wie der AI Overview beim Buchstabieren scheitert

Andy

Tagträumer
Teammitglied
Registriert
Mai 2003
Beiträge
8.397
Google startet die nächste Ausbaustufe der KI-Suchmaschine, kämpft aber weiterhin mit Problemen und Fehlern. Ein aktueller Fauxpas: Wenn man fragt, wie viele „P“s im Wort Google enthalten sind, lautet die Antwort 2. Der Grund für solche Antworten ist nach wie vor die Architektur der KI-Sprachmodelle (LLM).

Zur News: Google mit zwei „P“: Wie der AI Overview beim Buchstabieren scheitert
 
  • Gefällt mir
Reaktionen: internetnutzer und aid0nex
Grad mal getestet und wie gewohnt erledigt Google KI alles prima. :) Witzigerweise ist dieser CB Artikel hier schon eine Quellenangabe (2. Bild). ^^ Aber ist ja auch bevorzugt.

1779983793951.png 1779984076372.png
 
  • Gefällt mir
Reaktionen: WauWauWau
Google, gib mir die Lottozahlen von letztem Donnerstag!
„Grünkohl mit Pinkel, Kassler, Bauchfleisch und Kochwürsten.“

Ähm ja…
 
  • Gefällt mir
Reaktionen: Alphanerd
Bei Perplexity habe ich oft, dass chinesische oder kyrillische Wörter in Antworten gestreut werden.
Also die KI merkt nicht mal, dass ein komplett andere Schrift keinen Sinn macht.
Das hatte ich mit Copilot nie.
 
Ich kenne mich mit KI nicht viel aus, aber wenn sie noch nicht einmal Buchstaben zählen kann, wie soll man dann anderen Antworten vertrauen? Wie viel KI steckt dahinter, wenn man solche Fehler manuell herauspatchen muss? Zusammenfassen kann sie ja, das ist bei Google schon ganz praktisch.
 
Zuletzt bearbeitet:
@Vitche Bei deinem Screenshot hat Google nicht selbst gezählt, sondern das Internet danach durchsucht.

1779988669044.png

Darum wird ComputerBild auch bei dieser Antwort verlinkt.
 
Auch Gemini 3.5 Flash fängt erst mit Reasoning an, brauchbare Ergebnisse zu liefern. Idiotischerweise ist die Standardeinstellung "Standard" auf der Webseite wohl quasi off, oder nah dran. Der scheitert damit an den dümmsten Dingen.
Ich glaube, LLMs ohne Reasoning sollte man sich abschminken (und aufhören, die Leute damit zu verunsichern).
Opus ist zwar erstaunlich gut ohne Reasoning, aber auch schon ziemlich teuer. Was imho fraglich erscheinen lässt, ob da nicht intern doch etwas Reasoning-artiges läuft.
 
Mein Gott, Leute. Die werden wohl kaum über Nacht neue Modelle trainiert haben, sondern jetzt für diesen speziellen Use Case entweder Logik hinzugefügt, oder den Kontext erweitert haben.

Vor allem, wenn der jetzt sogar Artikel direkt verlinkt, in denen der Fehler offen beschrieben wird; Natürlich (versucht) es den Fehler nun zu umschiffen.
 
Zurück
Oben