News Apple: Neue Siri soll von Google trainiertes Gemini-KI-Modell nutzen

iSight2TheBlind schrieb:
Ich habe "Sofalampe" und "Esstischunterbodenbeleuchtung" schneller angeklickt als ausgesprochen, wenn ich mich überhaupt an alle Lampennamen exakt erinnern kann.
Man könnte die auch auch einfach Sofa und Esstisch nennen.

Das ist nur der innere Monk, der dich hat so seltsame Namen wählen lassen.
 
Also zumindest ich schalte ja nicht mein Sofa ein...
 
@Lupin9 Macht ja nur Sinn die realen API Kosten (Pro 1 Million tokens) zu vergleichen, angegeben von den Herstellern direkt:
Opus 4.1: input 15$, output 75$
Sonnet 4.5: input 3$, output 15$ (<200k Token, sonst 22.50$)
Gemini 2.5 Pro: input 1.25$, output 10$ (<200k Token, sonst 15$)
Gemini Flash Lite: input 0.10$, output 0.40$

Das sind die wirklichen Kosten der Modelle, die bezahlt sowohl Perplexity als auch Guthub Copilot an die Hersteller. Und auch du, wenn du direkt bei den Herstellern kaufen würdest. Mögliche Mengenrabatte mal außen vor. Aber du wirst sicherlich bei einem 10 oder 20$ Abo nicht auf Opus 4.1 zugreifen können?

Bei Perplexity Pro bzw. Plänen wo man einmalig bezahlt, hat man ja ein Gesamtpaket mit verschiedenen Modellen und ein Gesamtlimit. Ich gehe aber stark davon aus, dass eine Anfrage mit Sonnet dort auch mehr von deinem Budget zieht als eine Anfrage mit Gemini. Und mit kleinen Modellen wie Gemini Flash kann man dort ja meistens beliebig viele Anfragen machen, weil es kaum etwas kostet.
 
  • Gefällt mir
Reaktionen: AlanK
snickii schrieb:
Das kann aber auch am Anwender liegen.
Wenn man zb. bei Alexa sagt Spiele Song XY kommt es manchmal zu Fehlern weil Alexa trotz Einstellung von Spotify in der App auch über Amazon Unlimited sucht.

Das relativiert sich wenn man zb. sagt Spiele Song XY von Spotify.

Die KI kann nur mit dem Arbeiten was Sie bekommt, das gilt auch für Gemini.
Wenn man nur einen wichtigen Parameter vergisst kann Müll entstehen.
Dann entsteht quasi sowas was viele als "Fehler" seitens der KI sehen.... obwohl der Fehler man selbst ist.
Ergänzung ()


Schwachsinn, bei dem Test ging es ausschließlich um aktuelle Nachrichteninhalte die man abfragt.
Ob man die mit KI abfragen sollte... naja..


Da kommt sowieso Müll raus, was willst du denn da sagen? "Hey Google, gib mir aktuelle Nachrichten"? Was heißt aktuell? Das Problem dabei ist das es zu viele Nachrichten gibt. Im Endeffekt müsste man das für eine kleine Region eingrenzen, das funktioniert vermutlich besser. Ggf. noch das Datum sagen damit nur Ergebnisse dieses Datums kommen.
Naja, stimmt schon, die Qualität des prompts ist entscheidend, aber ganz so allgemein, wie du es formuliert hast, waren die Anfragen nicht. Danke auch für die nette Anrede. ;P

Example questions include:

What is the Ukraine minerals deal?
Can Trump run for a third term?
How many people died in the Myanmar earthquake?
What did Marine Le Pen do?
Who is the Pope?
How many countries will the 2026 FIFA World Cup be played in?
How did Trump calculate the tariffs?
How did the recent LA fires start?
Why did Justin Trudeau resign?
Why were NASA astronauts stuck in space?
Quelle: https://www.ebu.ch/files/live/sites...ws_Integrity_in_AI_Assistants_Report_2025.pdf

Der Report gibt leider nicht alle Fragen preis und manche dieser Beispielfragen wären ggf. erfolgreicher wenn man ihnen ein "today" oder "this week" hinzugefügt hätte. Gleichzeitig sind das durchaus Fragen die vermutlich der Realität der Nutzerverhalten entsprechen.
Ob man unbedingt AI-Agents als Nachrichtenquelle nutzen sollte, finde ich auch sehr fragwürdig. Aber genau das wird durch die Studie ja auch hervorgehoben und hilft dann im Ergebnis vllt, dass sich mehr Leute Gedanken darüber machen, wofür sie ChatGPT und Co. wirklich benutzen.

Ich nutze, wie viele andere hier, durch mein aktuelles Smartphone die Pro Version von Gemini und bspw die kostenlosen Versionen von ChatGPT und perplexity für diverse allgemeine Anfragen bis hin zu größeren Recherchen im Bereich Technik und Naturwissenschaften und muss leider auch sagen, dass mich die Gemini-Pro Version (bei identischem prompt!) bisher am wenigsten überzeugt.
 
Zurück
Oben