News Text-to-Speech: Gemini liest Inhalte von Google-Docs-Dokumenten vor

mischaef · 19. August 2025

Google hat sein KI-Modell Gemini um eine Funktion erweitert, mit der sich Audio-Ausgaben von Text- und Tabellen-Dokumenten erzeugen lassen, um diese anhören zu können. Auf diese Weise will das Unternehmen die Zugänglichkeit der erstellten Inhalte verbessern.

Zur News: Text-to-Speech: Gemini liest Inhalte von Google-Docs-Dokumenten vor

Lachsrolle · 19. August 2025

Spannende Neuerung! Damit setzt Google einen weiteren Schritt in Richtung Barrierefreiheit und produktiver Nutzung von KI im Alltag. Besonders praktisch ist, dass sich Inhalte nicht nur in klassischem „Vorlese-Stil“, sondern in verschiedenen Stimmlagen – vom Erzähler bis zum Coach – anhören lassen. So können Nutzer je nach Situation die passende Stimme wählen, etwa zur Wissensvermittlung, Motivation oder zum reinen Konsum.

Der Rollout zunächst nur auf Englisch ist zwar noch eine Einschränkung, dürfte sich aber schnell relativieren, sobald weitere Sprachen unterstützt werden. Interessant ist auch, dass Google die Funktion nicht nur für Nutzer selbst, sondern auch für Ersteller von Dokumenten nutzbar macht, indem sich eine Audio-Schaltfläche direkt ins Dokument einfügen lässt – ein Pluspunkt etwa für Lehrmaterialien oder Unternehmensdokumentationen.

Gerade für Menschen mit Sehbeeinträchtigungen oder für Nutzer, die Inhalte lieber unterwegs anhören, ist die Funktion ein deutlicher Mehrwert. Es bleibt spannend zu beobachten, wie schnell und in welchem Umfang die Sprachunterstützung ausgeweitet wird – und ob die Stimmen auch anpassbar oder personalisierbar werden.

(ja, ist es)

Tulol · 19. August 2025

Die deutsche sprachausgabe ist... schwierig.

Gemini lallt oft 'R' wie ein Texaner der versucht deutsch zu sprechen.

Generell ist die deutsche Sprachsynthese von google für'n Arsch. Betonungen sind oft völlig daneben was zu falschem Sinn der Sätze führt.

Vigilant · 19. August 2025

Auch das wird sich ändern und verbessern. Ich benutze aktuell NotebookLM viel für kreativem Kram. Und die Audio-Funktionen sind schon wirklich gut, bspw. kurze Podcast-Ausgaben in deutsch.

Wenn das so weitergeht, purzeln irgendwann ganze Präsentationen und Hörbücher raus.

knoxxi · 19. August 2025

Was hat das Artikelbild mit dem Artikel zu tun? 🥴

Ich hoffe doch mal, das Google den Text nicht via Megafon auf die Straße plärrt.

Wilson_Fisk · 19. August 2025

Kennt jemand eine Open Source App um offline deutsche Texte via Text-to-Speech (TTS) vorlesen zu lassen?

Abrexxes · 19. August 2025

Was für ein Bild. Ich hoffe so laut wird es nicht.

Hochland Reiter · 19. August 2025

@Wilson_Fisk
"Jeder" Browser hat seit mehreren Jahren eine Vorlesefunktion ohne KI. Firefox, Brave, etc.

gimmix · 19. August 2025

Wilson_Fisk schrieb:
Kennt jemand eine Open Source App um offline deutsche Texte via Text-to-Speech (TTS) vorlesen zu lassen?

Speech Note.

sNiPe · 19. August 2025

Vigilant schrieb:
Auch das wird sich ändern und verbessern. Ich benutze aktuell NotebookLM viel für kreativem Kram. Und die Audio-Funktionen sind schon wirklich gut, bspw. kurze Podcast-Ausgaben in deutsch.

Wenn das so weitergeht, purzeln irgendwann ganze Präsentationen und Hörbücher raus.

Ja, NotebookLM nutze ich auch sehr gerne, hat ne Top Sprachausgabe und kann man auch für Tabellen usw nutzen

Aduasen · 19. August 2025

Wird für mich erst interessant, wenn die das in akzentfreiem hochdeutsch hinbekommen.

Suche

News Text-to-Speech: Gemini liest Inhalte von Google-Docs-Dokumenten vor

mischaef

Kassettenkind

Lachsrolle

Ensign

Tulol

Admiral

Vigilant

Admiral Pro

knoxxi

Vice Admiral Pro

Wilson_Fisk

Lt. Junior Grade

Abrexxes

Captain Pro

Hochland Reiter

Gast

gimmix

Commander

sNiPe

Commander

Aduasen

Fleet Admiral Pro

Ähnliche Themen