News Text-to-Speech: Gemini liest Inhalte von Google-Docs-Dokumenten vor

mischaef

Kassettenkind
Teammitglied
Registriert
Aug. 2012
Beiträge
7.040
  • Gefällt mir
Reaktionen: knoxxi
Spannende Neuerung! Damit setzt Google einen weiteren Schritt in Richtung Barrierefreiheit und produktiver Nutzung von KI im Alltag. Besonders praktisch ist, dass sich Inhalte nicht nur in klassischem „Vorlese-Stil“, sondern in verschiedenen Stimmlagen – vom Erzähler bis zum Coach – anhören lassen. So können Nutzer je nach Situation die passende Stimme wählen, etwa zur Wissensvermittlung, Motivation oder zum reinen Konsum.

Der Rollout zunächst nur auf Englisch ist zwar noch eine Einschränkung, dürfte sich aber schnell relativieren, sobald weitere Sprachen unterstützt werden. Interessant ist auch, dass Google die Funktion nicht nur für Nutzer selbst, sondern auch für Ersteller von Dokumenten nutzbar macht, indem sich eine Audio-Schaltfläche direkt ins Dokument einfügen lässt – ein Pluspunkt etwa für Lehrmaterialien oder Unternehmensdokumentationen.

Gerade für Menschen mit Sehbeeinträchtigungen oder für Nutzer, die Inhalte lieber unterwegs anhören, ist die Funktion ein deutlicher Mehrwert. Es bleibt spannend zu beobachten, wie schnell und in welchem Umfang die Sprachunterstützung ausgeweitet wird – und ob die Stimmen auch anpassbar oder personalisierbar werden.

(ja, ist es)
 
  • Gefällt mir
Reaktionen: herrStreusalz, Ruby Haruko und Kai85
Die deutsche sprachausgabe ist... schwierig.

Gemini lallt oft 'R' wie ein Texaner der versucht deutsch zu sprechen.

Generell ist die deutsche Sprachsynthese von google für'n Arsch. Betonungen sind oft völlig daneben was zu falschem Sinn der Sätze führt.
 
  • Gefällt mir
Reaktionen: herrStreusalz
Auch das wird sich ändern und verbessern. Ich benutze aktuell NotebookLM viel für kreativem Kram. Und die Audio-Funktionen sind schon wirklich gut, bspw. kurze Podcast-Ausgaben in deutsch.

Wenn das so weitergeht, purzeln irgendwann ganze Präsentationen und Hörbücher raus.
 
  • Gefällt mir
Reaktionen: herrStreusalz und sNiPe
Was hat das Artikelbild mit dem Artikel zu tun? 🥴

Ich hoffe doch mal, das Google den Text nicht via Megafon auf die Straße plärrt.
 
  • Gefällt mir
Reaktionen: herrStreusalz
Was für ein Bild. Ich hoffe so laut wird es nicht. :D
 
  • Gefällt mir
Reaktionen: herrStreusalz und knoxxi
Vigilant schrieb:
Auch das wird sich ändern und verbessern. Ich benutze aktuell NotebookLM viel für kreativem Kram. Und die Audio-Funktionen sind schon wirklich gut, bspw. kurze Podcast-Ausgaben in deutsch.

Wenn das so weitergeht, purzeln irgendwann ganze Präsentationen und Hörbücher raus.
Ja, NotebookLM nutze ich auch sehr gerne, hat ne Top Sprachausgabe und kann man auch für Tabellen usw nutzen
 
  • Gefällt mir
Reaktionen: herrStreusalz
Wird für mich erst interessant, wenn die das in akzentfreiem hochdeutsch hinbekommen.
 
  • Gefällt mir
Reaktionen: herrStreusalz
Zurück
Oben