News KI für Sprachverständlichkeit: ZDF nimmt Tonspur „Klare Sprache“ ins Programm auf

SVΞN · 2. Juni 2022

Das ZDF hat die neue Tonspur „Klare Sprache“ als Option in sein TV-Programm aufgenommen und hebt damit Sprache per KI noch deutlicher hervor. Die zweite deutsche Rundfunkanstalt bewirbt das zusätzliche Tonangebot als ein KI-basiertes „Echtzeitverfahren“, welches „die Sprachverständlichkeit noch weiter verbessern“ soll.

Zur News: KI für Sprachverständlichkeit: ZDF nimmt Tonspur „Klare Sprache“ ins Programm auf

Dodo Bello · 2. Juni 2022

d.h. weil alle Studios und aufgezeichneten Spielfilme den Ton nur abgemischt bereitstellen, werden am Ende einzelne Tonspuren per KI wieder identifiziert und aufgetrennt. Schon bissel von hinten durch die Brust.

r0b0t · 2. Juni 2022

Ich habe mich schon lange gefragt, warum es noch nicht möglich ist Sendungen in Mehrkanalton aufzunehmen bei denen Sprache und Geräusche getrennt sind und dies auch so auszustrahlen. Dann könnte das jeder für sein eigenes Gehör selbst einstellen. Bei Filmen, die synchronisiert werden, muss das Tonmaterial doch bereits in getrennter Form vorliegen. Stattdessen erhält man eine Mischung, in der Sprache extrem leise ist und Musik und Geräusche den ganzen Wohnblock aufwecken. Auf jeden Fall eine gute Entwicklung, da Menschen normalerweise älter werden, und dabei leider das Gehör schlechter wird.

Discovery_1 · 2. Juni 2022

Ich habe bei meinem Sony-TV in den Toneinstellungen "Klare Sprache". Nur bewirken tut das irgendwie nichts bis rein gar nichts.

Ich bin mal gespannt, ob das die KI vom ZDF besser hinbekommt.

Teckler · 2. Juni 2022

Funktioniert wahrscheinlich super bei Filmen mit Til Schweiger

Conqi · 2. Juni 2022

r0b0t schrieb:
Ich habe mich schon lange gefragt, warum es noch nicht möglich ist Sendungen in Mehrkanalton aufzunehmen bei denen Sprache und Geräusche getrennt sind

Ganz so fortgeschritten muss man meist nicht mal vorgehen. Sprache wird bei Surround in vielen Fällen primär in den Center-Kanal gemischt und kann darüber leicht hervorgehoben werden. Funktioniert halt nur leider nicht, wenn man nur Stereo hat.

Tenferenzu · 2. Juni 2022

RTX voice oder ein Bandpass der die Höhen und Tiefen rausnimmt?

Termy · 2. Juni 2022

Also bei manchen (primär englischen) Filmen würde ich mir sowas manchmal definitiv auch wünschen

r0b0t schrieb:
Ich habe mich schon lange gefragt, warum es noch nicht möglich ist Sendungen in Mehrkanalton aufzunehmen bei denen Sprache und Geräusche getrennt sind und dies auch so auszustrahlen.

Das wundert mich auch schon immer - Dolby, DTS...ganz tolle Features die zum Großteil von kaum einem Film wirklich genutzt werden, aber solche "Basics" werden ignoriert...

Corros1on · 2. Juni 2022

r0b0t schrieb:
Ich habe mich schon lange gefragt, warum es noch nicht möglich ist Sendungen in Mehrkanalton aufzunehmen bei denen Sprache und Geräusche getrennt sind und dies auch so auszustrahlen.

Genau das frage ich mich auch immer, wenn ich schlecht abgemischte Filme oder Serien schaue, was leider die Regel als die Ausnahme mittlerweile ist.

Mich stört es, dass ich mehrmals im Film/Serien den Ton anpassen muss, dass ich überhaupt was verstehe oder mir in anderen Szenen nicht das Trommelfell platzen.
Einfach ohne rumfummeln an der Lautstärke, kann man kaum noch Filme genießen.

Ältere Filme konnten das viel besser haben mMn noch verstanden, worauf es beim Ton ankommt.
Heute wird man von Bässen zugedröhnt und versteht kaum noch was.
Da fragt man sich schon ob die Technik von damals besser war oder das Know-How der Tontechniker als Heute.

Dimensionday · 2. Juni 2022

Corros1on schrieb:
Genau das frage ich mich auch immer, wenn ich schlecht abgemischte Filme oder Serien schaue, was leider die Regel als die Ausnahme mittlerweile ist.

Mich stört es, dass ich mehrmals im Film/Serien den Ton anpassen muss, dass ich überhaupt was verstehe oder mir in anderen Szenen nicht das Trommelfell platzen.
Einfach ohne rumfummeln an der Lautstärke, kann man kaum noch Filme genießen.

Ältere Filme konnten das viel besser haben mMn noch verstanden, worauf es beim Ton ankommt.
Heute wird man von Bässen zugedröhnt und versteht kaum noch was.
Da fragt man sich schon ob die Technik von damals besser war oder das Know-How der Tontechniker als Heute.

Disney+ App ->Marvel -> Avengers: Infinity War = genau das wovon du sprichst, musste letzte woche bestimmt fast 100x Ton leise lauter stellen, Soundsystem: Nubert Nuboxx 30er Stereo mit Optical Vollduplex Verstärker... Pure Krise.

quakegott · 2. Juni 2022

Zum glück schau ich so gut wie kein Fernsehen mehr. Aber das mit dem Ton war schon immer ein Problem. Vor allem wenn man einen Film schaut und lauter machen muss um ein Wort zu verstehen und dann wenn Werbung kommt geht die Welt unter

Autokiller677 · 2. Juni 2022

r0b0t schrieb:
Ich habe mich schon lange gefragt, warum es noch nicht möglich ist Sendungen in Mehrkanalton aufzunehmen bei denen Sprache und Geräusche getrennt sind und dies auch so auszustrahlen.

Jeder zusätzliche Datenschnipsel braucht auch Bandbreite - und solange noch über Funk ausgestrahlt wird, ist die kostbar und begrenzt. Daher hat man von Spielereien wie verschiedenen Tonspuren etc. im Fernsehen früher häufig abgesehen. Ändert sich heut ein wenig. Aber einfach wie Netflix 5 Tonspuren und 10 Untertitel raushauen macht man auch heute noch nicht.

r0b0t schrieb:
Stattdessen erhält man eine Mischung, in der Sprache extrem leise ist und Musik und Geräusche den ganzen Wohnblock aufwecken.

Corros1on schrieb:
Genau das frage ich mich auch immer, wenn ich schlecht abgemischte Filme oder Serien schaue, was leider die Regel als die Ausnahme mittlerweile ist.

Das liegt wie schon gesagt einfach daran, dass bei Mehrkanal-Tracks die Sprache primär in den Center gemischt wird, und dann beim zusammenpressen auf Stereo nicht mehr gut rauskommt. Merkt man auch daran, dass bei einfachen Serien, die rein fürs Fernsehen gedacht sind das Problem nicht auftritt - die werden meist eh nur in Stereo produziert.

Eigentlich müsste man hier nur das Tool anpassen, dass von Mehrkanal auf Stereo drückt und dem Center mehr Gewicht geben.

Einfach Abhilfe wenn es zu sehr nervt: Eine Soundbar. Selbst die günstigen sind meist schon 3.0 oder 3.1 und haben dementsprechend einen Center. Seit ich meine Soundbar habe, hab ich mich nie wieder über schlecht verständliche Sprache geärgert und schaue viel mehr Filme auf Englisch, weil die ehemals unverständlichen Szenen jetzt verständlich sind. TV-Serien wie Big Bang, Two and a half man etc. hab ich dagegen auch vorher immer schon auf Englisch geschaut - weil die eh für Stereo produziert waren.
Aber ist natürlich ein bescheuerter Fix.

branhalor · 2. Juni 2022

Roboter, Autonomes Fahren, Smart Home, jetzt Sprach-KI im Fernsehen...
... so interessant das alles rein technologisch ist, so mache ich mir doch etwas Sorgen, wohin das gesellschaftlich und arbeitswirtschaftlich am Ende führen wird:

Von irgendwas muß der Mensch leben, und das geht seit Jahrtausenden bis heute nur über Arbeit und Geld-verdienen. Wenn aber langfristig jede Arbeit durch irgendeine Technologie und KI ersetzt worden ist => wovon sollen die Leute dann noch ihren Lebensunterhalt bestreiten...? In den Metropolen haben wir doch heute schon sozialen Unfrieden in den ärmeren Vierteln mit hoher Arbeitslosigkeit... Und es ist nicht jeder dafür geeignet, irgendeine Denk-, Forschungs- oder Entwicklungsarbeit in nem Büro oder Labor zu leisten.

Wie gesagt:
Inhaltlich spannend sind die Themen.
Aber leider auch spannend in Bezug auf die mittel- bis langfristigen, potentiellen Auswirkungen.
Ich hoffe, das hat auch irgendjemand auf den jeweiligen Entscheidungsebenen auf dem Schirm... 🙏 Sonst bricht das ganze Kartenhaus irgendwann in sich zusammen und wir haben am Ende wirklich die düstersten Zukunfts-Dystopien...

Discovery_1 · 2. Juni 2022

Infi88 schrieb:
Erstmal 720p überwinden wenn es geht.

Über DVB-T2 sind alle ÖR Sender in FHD.

Tenferenzu · 2. Juni 2022

branhalor schrieb:
Wenn aber langfristig jede Arbeit durch irgendeine Technologie und KI ersetzt worden ist => wovon sollen die Leute dann noch ihren Lebensunterhalt bestreiten...?

Die Diskussion gibt's seit ca. 150 Jahren. Ich vermute, dass du trotzdem noch einen Job hast. Vermutlich sogar einen den es vor 70 Jahren noch gar nicht gab.

Tawheed · 2. Juni 2022

Gibt's ein opensource Tool dass das kann?

Boimler · 2. Juni 2022

Infi88 schrieb:
Erstmal 720p überwinden wenn es geht.

Da bin ich auch mal gespannt, wann das kommen wird. Wenn ich das bei den Physikern richtig gelernt habe, ist 1080p per DVB-[x] technisch kein Thema.

Discovery_1 · 2. Juni 2022

Boimler schrieb:
Wenn ich das bei den Physikern richtig gelernt habe, ist 1080p per DVB-[x] technisch kein Thema.

Ich habe alle ÖR Sender auch bei Prime Video in FHD. Dennoch ist die Bildqualität über DVB-T2 deutlich besser als bei Prime Video. Das sind 1080p über DVB-T2.

Felix# · 2. Juni 2022

Vernünftiges 5.1 oder größer Soundsystem kann helfen. Bzw. wenigstens 3.0/3.1. Center bringt sehr viel. Aber am meisten bringt es gute Boxen und ggf. einen gescheiten AVR zu haben. Das braucht gar nicht mal so teuer sein; Boxen kann man sich als Selbstbausätze relativ günstig selber bauen und dabei 10x und mehr sparen. Damit kann man sich ein traumhaftes HiFi oder in dem Fall Heimkino bauen, wo man niemals Verständlichkeitsprobleme haben sollte.
Wenn da nicht die Loudnesswars wären. Gute Aufnahmen sind ja eigentlich Aufnahmen mit großer Dynamik. Was laut ist, ist laut, was leise ist, ist leise. Dumm nur, wenn dann Werbung etc. volle Pulle in feinster Maximallautstärke der vorherigen kurzen Explosion dauerhaft kommt. Sowas geht gar nicht, allerdings kommt das bei mir gar nicht mehr vor: ich schaue nichts mehr mit Werbung. Es gibt ja bei nahezu allen halbwegs aktuellen (10-20J) alten AVRs und Verstärkern die Option "Midnight", womit man die Dynamik wiederum senken kann wegen Mietwohnungsproblemen usw, wenn man eben keine großen Lautstärkeunterschiede haben will.

Wofür es da nun KI braucht, bleibt mir ein Rätsel. Das Problem ist doch viel mehr Dynamik und Abmischung. Wenn man Optionen reinbauen würde, wo man Dynamik justieren könnte und sich die Abmischung automatisch gut (!) anpasst, wäre doch alles ok. Normalerweise würde man meinen, dass der Benutzer das ja selbst machen könnte. Gut ok - das geht heutzutage bestimmt nicht mehr. Und vielleicht braucht man genau dafür eine ... KI. Schlechte Soundsysteme, Anlagen und die meist verwendeten Brüllwürfel oder sogar nur die im TV verbauten Brülleimer - also wenn man die verbessern will, sollte man selbst einfach in Boxen investieren, die was können. Das bringt mehr als KI und man kann damit auch schön Musik hören und hat Jahrzehnte was davon.
Aber bevor man nur noch gleichlaut abgemischte Kram vorgesetzt kriegt, wo Stimmen genauso laut sind wie einschlagende Autos usw - ja dann ist eine KI vielleicht doch gar nicht so schlecht.

Ayo34 · 2. Juni 2022

Ganz ehrlich, normal kritisiere ich sehr gerne die Öffentlichen, aber hier ist der Ansatz erstmal ein Guter. Gerade Abends/Nachts muss ich so häufig lauter/leiser stellen und manche Filme kann man gar nicht leise schauen.

Schöner wären natürlich getrennte Tonspuren für Sprache und Effekte.

News KI für Sprachverständlichkeit: ZDF nimmt Tonspur „Klare Sprache“ ins Programm auf

Redakteur a.D.

Lieutenant

Lt. Junior Grade

Rear Admiral

Lt. Commander Pro

Admiral Pro

Vice Admiral

Rear Admiral Pro

Admiral Pro

Lieutenant

Lt. Commander

Fleet Admiral

Captain

Rear Admiral

Vice Admiral

Banned

Captain Pro

Rear Admiral

Lieutenant

Admiral

Passend zum Thema