News Erstes Pilotprojekt: Spotify will Podcasts per KI mit Originalstimme übersetzen

Was ich mich Frage ist wie man als Politiker oder jemand der kritische Daten hat verhindert, dass der eigene Computer, Laptop, Handy oder Tablet nicht heimlich Echtzeit mithorcht? Selbst wenn es da Mittel und Wege gibt - was ist dann mit Situationen wo man aktiv Übersetzungen will - also dem gerät + Software aktiv die Erlaubnis gibt?

-> Die Stimme + WAS gesagt wird muss ja dann ins Internet geblasen werden - verarbeitet werden - und dann zurück zu den Ausgabegeräten gehen. Sind das nicht riesige Einfalltore wo man sehr sehr sensible Daten abgreifen kann?

Ich sehe absolut die Vorteile eine Sprachbarrierebefreiten Welt - aber ich habe mindestens so viele Bedenken.
 
Netfix wollte vor 1-2 Jahen auch so ein Pilotprojekt machen, ich weiß aber nicht ob es je umgesetzt wurde. Finden konnte ich davon nichts.

Oft sind die Synchronsprecher, milde ausgedrückt, nicht sonderlich gut.
Da kann ich mir eine K.I. Stimme gut vorstellen, sie hört sich an wie der original Schauspieler nur in meiner Sprache.
 
  • Gefällt mir
Reaktionen: K3ks
Reviewed die Podcasts dann wer vor Release? Denn dass die "KI" die Übersetzung nicht perfekt hinbekommen kann/wird (um es sehr freundlich auszudrücken), ist eigentlich klar. Nur der Grad ist fraglich: von kaum merklich bis hin zu "komplett daneben" ist alles drin. Ein super Beispiel: Safety & Security. Schmeißt da nen Artikel der sich um Beides dreht mal in egal welches KI Tool und amüsiert sich über die Ergebnisse.

Und das sehe ich hier auch als größtes Problem: wer soll denn am Ende den die Verantwortung für die übersetzten Podcasts übernehmen? Spotify? OpenAI? Die original Podcaster? Gemeint ist hier der defakto Hauptverantwortliche, der bei Fehlern eingreift und bei einer groben Falsch Darstellung und den Konsequenzen daraus dann die Verantwortung dafür übernimmt.
 
  • Gefällt mir
Reaktionen: K3ks
Niyu schrieb:
Huh? Wie bei der anderer Kommunikation über den PC auch. Sicher, so ein Übersetzer/live Synchronsprecher ist ein potentielles weiteres Einfallstor, aber bis auf das hatten wir doch auch vorher schon Skype und Discord usw.

@DonDonat: Der, der die Übersetzung veranlasst und verifiziert? Ohne das halt ein disclaimer.
 
LamaMitHut schrieb:
... keine Sprachbarriere mehr zwischen allen Menschen, ...

kicos018 schrieb:
Durch einen Dolmetscher würde sich an dem Problem aber auch nichts ändern.
Im Kontext, von allen Menschen, bin ich gespannt, wo all die Dolmetscher herkommen sollen.
Davon ab, kann ich einen Menschen als Dolmetscher, falls Vorort, noch versuchen zu lesen, ob Mimik/Gestik zur Aussage passen.
 
DonDonat schrieb:
wer soll denn am Ende den die Verantwortung für die übersetzten Podcasts übernehmen?
Naja, es werden wohl keine Podcasts zur Flugsicherung oder Reparaturanleitungen für kritische Infrastruktur existieren und wenn doch, dann stellt man so was hinten an und fängt mit unverfänglichen Themen an. Bei 99% der Podcasts ist das doch nicht wirklich problematisch. Ein gewisses Risiko bleibt, da muss man halt einen Teil der Einsparungen für mögliche Rechtsstreitigkeiten auf die Seite legen.
 
  • Gefällt mir
Reaktionen: K3ks
Hört sich interessant an. Und auch wenn ich einige unserer deutschen Synchronstimmen wirklich mag und auch immer wieder gerne rate "wessen" Stimme das noch ist, die Zukunft wird dann ja womöglich irgendwann mal die Originalstimmen der Schauspieler in jeder Sprache zu haben.
Aber ich denke bis das dann passend und auch Lippensynchron hin kommt wird bestimmt noch viel Zeit vergehen.
Ergänzung ()

DonDonat schrieb:
Reviewed die Podcasts dann wer vor Release?
Im Pilotprojekt sicher. Bis dann irgendwer sagt, passt schon, dann geht das so.
 
  • Gefällt mir
Reaktionen: Hellyeah und K3ks
Sun-Berg schrieb:
dass du das Recht beim Akzeptieren der AGB deines Telefons (die niemand liest) abgibst

AGBs sind das Papier nicht wert auf dem sie nicht gedruckt werden , nur weil was drinne steht oder besser nachträglich eingeführt wird macht es lange nicht rechtens , man kann reinschreiben was man will schädigt das einen auf irgend eine Art und Weise ( mit Ausnahmen) ist sowas eh nichtig und halt vor keinem Gericht der Welt stand

Edit ansonsten Echtzeit Übersetzung oder saubere syncronisation mit der Stimmlage des orginal Sprechers wenn dieser dafür bezahlt wird gerne hab ich kein Problem mit

Irgendwie schade das Startreck und co keine Design Patente auf alles gemacht haben , tricorder = Handy , Tablets = Tablets , jetzt übersetzter ....
 
Hoffentlich kann ich mir bald endlich die Stimmen aussuchen... und am liebsten die Gesichter auch direkt dazu!
 
aLanaMiau schrieb:
Hoffentlich kann ich mir bald endlich die Stimmen aussuchen...
Man bekommt dann später bestimmt nur die langweilige Stimme inklusive. Interessante gibt es im Shop. Als Abo, pro Podcast oder auch wenn man die Originalstimme haben möchte :evillol:
 
K3ks schrieb:
Huh? Wie bei der anderer Kommunikation über den PC auch. Sicher, so ein Übersetzer/live Synchronsprecher ist ein potentielles weiteres Einfallstor, aber bis auf das hatten wir doch auch vorher schon Skype und Discord usw.
Nicht ganz. Es fehlt die Verarbeitung. Im besten Fall hat man eine Ende-zu-Ende Verschlüsselung.
Wie will man jedoch etwas verarbeiten (übersetzen) wenn es verschlüsselt ist? Also haben wir plötzlich Ton/Text der Klar verarbeitet wird und dann weiterläuft.
 
??? Die Ende-zu-Ende Verschlüsselung bleibt, wird halt an jedem Ende der Bearbeitungskette entschlüsselt und wieder verschlüsselt, ist halt nur ein weiterer Schritt mit der Übersetzung.
Hier kommt dann wieder Sicherheit und Datenschutz ins Spiel, ist halt ein weiterer Einfalls- potentieller Angriffsvektor.
Vertraue ich den Unternehmen? Hahaha, nee. Auch: Sicherheitslücken gibbets leider immer.
 
Interessanter Ansatz - vor allem weil hier das Urheber-Problem Umgangen wird. Das ist ne clevere Idee es als Service anzubieten der dann einfach bei Bedarf genutzt werden kann. Das ist die Zukunft mit KI bzw neuralen netzwerken - die viele evangelisten immer anpreisen =)

Was die qualität angeht, wird dies hier warscheinlich sehr gut sein - denn wir haben hier starke "guidance", das sprachmodel bekommt ja spezielle Aufgaben präsentiert (die sehr eng eingegrenzt sind) und muss die Stimme lediglich in eine andere sprache übersetzen - mit einer sehr ähnlichen Intonation. Das sollte eigtl gut klappen, besonders wenn Spotify sich damit zeit lässt und ein gutes Model verwendet.
 
Hoch spannend, was alles mittels "KI" nun genutzt werden kann. Da werden so manche Jobs obsolet, aber so ist dies beim Fortschritt immer (zum Glück bin ich bis dato noch nicht betroffen 😇).

Teile diese Skepsis, die hier in manchen Beiträgen hochkommt, nicht; ist mir auch unverständlich, wie diejenigen gerne hätten, dass Neues absolut riskiofrei ist, das gibt es NIE!
 
  • Gefällt mir
Reaktionen: K3ks
Gibt bereits verblüffend gute Tools die man kostenlos testen kann. Mir fällt hier https://elevenlabs.io/ ein. Mal sehen wie die OpenAI Lösung da im Vergleich ausfällt.
 
  • Gefällt mir
Reaktionen: xpgx1
Bester Mann! =)

Elevenlabs' Text-to-Speech library ist aus gutem Grund in vielen Lösungen enthalten ^-^
 
calippo schrieb:
Bei 99% der Podcasts ist das doch nicht wirklich problematisch. Ein gewisses Risiko bleibt, da muss man halt einen Teil der Einsparungen für mögliche Rechtsstreitigkeiten auf die Seite legen.
Wie kommst du auf 99%? Es gibt durchaus einige Podcasts zu z.B. Historie, Wissenschaft, Wirtschaft, "Knowledge" usw. wo eine falsch Übersetzung durchaus merkliche Konsequenzen haben kann. Die müssen dann auch nicht wie von dir impliziert sein "dabei sind Leute gestorben/ schwer verletzt worden". Sowas sind absolute "Worst Case" Szenarien, welche aber aus der gesamten Menge an möglichen Konsequenz-Menge nur einen kleinen Anteil darstellen. Wir reden hier über eine Skale die von "Stil wird falsch übersetzt und die Podcaster werden miss-repräsentiert", über "Faken sind Falsch und werden falsch verbreitet" bis hin zu den von dir genannten Menschen-/Personen-Schäden oder sogar Toten reicht.

Am Ende ließe sich meine Kritik auch generell auf KI anwenden. Das hier ist wieder nur ein Beispiel dafür, wie auf der Meta-Ebene heute fast keiner der Vorreiter in KI bzw. ihrer Nutzung sich wirklich Gedanken über Konsequenzen ihrer Produkte gemacht haben. Was aber auch verständlich ist, Meta-Themen interessieren niemanden im Management und Konsequenzen sowie Verantwortung will man nicht übernehmen weil kostet Geld...

Was dann den Kreislauf zum literarischen Genre Cyberpunk schließt, welcher sich auf der Meta-Ebene schon weit vor dem Aufkommen von irgendwie brauchbarer "KI" sich Gedanken über die von mir hier genannten Konsequenzen gemacht hat. Nur hat keiner zugehört und heute fangen wir genau wie in dem Genre oft der Fall kopflos "KI", oder besser algorithmische Blackboxen, auf Probleme zu werfen ohne zu verstehen was das nicht vorhandene Verständnis der Blackbox (und dessen Output) für Konsequenzen haben wird.
 
  • Gefällt mir
Reaktionen: Hellyeah
DonDonat schrieb:
falsch Übersetzung durchaus merkliche Konsequenzen haben kann
Passiert tagtäglich ganz ohne dass KIs ihre Finger im Spiel haben. Selbst ohne Übersetzung gibt es Falschmeldungen und Fehlinterpretationen oder es werden nur Teile der relevanten Information übermittelt.

Bei händisch übersetzten Texten kommt es auch oft zu Fehlern, schönes Beispiel ist Ivar Combrinck und seine "Alternative Kontrolllöschung" und sein "Entwanzer" und "Tief-Blau" und "Verließe und Drachen" . Der gute Mann hatte von IT und Nerdkultur halt so gar keine Ahnung.
 
Zurück
Oben