Python Bildver-/bearbeitung mit Python (MP4 Datei)

JavaBeginner

Ensign
Registriert
Juli 2015
Beiträge
142
Hey, ich bin seit einigen Tagen am rätseln, womit ich folgende Idee umsetzen kann:
Ich würde gerne ein Video(i.d.R. Mp4) nehmen und den Untertitel des Videos auslesen. Problem dabei ist, es handelt sich um "Hardsub". Also sind die Untertitel in das Bild "eingebrannt" nun meine Frage, wie kann ich dies Untertitel auslesen lassen um sie in einem neuen Video einzubinden. Bisher habe ich nur ffmpeg für Python gefunden das halbwegs nach etwas aussah das mit helfen könnte. https://github.com/kkroening/ffmpeg-python
Hättet ihr eventuell andere Vorschläge oder gleich eine andere Herangehensweise?
 
Vermutlich in mehreren Schritten...
  • das Video in einzelne Frames zerlegen
  • auf einen Bereich zuschneiden wo die Subs angezeigt werden (um andere Textinhalte im Video herauszufiltern)
  • auf diese Bilder eine Texterkennung anwenden
  • Doppelgänger eliminieren weil Text für mehrere Frames zu sehen ist
Um was für Videos handelt es sich denn? Manchmal findet man die Subs ja auch einzeln
 
Das soll am Ende variabel sein. Als Einschätzung eure Seite aus, ist es simpler und effizienter einen "hardsub" auszulesen und dann weiter zu verarbeiten oder eher aus dem vorhandenen Videoton einen sub zu extrahieren?
Dank neuronalen Netzen ist sowas mittlerweile ja relativ gut geworden.
 
Also, ist jemandem von euch vielleicht bekannt wie gut die Google Speech-to-text API ist?
 
Schau dir Youtube-Videos mit automatischen Untertiteln an dann siehst du wie gut das ist...
 
Okay, war mir nur nicht so ganz sicher ob Youtube das verwendet...ist zwar nahe liegend aber man weiß ja nie...hätten ja auch etwas eigenes nur für den Zweck entwickelt haben können.
 
Zurück
Oben