Python Bildver-/bearbeitung mit Python (MP4 Datei)

JavaBeginner · 4. Juni 2019

Hey, ich bin seit einigen Tagen am rätseln, womit ich folgende Idee umsetzen kann:
Ich würde gerne ein Video(i.d.R. Mp4) nehmen und den Untertitel des Videos auslesen. Problem dabei ist, es handelt sich um "Hardsub". Also sind die Untertitel in das Bild "eingebrannt" nun meine Frage, wie kann ich dies Untertitel auslesen lassen um sie in einem neuen Video einzubinden. Bisher habe ich nur ffmpeg für Python gefunden das halbwegs nach etwas aussah das mit helfen könnte. https://github.com/kkroening/ffmpeg-python
Hättet ihr eventuell andere Vorschläge oder gleich eine andere Herangehensweise?

HorstSch87 · 4. Juni 2019

Mit ffmpeg kannst du dir das Video zumindestens schonmal in einzelbilder zerlegen - um die auszulesen, brauchst du dann eine Bilderkennungssoftware.

Hier wird beschrieben, wie jemand das mit chinesischen Untertiteln mit Python macht:
https://www.kerrickstaley.com/2017/05/29/extracting-chinese-subs-part-1

Der hat aus dem Video aber auch erst mal Einzelbilder gemacht.

ClashHexmen · 4. Juni 2019

Vermutlich in mehreren Schritten...

das Video in einzelne Frames zerlegen
auf einen Bereich zuschneiden wo die Subs angezeigt werden (um andere Textinhalte im Video herauszufiltern)
auf diese Bilder eine Texterkennung anwenden
Doppelgänger eliminieren weil Text für mehrere Frames zu sehen ist

Um was für Videos handelt es sich denn? Manchmal findet man die Subs ja auch einzeln

JavaBeginner · 4. Juni 2019

Das soll am Ende variabel sein. Als Einschätzung eure Seite aus, ist es simpler und effizienter einen "hardsub" auszulesen und dann weiter zu verarbeiten oder eher aus dem vorhandenen Videoton einen sub zu extrahieren?
Dank neuronalen Netzen ist sowas mittlerweile ja relativ gut geworden.

Amaoto · 4. Juni 2019

SubRip hat eine integrierte Funktion dafür: https://www.divxland.org/en/guide/46/ripping_subtitles_from_hardsubbed_video_with_subrip

JavaBeginner · 4. Juni 2019

Also, ist jemandem von euch vielleicht bekannt wie gut die Google Speech-to-text API ist?

ClashHexmen · 4. Juni 2019

Schau dir Youtube-Videos mit automatischen Untertiteln an dann siehst du wie gut das ist...

JavaBeginner · 4. Juni 2019

Okay, war mir nur nicht so ganz sicher ob Youtube das verwendet...ist zwar nahe liegend aber man weiß ja nie...hätten ja auch etwas eigenes nur für den Zweck entwickelt haben können.

Suche

Python Bildver-/bearbeitung mit Python (MP4 Datei)

JavaBeginner

Ensign

HorstSch87

Cadet 4th Year

ClashHexmen

Lt. Commander

JavaBeginner

Ensign

Amaoto

Commodore

JavaBeginner

Ensign

ClashHexmen

Lt. Commander

JavaBeginner

Ensign

Ähnliche Themen