JavaBeginner
Ensign
- Registriert
- Juli 2015
- Beiträge
- 142
Hey, ich bin momentan darüber am rätseln, wie ich am besten das erkennen von Texten auf Bilder lösen kann. Da es sich dabei um ein Video handelt dachte ich mir, ich könnte um die Texte (Untertitel) zu erhalten mehrere Frames miteinander vergleichen (1-3 Sekunden insgesamt) und dann die Objekte herausfiltern die sich auf diesen Bildern statisch geblieben sind.
Folgenden Artikel habe ich zu diesem Thema gefunden: https://towardsdatascience.com/colo...ges-machine-learning-application-b26e770c4c71
Wie vielversprechend haltet ihr das und wäre es sinnvoll ein ähnliches Vorgehen für mein Projekt zu verwenden?
Mir kommt das relativ ineffizient vor deshalb wollte ich mal nachfragen ob jemand von euch eine andere Idee hat.
Folgenden Artikel habe ich zu diesem Thema gefunden: https://towardsdatascience.com/colo...ges-machine-learning-application-b26e770c4c71
Wie vielversprechend haltet ihr das und wäre es sinnvoll ein ähnliches Vorgehen für mein Projekt zu verwenden?
Mir kommt das relativ ineffizient vor deshalb wollte ich mal nachfragen ob jemand von euch eine andere Idee hat.
Zuletzt bearbeitet: