Gescannte Comics ausrichten und Ränder entfernen per KI?

FatManStanding

Lieutenant
Registriert
Aug. 2021
Beiträge
630
Hallo,

in den Jahren 2013/2014 war ich länger krank, beweglich eingeschränk tund hatte Zeit. Damals habe ich viel aus meiner Comic-Sammlung gescannt, teilweise zerlegt über den ADF, teilweise über den Buchscanner. Speziell in der Corona-Zeit habe einige davon bearbeitet v.a. indem ich die Ränder weggeschnitten habe (mit xnview) und dann mit Gimp ausgerichtet. Oft reichte es nicht den leicht schiefen Scan gerade zu ziehen, manchmal musste ich mit dem Gimp-Tool "Perspektive" keine Rest-Ränder entfernen. Am Ende bearbeitet man jede Seite individuell.

Gibt es eine Möglichkeit das per KI zu machen? Vielleicht sogar anlernbar um der KI zu vermitteln was ich genau will?

Grüße
FMS
 
ScanTailor Advanced?
  • Seiten automatisch zuschneiden, entzerren, begradigen, Ränder erkennen
  • Ideal für Bücher, Comics, PDFs
  • Stapelverarbeitung möglich
Keine "KI", aber extrem brauchbar für dein Use Case denke ich.
OCR-Tools sind eher unflexibel. Maximal ABBYY FineReader

Oder man versuchts selbst zu bauen wie mit einem Bildsegmentierungsmodell (z.B. U-Net trainieren) zur Erkennung von Rändern
 
Es geht nicht darum einen Scan nur zu drehen. Bedingt durch die Scanmethode (Buchscanner mit Buchkante wo man das Buch während des Scanvorganges festhalten muss) kommt es dazu, dass die Seiten "verschoben" sind. Das ist ncith das gleiche wie verdreht.

Es kann vorkommen, dass der komplette links Bildrand genau passt, also die Panels genau mit dem Bild abschließen, die rechts obere Ecke schließt ebenfalls am dem Bildrand ab, je weiter man am rechten Rand nach unten geht umso größer wird die Lücke zwischen Rand des Bildes und Rand des Panels. Hier kann man drehen wie man will: passt der rechts Rand, passt der linke nicht. Hier behelfe ich mir mit dem Tool "Perspektive" in Gimp.

Das kann auch ScanTailor nicht.
 
Danke für die Klartellung. Das ist ein Unterschied. Du meinst eine Verzerrung in der Perspektivebene, also keine Rotation oder Kippung der Seite, sondern eine Trapez- oder Parallelogramm-Verzerrung, wie sie durch das Festhalten des Buchs am Scanner entsteht. Und ja: ScanTailor kann das nicht automatisch kompensieren.

Genau diese Art der Verzerrung – bei der z.B. nur eine Ecke "ausreißt" – wird in der Bildverarbeitung mit sogenannten Homographie-Transformationen oder perspektivischen Transformationen bearbeitet. Manuell kannst du das mit dem GIMP-Perspektivwerkzeug machen – das tust du ja eh bereits.

Was geht:
Tools aus der Dokumentenverarbeitung wie DocTR, OpenCV + Deep Learning, oder z.B. Forschungsprojekte für Buchseitenentzerrung (Stichwort: "book dewarping neural network") sind fähig, das automatisiert zu erkennen und zu entzerren. Beispielprojekt was mal auf GitHub war: DocUnwarp -> Dieses nutzt KI zur Rekonstruktion und perspektivischen Korrektur gescannter Seiten – speziell für Buchkanten geeignet. Braucht aber Setup (Python, CUDA optional) und etwas Konfiguration. Müsstest schauen, obs das noch irgendwo gibt.
https://heartbeat.comet.ml/dewarping-documents-with-ai-748a34f471b
https://github.com/thomasjhuang/deep-learning-for-document-dewarping

Ein einfaches, klickbares Desktop-Tool, das wie GIMP „Erkenne und korrigiere diese spezifische perspektivische Verzerrung“ auf Seiten macht – antrainiert auf deinen Workflow – gibt es leider (noch) nicht in fertiger Form.

Oder du scriptest was mit OpenCV
  • Bild einlesen
  • Automatisch Ränder / Panels erkennen (z.B. mit Canny + HoughLines)
  • Perspektivische Transformation berechnen
  • Korrigiertes Bild ausgeben
Lässt sich mit genug Beispieldaten wahrscheinlich gut weiter optimieren.
Oder für Langfristig komplett eigenes KI-Modell trainieren.
 
Ich habe das hier https://github.com/cvlab-stonybrook/DewarpNet gefunden. Hier verstehe ich aber Bahnhof. Verstehe ich das so, dass ich das ganze mit Python aufrufe und mit meinem Dateien füttern kann? Sehe ich dann ein Ergebnis und kann sagen passt oder nicht?

Angeblich soll auch Photoshop so was können? Alles was dort zu KI geschrieben geht Richtung eher Bildbearbeitung.
 
Zurück
Oben