Was ist das für ein Zeichen? Weißes 'FF' auf schwarzem Grund

Mr. Brooks

Lt. Commander
Registriert
Aug. 2011
Beiträge
1.441
Hi,

ich will eine Textdatei in einem Yad-Fenster anzeigen lassen, was aber nicht geht solange in der Datei ganz am Ende ein bestimmtes Zeichen (siehe Bild) steht. Die Datei ist das Ergebnis von tesseract-ocr (also einer Texterkennung aus einem Bild). Dieses Zeichen hab ich bei fast allen mit Tesseract erstellten Dateien. Lösche ich es manuell, kann Yad die Datei anzeigen. Was ist das? Ich hatte mal ein ähnliches (aber LF statt FF), da hab ich aber die Anzeige von Tabsprüngen usw. eingestellt. Das ist hier nicht der Fall. 'cat date.txt' zeigt das Zeichen interessanterweise nicht an.

Ich will nicht pauschal immer die letzte Zeile aus dem Script löschen, da es nicht immer angezeigt wird. Ich weiß aber auch nicht wie sich das Zeichen nennt um es zu löschen.
 

Anhänge

  • Bildschirmfoto_2021-01-21_12-10-43.png
    Bildschirmfoto_2021-01-21_12-10-43.png
    294 Bytes · Aufrufe: 287
Ich tippe mal auf ein Formfeed. Als Escape sequence "\f" . Im Hexcode 0x0C oder dezimal 12.
 
FF steht für Form Feed, also einen Seitenumbruch. Dein Texterkennungsprogramm wird das wahrscheinlich hinzufügen, weil es eine Seite abgeschlossen hat, damit danach theoretisch die nächste beginnen könnte.

Du könntest deine Textdatei durch sed "s/\f//g" pipen, um das Zeichen zu entfernen oder durch sed "s/\f/\n/g", um daraus einen normalen Zeilenumbruch zu machen.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: Raijin
Zurück
Oben