txt - griechische Fonts (evtl. kein ASCII oder Unicode)

Waldkiefer

Newbie
Registriert
Nov. 2023
Beiträge
6
Hallo Community,

ich versuche eine txt-Datei zu öffnen, die griechische Schriftzeichen enthält, aber nicht richtig angezeigt wird.

1701017773082.png


Es geht um eine Arbeit aus dem Jahre 1995 (evtl. kein ASCII oder Unicode)


Was bisher geschah:

1. im Netz recherchiert: Laut Wikipedia waren die Zeichencodes bevor sie mit dem Internet verbunden waren für jedes Computermodell verschieden. Leider liegen mir keine Daten vor - auf welchen PCs die Doktorarbeit geschrieben wurde.

2. alle griechischen Schriften von der „Gesellschaft für Griechische Schriften“ heruntergeladen + installiert

3. txt-Datei mit Notepad++, Windows Editor, WordPad, Microsoft Word geöffnet:

Zwischenfrage: Wie kann ich die „pretty print“-Funktion bei txt nutzen? Ließ sich nicht einstellen….

4. bei Notepad++ die Codierung mehrfach umgestellt

1701017752191.png



1701017762561.png



Aber alles blieb ohne Erfolg: In Notepad++ wird zum Teil noch nicht einmal alles angezeigt. In Word ist der deutsche Text zwar lesbar, aber nicht bearbeitbar und v.a. werden die griechischen Buchstaben nicht korrekt angezeigt.


Habt ihr eine Idee, wie ich darauf zugreifen kann?

Vielen Dank Euch! Und einen schönen Sonntag! Waldkiefer :)
 
@Waldkiefer
Hast Du ein Linux in der Naehe? Wenn nein ein Live Linux booten und

file --mime DeineDatei.txt

machen. Geht wohl auch per WSL2

1701019713642.png


Damit erfaehrt man zumindest was konkret fuer eine TXT das ist.
 
  • Gefällt mir
Reaktionen: madmax2010
Ich würde von MIME bei einer TXT-Datei von 1995 nichts erwarten. Woher soll die Info den kommen? TXT-Dateien haben keinen Header... nur heutzutage, manchmal, einen BOM. Dann hätte Notepad++ das aber auch richtig angezeigt.
Aber: Möglich, das das gar kein TXT ist...

Unklar, was du mit "pretty print" meinst. Formatierungsinformationen gehören in eine (normale) TXT auch eher nicht rein. Den Zeilenumbruch findest du unter "View" (Ansicht?)

Hast du den Text noch in einer anderen Form, z.B. gedruckt? Dann könnte man mit einem Hexeditor zumindest mal die Represäntation bestimmter griech. Buchstaben herausfinden. Oder zunächst, ob die als 1- oder 2-Byte gespeichert sind. Würde es etwas einengen.

Es ist aber möglich, dass das damals schon kaputt exportiert wurde. Dann ist da vermutl. nichts zu retten... vor allem, wenn das Original gar keine TXT-Datei war und der Export von einer Uralt-Word (oder Works oder...)-Version vermurkst wurde. Insbesondere ist es möglich, dass das Zeichen aus "Symbol"-Schriftarten sind. Ähnlich, wie man (manchmal) griech. Buchstaben und Formelzeichen in mathematischen Formeln vor Unicode eingegeben hat (analog zu z.B. https://de.wikipedia.org/wiki/Wingdings).

Interessant ist, dass das "ü" ganz ist. Da hätte ich fast MacGreek (https://en.wikipedia.org/wiki/MacGreek_encoding) als Codierung noch mit in den Ring geworfen - weil es dort ein "ü" gibt. Wenn ich das aber richtig sehe, dürfte das ü dann aber auch nicht passen bei der "Standarddarstellung". Und vor allem in deinem Screenshot: ANSI hat kein "ü"! Dann hat Notepad++ evtl. die EInstellung ignoriert. Ggf. musst du nach dem Umstellen der Codierung die Datei in Notepad++ schließen und neu öffnen (bei mir klappt das auch nicht immer zuverlässig ohne die Datei neu zu laden 😱)

Das ü müsste auch "kapputtgehen", wenn du die Formatierung auf die üblichen Griech. änderst... Und das kann ja wohl nicht im Original so gewesen sein. Spricht für mich daher gegen ein Codepage-Problem. Leider.
 
Einfach probieren anstatt raetseln. Mehr kann man nicht vorschlagen.
Manch Tool unter Windows ist einfach zu jung und hat vergessen was es damals alles so gab oder wurde nie beigebracht was es gab. das "file" unter Linux weiss das alles noch. Und das "file" wird Dir auch sagen was es ist, unabhaengig von der Extension. Zur Not schau mit einem vernuenftigen HexEditor rein ob der Header was hergibt bzw. was die "Sonderzeichen" wirklich fuer Zeichen sind.
 
Vielen Dank für eure Antworten!

Beim Ausführen der Office 95 Professional (ISO) Anwendnung kam folgende Fehlermeldung, mit der ich leider nichts anfangen kann. Die Autorun.exe ließ sich auch schwer oder teils gar nicht starten.

1701042703655.png


Ich werden einen Live Linux booten und die Datei einfügen, aber ich brauche noch einen USB Stick dafür.
BFF schrieb:
file --mime DeineDatei.txt
Ergänzung ()

Sauerbert schrieb:
Unklar, was du mit "pretty print" meinst. Formatierungsinformationen gehören in eine (normale) TXT auch eher nicht rein. Den Zeilenumbruch findest du unter "View" (Ansicht?)
Merci! Dachte pretty print würde nicht nur bei xml funktionieren....


Sauerbert schrieb:
ast du den Text noch in einer anderen Form, z.B. gedruckt?
Muss ich nachfragen, es ist nicht mein Text

Sauerbert schrieb:
Spricht für mich daher gegen ein Codepage-Problem. Leider.
Du meinst, es ist nichts zu retten?

BFF schrieb:
"file" unter Linux weiss das alles noch
Das werde ich!


Beispiele: Der Hex-Editor hat folgendes ausgeworfen:

1701046775546.png



in der txt-Datei:
Rðáí ô’ êéíïýìåíïí PíÜãêç ›ðü ôéíïò êéíåsóèáé. åk ìcí ï¤í dí eáõô² ìx h÷åé ôxí Pñ÷xí ôyò êéíÞóåùò, öáíåñ’í ”ôé œöE eôÝñïõ êéíåsôáé (Phys.241b)


Ansi:
Rðáí ô’ êéíïýìåíïí PíÜãêç ›ðü ôéíïò êéíåsóèáé. åk ìcí ï¤í dí eáõô² ìx h÷åé ôxí Pñ÷xí ôyò êéíÞóåùò, öáíåñ’í ”ôé œöE eôÝñïõ êéíåsôáé


DOS/ IBM-ASCII:
R≡ßφ ⌠Æ ΩΘφ∩²∞σφ∩φ Pφ▄πΩτ ¢≡ⁿ ⌠Θφ∩≥ ΩΘφσs≤ΦßΘ. σk ∞cφ ∩ñφ dφ eß⌡⌠▓ ∞x h≈σΘ ⌠xφ P±≈xφ ⌠y≥ ΩΘφ▐≤σ∙≥, ÷ßφσ±Æφ ö⌠Θ £÷E e⌠▌±∩⌡ ΩΘφσs⌠ßΘ


Macintosh:
R·Ì Ùí ÍÈÌÔ˝ÏÂÌÔÌ PÌ‹„ÍÁ õ¸ ÙÈÌÔÚ ÍÈÌÂsÛË·È. Âk ÏcÌ Ô§Ì dÌ e·ıÙ≤ Ïx h˜ÂÈ ÙxÌ PÒ˜xÌ ÙyÚ ÍÈÌfiÛ¢Ú, ˆ·ÌÂÒíÌ îÙÈ úˆE eÙ›ÒÔı ÍÈÌÂsÙ·È

EBCDIC:
ê0÷Ò4k²ZÒÕÙ\VÒÕÒ&Ò}T²Xº0]4ZÒÕ2²ZÒVË3Y÷ZV,\[ÒÕuÒÀÒÁ÷54¥\ÌÇ7VZ4ÌÒ&17ÌÒ4`2²ZÒú3V926÷ÒV1kÒm4Zæ6áÁ4ù1Õ5²ZÒVË4÷Z
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: derMutant
Waldkiefer schrieb:
Beim Ausführen der Office 95 Professional (ISO) Anwendnung

Auf welchem OS willst Du das denn installieren?
System.mdw gehoert wohl zum Access. Einfach im Setup all den Access-Krams abwaehlen.

Waldkiefer schrieb:
Der Hex-Editor hat folgendes ausgeworfen:

Die allererste Zeile waere auch interessant.
 
  • Gefällt mir
Reaktionen: derMutant
die ersten paar Zeichen deines geposteten Textes:
Win 1253
cπαν τ’ κινούμενον Pνάγκη ›πό τι

ISO 8859-7
cπαν τ κινούμενον Pνάγκη πό τι

DOS 737
cΏάΊ ΪΤ ΆώΊΎ²ΉίΊΎΊ PΊ▄ήΆύ δΏⁿ Ϊώ

EBCDIC875 (Griech.!)
Υ0₯4k²Z¬ͺV¬&T²Xθ0€4Z

MAC Greek
cπαμ τ£ ξιμοΐλεμομ Pμήψξγ ¦πϋ τι

Sieht nichts davon korrekt aus, oder?

Keine von den Unicode-Darstellungen funktioniert, z.B. das Windows-typische UTF 16 LE:
ₒ倠�⃧⃼

OP ist vermutl. auf Win 1252 unterwegs, dann passt das auch mit dem ü (bei mir aber nicht, da andere Codepage). Die 20 als Leerzeichen passt für mich gem. ASCII-Erweiterung zu den vorrangig "großen" Nummern EA, ED, E0 usw. => da liegen ja typ. auch die griech. Zeichen in den ASCII-basierten Codepages. Und der "Rythmus" der Leerzeichen sieht auch nicht soo falsch aus (kann aber kein griechisch). Das spricht für mich eher gegen eine Multi-Byte-Kodierung. Hat jemand eine andere Einschätzung?

Es gibt zwar noch Zeug wie https://en.wikipedia.org/wiki/ELOT_927 - das kann ich mir aber überhaupt nicht vorstellen, da das mit dem deutschen Text gar nicht funktionieren dürfte. (Gab es Texteditoren, bei denen man Codepages per Steuerzeichen im Fließtext ändern konnte?)


Waldkiefer schrieb:
Du meinst, es ist nichts zu retten?
Ich befürchte es... Drücke aber die Daumen, das sich doch eine Lösung findet!


Ich wäre auch an der allerersten Zeile interessiert. Idealerweise gleich als Textdatei (du kannst einfach im Hexeditor grob den hinteren Teil löschen und das (als Kopie) speichern).

Evtl. hast du aber auch bei auf Plattformen wie retrocomputing.stackexchange.com oder reddit (wo sich hoffentlich auch ein paar ältere griechische Programmierer o.ä. rumtreiben) mehr Glück.
 
  • Gefällt mir
Reaktionen: BFF
Das DOS IBM sieht eigentlich am „schönsten“ aus. Ob es passt? 🤷‍♂️

Eventuell könnte @Waldkieferdie Datei in ein Archiv packen und hier zur Verfügung stellen.

Dann wäre es besser das Gesamtkonstrukt zu untersuchen.
 
Sauerbert schrieb:
die ersten paar Zeichen deines geposteten Textes:
Win 1253
cπαν τ’ κινούμενον Pνάγκη ›πό τι
Das ist ja schon fast lesbar. Wie hast du das gemacht?

Wenn man mal Aristoteles "Physik" 241b-242a nachguckt, dann findet man diesen Ausschnitt:

εἶτα τὸ μὴ ὑπό κινούμενον οὐκ ἀνάγκη παύσασθαι κινούμενον τῷ ἄλλο ἠρεμεῖν:
ἀλλ᾽ εἴ τι ἠρεμεῖ τῷ ἄλλο πεπαῦσθαι κινούμενον, ἀνάγκη ὑπό τινος αὐτὸ κινεῖσθαι.
τούτου δʼ εἰλημμένου πᾶν τὸ κινούμενον κινήσεται ὑπό τινος.
 
Zuletzt bearbeitet:
Öhm... das wäre ja trivial, dann musst du das nur in z.B. Notepad++ einstellen. Vermutl. erst ANSI, dann Character Sets -> Greek -> Windows-1253 (sorry, bei mir in Englisch)
Und es dazu überreden, das auch mal wirklich zu laden. Bei mir sehr zickig...

Alternativ: Suche im Startmenü nach "Region", drücke Enter, dann 1. - 3.:

1701109909513.png

Bestätige mit OK. Danach neu starten und Datei im Windows Editor öffnen - oder Notepad++. Bei "ANSI" müsste das dann klappen.

Ich habe auf die schnelle mit der Trialversion von EditPadPro herumgespielt (unter "Convert"). Das kannst du natürlich auch machen.

Edit: Zur Info "Deutsch (Deutschland)" ist Windows-1252
 
  • Gefällt mir
Reaktionen: BFF
Hallo Leute,

vielen Dank für eure zahleichen Antworten! Ich kam leider nicht früher dazu....

BFF schrieb:
Live Linux booten

Ich wollte einen Live Linux booten, hab mir die ISO Datei und balenaEtcher heruntergeladen, aber mein neuer USB Stick macht Probleme, sobald die Datei darauf hochgeladen wird.

Mehrmals per Shell sowie direkt über Eigenschaften des Laufwerks neu formartiert. Es scheint bereinigt zu sein, ...

1701645787784.png


...aber es kommt ständig zu Fehlermeldungen. Es liege kein Datenträger vor, oder er müsse formartiert werden. Merkwürdig ist auch, dass mir bei der Speicherkapazität ständig eine andere, viel niedrigere Zahl des tatsächlichen Speichers angezeigt wird. Da hab ich natürlich dann nicht formartiert, sondern mehrmals ausprobiert, bis mir die 54 GB angzeigt werden. Hab die Treiber aktualisiert. Ich bin etwas ratlos. Liegt es wirlich am USB Stick, ode lieber eine andere ISO Datei?

1701646670396.png

Ergänzung ()

Sauerbert schrieb:
ANSI, dann Character Sets -> Greek -> Windows-1253

Da kommen erstaunliche Ergebnisse heraus! Mit Notepad++ ging es bei mir nicht, aber dafür umso erfolgreicher mit der Trialversion von EditPadPro!! Da ich selber kein griechisch kann, hab ich es weitergeleitet und warte aktuell auf Antwort.
BFF schrieb:
könnte @Waldkieferdie Datei in ein Archiv packen
Auch da warte ich aktuell auf Freigabe, da es nicht mein Text ist.
Was genau meinst du mit Archiv? Ich dachte eher an eine ZIP.
Ergänzung ()

Sauerbert schrieb:
retrocomputing.stackexchange.com oder reddit (wo sich hoffentlich auch ein paar ältere griechische Programmierer o.ä. rumtreiben)
Danke für den Tipp!
Ergänzung ()

BFF schrieb:
Die allererste Zeile waere auch interessant.

1701647412177.png


Erste Zeile - und dann kommt erstmal nicht viel!
Ergänzung ()

Der Nachteil der Neu-Codierung mit
ist, dass sich nun auch äöü Vokale der deutschen Sprache änderten:

1701647885172.png
 
Zuletzt bearbeitet:
Waldkiefer schrieb:
hab mir die ISO Datei und balenaEtcher heruntergeladen, aber mein neuer USB Stick macht Probleme, sobald die Datei darauf hochgeladen wird.

BalenaEtcher nehm ich schon ewig nicht mehr.
Versuch es mit Ventoy. -> https://www.ventoy.net/en/index.html
Anleitung wie es geht ist dort zu finden.

Waldkiefer schrieb:
Was genau meinst du mit Archiv? Ich dachte eher an eine ZIP.

Eine ZIP ist auch ein Archiv.

Waldkiefer schrieb:
Auch da warte ich aktuell auf Freigabe, da es nicht mein Text ist.

Was hast Du dann damit zu tun? Kann der Ersteller seine eigene Datei nicht mehr lesen?

Waldkiefer schrieb:
Es liege kein Datenträger vor, oder er müsse formartiert werden.

Wenn man eine Partition erstellt muss die auch mit einem Dateisystem formatiert werden.
 
@Waldkiefer
Laut den ersten Bytes handelt es sich um Microsoft compound file format. Also gehe ich hier von MS Word .doc Format aus.
Ich kenne mich mit griechischen SchriftSätzen nicht aus. Ich würde aber mal versuchen die zu der Zeit üblivhen griechischen Schriftarten für Word durchzutesten
 
  • Gefällt mir
Reaktionen: Evil E-Lex
LencoX2 schrieb:
Laut den ersten Bytes handelt es sich um Microsoft compound file format. Also gehe ich hier von MS Word .doc Format aus.
Exakt. Es handelt sich um das alte MS-Office-Dateiformat und nicht um eine Textdatei. Sieht man übrigens auch im Screenshot im ersten Beitrag. Dort sind Formatierungen enthalten, so dass es sich unmöglich um eine Textdatei handeln kann.

Eine einfache Möglichkeit den Dateityp unter Windows zu prüfen bietet das kleine Tool TrID.
 
Jupp.
Es zeigt wohl dahin das da ein Jemand sich eine eigene „Lösung“ gebaut hat.

IMG_1619.jpeg

Warum und weshalb jetzt der TE, der ja garnicht der Verfasser des Dokumentes ist, da reinschneit? 🤷‍♂️
 
Servus Leute! Vielen Dank an Euch alle! Sorry ich bin letzter Zeit etwas überfordert, daher hab ich mich noch nicht gemeldet.

Ja genau, ich hatte von Anfang an in beiden Foren nach Hilfe gesucht, weil es ein Thema ist, dass beide betrifft.

Den USB Stick hab ich leider mit dem Versuch Live-Linux zu installieren scheinbar geschrottet.

BFF schrieb:
Was hast Du dann damit zu tun? Kann der Ersteller seine eigene Datei nicht mehr lesen?
Ja, kann nicht mehr darauf zugreifen, ist halt auch schon lange her. In den 90ern. Ich bin dort angestellt. Möchte aber keine Namen nennen.

Hier übrigens die Datei, jetzt mit Freigabe. Hab sie in .txt bekommen.

Evil E-Lex schrieb:
Dateityp unter Windows zu prüfen bietet das kleine Tool TrID.
TrID hat folgendes ergeben:

1703340918793.png
 

Anhänge

  • xeno4a.txt
    42 KB · Aufrufe: 42
1703341109558.png

Warum muss er erst freigeschaltet werden - nur so aus Interesse?

Auf jeden Fall schöne Weihnachten euch allen!
 
Zurück
Oben