Programm um aus z.B. \u0028 normales Zeichen zu machen.

saarlander

Cadet 1st Year
Registriert
Okt. 2012
Beiträge
13
Hallo,
ich habe großen Text (txt-Datei), wo oft statt richtigen Zeichen z.B.
Code:
\u0028
steht. Beispiel für ein Wort:
Code:
Fran\\u00e7ois_Truffau
Die Text-Datei ist in UTF-8-Codierung gespeichert.
verwendet wird. Gibt es eine schnelle Möglichkeit diese Sachen durch richtige Zeichen zu ersetzen?
 
Zuletzt bearbeitet:
Wenn du Firebug (FF Addon) hast, könntest du einfach den Text in Hochkommas in der Konsole einfügen und den Query ausführen lassen, dann wird automatisch gewandelt.
Code:
>>> '\u0028\u0029\u002a\u002b\u002c\u002d\u002e\u002f' <- Eingabe
"()*+,-./" <- Ausgabe
 
Notepad++

Du hast hier eine Datei mit Unicode-Zeichen. ZB. \u0028 entspricht (.
 
Yuuri schrieb:
Wenn du Firebug (FF Addon) hast, könntest du einfach den Text in Hochkommas in der Konsole einfügen und den Query ausführen lassen, dann wird automatisch gewandelt.
Code:
>>> '\u0028\u0029\u002a\u002b\u002c\u002d\u002e\u002f' <- Eingabe
"()*+,-./" <- Ausgabe
Problem, es sind 273-KByte Text. Aber Danke für den Tipp!
frogger9 schrieb:
Notepad++

Du hast hier eine Datei mit Unicode-Zeichen. ZB. \u0028 entspricht (.
Die Text-Datei ist in UTF-8-Codierung gespeichert.
Ich habe die jetzt mit Notepad++ geöffnet und sehe diese seltsame Sachen immer noch.
 
saarlander schrieb:
Problem, es sind 273-KByte Text. Aber Danke für den Tipp!
Gar kein Problem, hab grad eine 500 kB große Datei damit umgewandelt. Mit F12 Firebug öffnen, den Reiter Konsole aktivieren, den Text in Hochkommas umschließen und Enter drücken. Mir fällt nur grad ein, dass du Umbrüche einzeln bearbeiten müsstest.

Guck mal hier, das Script erledigt das für dich: http://claw-dev.de/scripts/convert-unicode-characters.php

@ frogger9: In Unicode codiert: ja. Als Unicode maskierte Zeichen: nein. Insofern es kein Plugin für Np++ gibt, welches die Zeichen einzeln umwandelt, funktioniert das nicht.
 
Zuletzt bearbeitet:
So müsste man aber auch erstmal alle Zeichen zusammensammeln und dann einzeln oder in einem Rutsch ersetzen.
 
Yuuri schrieb:

Was macht dieser Script?
Code:
E'Fran\\u00e7ois_Truffau
wird zu
Code:
E'Fran\\u00e7ois_Truffau
umgewandelt und wenn ich Text eingebe, wo runde und eckige Klammer, Hochkommas, Raute, andere Sonderzeichen vorkommen, dann geschieht nix.
Gute Nacht, werde morgen Yuuri-Ansatz probieren :)
 
Zuletzt bearbeitet:
Das liegt an den doppelten Backslashs. Die müsstest du vorher natürlich in einfache umwandeln, dann wird daraus auch ein ç. Das Script macht im Prinzip obige Lösung (Text nehmen, auswerten und ausgeben).

Ich hab es mal dahingehend erweitert, dass es falsche \\u durch korrekte \u ersetzt, bevor es wandelt.
 
@Yuuri
Vielen Dank für die Seite.
(Die kommt zwar mit Zeilen-Umbrüchen nicht zurecht, aber zumindest mit einzelnen Zeilen :-)
 
Zurück
Oben