Programm um aus z.B. \u0028 normales Zeichen zu machen.

saarlander · 4. Dezember 2012

Hallo,
ich habe großen Text (txt-Datei), wo oft statt richtigen Zeichen z.B.

Code:

\u0028

steht. Beispiel für ein Wort:

Code:

Fran\\u00e7ois_Truffau

Die Text-Datei ist in UTF-8-Codierung gespeichert.
verwendet wird. Gibt es eine schnelle Möglichkeit diese Sachen durch richtige Zeichen zu ersetzen?

Yuuri · 4. Dezember 2012

Wenn du Firebug (FF Addon) hast, könntest du einfach den Text in Hochkommas in der Konsole einfügen und den Query ausführen lassen, dann wird automatisch gewandelt.

Code:

>>> '\u0028\u0029\u002a\u002b\u002c\u002d\u002e\u002f' <- Eingabe
"()*+,-./" <- Ausgabe

frogger9 · 4. Dezember 2012

Notepad++

Du hast hier eine Datei mit Unicode-Zeichen. ZB. \u0028 entspricht (.

saarlander · 4. Dezember 2012

Yuuri schrieb:
Wenn du Firebug (FF Addon) hast, könntest du einfach den Text in Hochkommas in der Konsole einfügen und den Query ausführen lassen, dann wird automatisch gewandelt.

Code:

>>> '\u0028\u0029\u002a\u002b\u002c\u002d\u002e\u002f' <- Eingabe "()*+,-./" <- Ausgabe

Problem, es sind 273-KByte Text. Aber Danke für den Tipp!

frogger9 schrieb:
Notepad++

Du hast hier eine Datei mit Unicode-Zeichen. ZB. \u0028 entspricht (.

Die Text-Datei ist in UTF-8-Codierung gespeichert.
Ich habe die jetzt mit Notepad++ geöffnet und sehe diese seltsame Sachen immer noch.

Yuuri · 4. Dezember 2012

saarlander schrieb:
Problem, es sind 273-KByte Text. Aber Danke für den Tipp!

Gar kein Problem, hab grad eine 500 kB große Datei damit umgewandelt. Mit F12 Firebug öffnen, den Reiter Konsole aktivieren, den Text in Hochkommas umschließen und Enter drücken. Mir fällt nur grad ein, dass du Umbrüche einzeln bearbeiten müsstest.

Guck mal hier, das Script erledigt das für dich: http://claw-dev.de/scripts/convert-unicode-characters.php

@ frogger9: In Unicode codiert: ja. Als Unicode maskierte Zeichen: nein. Insofern es kein Plugin für Np++ gibt, welches die Zeichen einzeln umwandelt, funktioniert das nicht.

Daaron · 4. Dezember 2012

Im Zweifel? Suchen und ersetzen geht immer. Geht doch nix über RegEx.

saarlander · 4. Dezember 2012

Daaron schrieb:
Im Zweifel? Suchen und ersetzen geht immer. Geht doch nix über RegEx.

Werde machen, wenn nix besseres gibt. (dann müsste ich alle Zeichen nacheinander ersetzen..)

Yuuri · 4. Dezember 2012

So müsste man aber auch erstmal alle Zeichen zusammensammeln und dann einzeln oder in einem Rutsch ersetzen.

saarlander · 4. Dezember 2012

Yuuri schrieb:
Guck mal hier, das Script erledigt das für dich: http://claw-dev.de/scripts/convert-unicode-characters.php

Was macht dieser Script?

Code:

E'Fran\\u00e7ois_Truffau

wird zu

Code:

E'Fran\\u00e7ois_Truffau

umgewandelt und wenn ich Text eingebe, wo runde und eckige Klammer, Hochkommas, Raute, andere Sonderzeichen vorkommen, dann geschieht nix.
Gute Nacht, werde morgen Yuuri-Ansatz probieren

Yuuri · 4. Dezember 2012

Das liegt an den doppelten Backslashs. Die müsstest du vorher natürlich in einfache umwandeln, dann wird daraus auch ein ç. Das Script macht im Prinzip obige Lösung (Text nehmen, auswerten und ausgeben).

Ich hab es mal dahingehend erweitert, dass es falsche \\u durch korrekte \u ersetzt, bevor es wandelt.

saarlander · 6. Dezember 2012

@Yuuri
Vielen Dank für die Seite.
(Die kommt zwar mit Zeilen-Umbrüchen nicht zurecht, aber zumindest mit einzelnen Zeilen :-)

Suche

Programm um aus z.B. \u0028 normales Zeichen zu machen.

saarlander

Cadet 1st Year

Yuuri

Fleet Admiral

frogger9

Commodore

saarlander

Cadet 1st Year

Yuuri

Fleet Admiral

Daaron

Fleet Admiral

saarlander

Cadet 1st Year

Yuuri

Fleet Admiral

saarlander

Cadet 1st Year

Yuuri

Fleet Admiral

saarlander

Cadet 1st Year

Ähnliche Themen