Win7 auf UTF8 umstellen?

Zeboo

Lt. Commander
Registriert
Juli 2008
Beiträge
1.562
Hallo.

Es gibt folgendes: Immer wenn ich eine Datei aus einem Linuxsserver auf mein Windows ziehe sind die Umlaute etc. durch "?" ersetzt. Das geht auch umgekehrt, wenn ich von Windows aus normal schreibe und das auf ein Linux system rüberschriebe erscheint es dort mit "?".

Habe nachgefragt und mir wurde erklärt, dass Linux generell etwas weiter ist als Windows und die schon automatisch immer auf UTF8 setzen. Es liegt nicht am Server sondern an Windows, ich müsste immer wenn ich Dateien erstelle und dort was reinschreibe das extra mit UTF8 umkodieren. Wie stelle ich jetzt Windows so ein, dass generell alles als UTF8 kodiert wird?

Danke und Gruß
 
Reden wir hier vom Dateinamen?
Das klingt eigentlich voll nach FTP-Übertragungsproblem! Da werden Umlaute und Sonderzeichen auch oft durch ein Fragezeichen ersetzt. In dem Fall hilft ein brauchbarer FTP-Client (Filezilla) und als Übertragunsmodus IMMER Binary verwenden. Das beugt Problemen vor.

MfG, Thomas
 
Klingt für mich auch nach einem Übertragungsproblem. Das hatte ich z.B auch bei WinSCP, weil die Default Settings beim Zeichensatz nicht UTF-8 bedeuteten. Hab es dann erzwungen und es klappt super.
 
Naja das kann nicht nur an FTP liegen. Schreibe ich in eine Datei von Windows aus etwas, kopiere das auf mein Stick, lege das in einem Linux rechner wird das wieder mit "?" angezeigt. Ich kann jetzt hingehen und jedes mal wenn ich was schreibe und das mit allen Texteditoren von Notepad++ bis Word so einstellen dass das garantiert UTF-8 ist, oder was ich erfhofft habe: ich stelle Windows 7 komplett auf UTF8, geht sowas nicht?
 
OK, wir müssen etwas ins Detail gehen... welches Linux? Welche Regionaleinstellungen? Welche Zeichen werden umgewandelt? Dateinamen, Dateiinhalt, oder beides?

Scheint so, als verwende irgendwas nur ASCII. Jeder weitere Zeichensatz unterstützt Umlaute. ANSI, Unicode, UTF8... ASCII-Zeichensatz

MFG, Thomas
 
Hi HighTech-Freak.

Welches Linux? Nunja, das wäre eigentlich Ubuntu 9.10 , aber nicht nur auf Ubuntu, sondern auf anderen Distris ist das gleiche Problem da. Von daher denke ich mal, das hier "welches" Linux egal ist.

Welche Zeichen "?" kriegen? Das wären alle Umlaute (ä,ü,ö...). Das aber nur als Dateiinhalt, in Dateinamen nehme ich generell keine Umlaute.

Das lieg aber irgendwie generell an Windows, da wenn ich mit mein Linux vom anderen PC die gleichen Sachen schreibe und losschicke oder bekomme passt alles.
 
HighTech-Freak schrieb:
ANSI ist bei jedem Betriebssystem anders, die Zeichenbelegung ist nicht einheitlich, deswegen kann es auch bei ANSI passieren, dass sich da ein paar Zeichen ändern, wenn man die ANSI kodierte Datei von Windows nach Mac oder Linux oder umgekehrt schiebt. Deswegen gibts ja auch Unicode (UTF-8, UTF-16) - weil er notwendig ist. ;)

Bei den Dateinamen hat das aber jetzt nichts mit durch den User manipulierbarer Kodierung zu tun - ein Dateisystem nutzt von sich aus eine bestimmte Kodierung, bei allen Linuxdateisystemen ist das Unicode, allerdings gilt hier bspw. für ext2, dass zwar das Original ext2 Unicode nutzt, die Windows-Implementierung Ext2IFS aber diesen nicht versteht und deshalb die Dateinamen nicht richtig erkennt. Wie gut NTFS-3g für Linux mit der Kodierung klarkommt, weiß ich nicht, ich weiß auch nicht, ob aktuelles NTFS immernoch ANSi oder schoin Unicode nutzt. Das muss nicht zwangsläufig sein, wenn NTFS-3g die Zeichen nicht richtig ausliest - es kann auch sein, dass die Dateisystemimplementierung bei NTFS-3g einfacch unvollständig ist - NTFS ist ja keine offene Spezifikation.

FAT sollte man bei sowas generell meiden - da werden "erweiterte Dateinamen" im Dateiinhalt abgespeichert, was gelegentlich wiederkehrend zu Fehlern beim Auslesen auf Nicht-Microsoft-Systemen führt, wenn die Dateien auf Windows erstellt wurden. vFAT ist eine proprietäre Dateisystemerweiterung, die nur älter als NTFS, aber nicht so problemlos durch Dritte implementierbar ist, wie oft behauptet wird.

Bei Samba muss man bisher auch Vorsicht mit den Dateinamen walten lassen - Samba versteht die Kodierung von länderspezifischen Zeichen in Microsoft-SMB-Laufwerken auch häufig falsch - SMB ist eben auch proprietärer Mist.

Am besten man macht seine Dateinamen einfach immer so, dass sie nur Zeichen verwenden, die auch in ASCII vorhanden sind - das ist am einfachsten, und in Zeiten von Desktop-Index-Such-Software findet man seine Sachen eh schneller über den Inhalt, als über den Dateinamen. ;)
 
Zuletzt bearbeitet:
OK, also google hat mir verraten, dass Windows zumindest seit Vista in UTF8 kodiert.

In jedem Fall könnte das vlt. helfen: http://de.wikipedia.org/wiki/Wikipedia:UTF-8-Probleme
Windows verwendete häufig ISO/IEC 8859-15. Nur wenn das System/Programm nicht weiß, wie die Datei kodiert ist, was meist der Fall ist, nimmt es die Default-Einstellung. ISO8859 als UTF8 zu öffnen führt unweigerlich zu komischen Zeichen. Is beschissen...

Linux kann ja auf SMB zugreifen, da kann man imho den Zeichesatz des Ziellaufwerks angeben, welcher dann zum Öffnen von Dateien dort verwendet wird...

Hm... OK... Die SMB-Lösung is also auch nicht das Gelbe vom Ei. (Abgesehen davon, dass ich von SMB nix halte)

Mountwalker... hast vielleicht einen Vorschlag, wie man das Problem alltagstauglich lösen kann?

An der Stelle möchte ich noch anmerken, dass ich generell für die Abschaffung vo ä, ü, ö und ß bin. -.-

MFG, Thomas
 
Zuletzt bearbeitet:
Ich hab keine Idee, wie man das alltagstauglich lösen könnte - ich nutze halt in Dateinamen generell ausschließlich ASCII-Zeichen.
 
Zurück
Oben