Sonderbare Dateinamen

GaborDenes

Lt. Junior Grade
Registriert
Dez. 2011
Beiträge
376
Moin Forum,
ich habe von einem guten Bekannten mp3-Dateien übertragen bekommen, die unter Windows völlig normal aussehen, unter Linux aber auffällig dargestellt werden:
Win:
08 - Half Glass Woman.mp3
Linux:
08 - Half'$'\240''Glass Woman.mp3

Hat das jemand schon mal gesehen? Und: Wer macht sowas (Muß doch Absicht sein, kein Zufall!)
Aufgefallen ist mir das erst als ich versuchte, das File per FTP von meinem NAS (natürlich über VPN) auf das Smartphone runter zu laden.
 
Linux und Windows verwenden unterschiedliche Zeichensätze und zwischen Half und Glass ist kein normales Leerzeichen sondern ein Sonderzeichen/Steuerzeichen, das in Linux sichtbar wird .
 
Das hat ganz sicher nichts mit den Zeichensätzen zu tun. Damit ärgere ich mich beruflich oft genug herum.
Und ein Leerzeichen dermaßen zu codieren ist auch kein Zufall oder Versehen.
(ALT-255 um ein unsichtbares Leerzeichen zu erzeugen ist mir bekannt.)
Ich leide nicht unter Verfolgungswahn, würde aber eine Absicht dahinter vermuten, wüßte aber nicht, welche.

Trotzdem Danke für eure Antworten.
 
GaborDenes schrieb:
ganz sicher nichts
Woran machst du das genau fest?
Ganz sicher heißt ja nachweisbar, würde mich mal interessieren.
 
  • Gefällt mir
Reaktionen: jmockert89 und fixedwater
GaborDenes schrieb:
Das hat ganz sicher nichts mit den Zeichensätzen zu tun. Damit ärgere ich mich beruflich oft genug herum.
Klar kann sowas mit Encoding zu tun haben. Wenn das via NTFS oder FAT unter Linux reinkommt, gibt's da jeweils einen ganzen Strauß an Konfigurationsoptionen beim Mounten.
GaborDenes schrieb:
Und ein Leerzeichen dermaßen zu codieren ist auch kein Zufall oder Versehen.
Pff, ich hab schon von Windows-Leuten aus Versehen Dokumente voller Vertical Tabs statt Leerzeichen bekommen, weil da irgendwelche Excel-Freaks eine Copy/Paste-Orgie gefeiert haben. Das war das einzige Mal in meinem Leben, dass ich mit dem speziellen Steuerzeichen Berührung hatte.

Zum Thema:
Die Ausgabe von mount auf der Konsole (welches Dateisystem wird mit welchen Optionen genutzt) und von ls|hexdump -C (welche Code Points kommen im Dateinamen tatsächlich vor, ohne weitere Verfälschung des Terminals) sind da spannend.
 
Es geht nicht um Inhalte von Files, sondern um Dateinamen und diese Zeichenkombination $'\240 statt des Leerzeichens kommt definitiv nicht versehentlich durch Copy'n Paste zustande

mount:
on /FTP type ext4 (rw,relatime,stripe=384)
Nochmal zum Encoding: dieses spezielle Leerzeichen ist mir in keinem bekannten Encoding unter gekommen, Probleme gibt es üblicherweise mit den Umlauten und Sonderzeichen.

Ich habe vom Bekannten das rar-file noch mal im Original bekommen und per TotalCommander/FTP auf mein NAS hochgeladen:
das sieht dann so aus:
00000000 30 38 20 2d 20 48 61 6c 66 c2 a0 47 6c 61 73 73 |08 - Half..Glass|

K.A. was das soll. Ist jetzt erledigt, da ich die Dateinamen korrigiert habe. War halt nur neugierig, warum jemand so etwas macht :-)

Thx for help
 
Vielleicht hat er die Datei unbenannt und den String dafuer von irgendeiner Seite kopiert und das war halt mit diesem Leerzeichen versehen.
kA, vielleicht ist es das geschuetzte Leerzeichen, um ein Umbruch zu vermeiden oder jemand wollte ein schmalen Leerzeichen verwenden, weil sie es schicker fand.
Vielleicht ... koennte ... waere ... auch ... moeglich.
 
C2 A0 ist ein Non-Breaking Space https://en.m.wikipedia.org/wiki/Non-breaking_space in UTF-8. Dein Terminal stellt das als Escape Sequence dar (in HTML wäre es   in ähnlicher Notation), das Dollarzeichen etc. stehen da nicht wirklich drin.
A0 hex ist 160 dezimal ist 240 oktal, daher die unterschiedlichen Werte.

In Dateinamen ergibt sich sowas fix, wenn man aus einer Textverbeitung o.ä. kopiert.
 
  • Gefällt mir
Reaktionen: Marco01_809
Zurück
Oben