Registrieren Passwort vergessen?

Sonderzeichen

22. Nov 2008, 18:11
Satzzeichen
-, ,
 . ,  , ,  ; ,  : ,  … ,  · 
¿, ?, !, ¡, , ؟
„…“, »…« …,  ’ 
/, \
(…), […], {…}, 〈…〉
Sonstige Zeichen
 • 
@, &
|, ¦
°, ′, ″, ‴
*, , †, ‡
#, №, ª, º
§,
©, ℗, ®, ™, ℠
_
~, ˜
Rechenzeichen
+, , ×, ∙, :, ∕, ÷, ±, ∓
=, ≈, ≠ …, ~, ∝ …, <, >
,
%,

Sonderzeichen sind Satzzeichen, die nicht zu den „in Schriftzeichen festgehaltenen Lauten des Alphabets“ gehören.

Die Computer-Icons

Zu den Sonderzeichen gehören beispielsweise Satzzeichen, Klammern und mathematische Symbole. Auch Diakritika sind Sonderzeichen, z.B. Akut oder Breve (é, ă). Zu den Sonderzeichen werden auch die nicht-druckenden Zeichen gezählt, die bei der Gestaltung einer Druckvorlage als Orientierungshilfe dienen.

In den frühen Zeiten der Informationstechnik war die Beschränkung von Zeichensätzen auf 7 oder 8 Bit technisch bedingt. Aufgrund vieler damit verbundener Probleme – so musste zur Einführung des Euro-Zeichens ein anderes Zeichen aus der 8-Bit-Erweiterung von ASCII aus ISO 8859-15 herausgenommen werden – verfügt man heute zunehmend über eine höhere Bitzahl je Zeichen.

Inhaltsverzeichnis

[Bearbeiten] Unicode

Auf modernen Systemen lassen sich auch recht entlegene Sonderzeichen ohne große Umstände benutzen. Dabei haben sich (aus der Not heraus) verschiedene Methoden entwickelt.

Unicode gilt als die modernste und generischste Form der Umsetzung. Jedes Zeichen auf dieser Welt, ob es nun ein Recycling-Symbol oder ein chinesisches Schriftzeichen ist, bekommt einen Platz in den Unicode-Tabellen und wird auf einem Rechner als 1 oder mehr Bytes umfassende Speicherstelle abgebildet. Jedes Unicode-Zeichen hat eine eigene Nummer. In den Zeichentabellen findet sich etwa:

  • U+0935 für das Zeichen व.

[Bearbeiten] HTML

In HTML-Dokumenten werden Sonderzeichen durch sogenannte Zeichen-Entität-Referenzen (engl.: character entity references, auch Entities genannt) dargestellt. Sie beginnen mit einem Und-Zeichen (&) und enden mit einem Semikolon (;), die Zeichenfolge dazwischen bestimmt das Zeichen (amp für das Und-Zeichen selbst, nbsp für ein geschütztes Leerzeichen, gt für das Größer-als-Zeichen).

Dabei muss für die korrekte Anzeige von HTML-Dokumenten im Browser a) die im Dokument angegebene, b) die vom Webserver angegebene und c) die im Browser eingestellte (oder erkannte) Kodierung übereinstimmen. Nutzt man dabei Unicode wie UTF-8, so entfällt die Notwendigkeit der Zeichen-Entity-Referenzen, mit der Ausnahme von HTML-spezifischen Zeichen (&, ", ', <, >).

[Bearbeiten] LaTeX

Populär zur Erstellung wissenschaftlicher Dokumente ist LaTeX, in denen die Sonderzeichen durch spezielle ASCII-Zeichenketten repräsentiert werden. Bei Umlauten schreibt man beispielsweise einfach vor den Basisvokal das doppelte Hochkomma ("). Auch für TeX und LaTeX gibt es mittlerweile UTF-8-Pakete.

[Bearbeiten] Punycode

Um Umlaute und andere Sonderzeichen in Domainnamen darstellen zu können, hat man das Verfahren Punycode entwickelt, welches zusammen mit Nameprep den Standard für internationalisierte Domain-Namen (IDN) ergibt. Dabei werden Nicht-ASCII-Zeichen durch Bindestriche ersetzt und deren Repräsentation an das Ende des Wortes angehängt.

[Bearbeiten] Siehe auch

[Bearbeiten] Literatur

  • Helmut Hiller, Stephan Füssel: Wörterbuch des Buches. Vittorio Klostermann, 7. Aufl. 2006
  • Ursula Rautenberg: Reclams Sachwörterbuch des Buches. Philipp Reclam jun., 2. Aufl. 2003

[Bearbeiten] Weblinks

Dieser Artikel ist eine Kopie aus der freien Enzyklopädie Wikipedia. Am Originalartikel kann jeder Korrekturen und Ergänzungen vornehmen. Zudem kann man frühere Versionen einsehen.
In Kooperation mit Lycos Europe Network