| Satzzeichen |
|---|
| -, –, — |
| . , , , ; , : , … , · |
| ¿, ?, !, ¡, ‽, ؟ |
| „…“, »…« …, ’ |
| /, \ |
| (…), […], {…}, 〈…〉 |
| ␠ |
| Sonstige Zeichen |
| • … |
| @, & |
| |, ¦ |
| °, ′, ″, ‴ |
| *, ⁂, †, ‡ |
| #, №, ª, º |
| §, ¶ |
| ©, ℗, ®, ™, ℠ |
| _ |
| ~, ˜ |
| Rechenzeichen |
| +, −, ×, ∙, :, ∕, ÷, ±, ∓ |
| =, ≈, ≠ …, ~, ∝ …, <, > … |
| √, ∫ |
| %, ‰ |
Sonderzeichen sind Satzzeichen, die nicht zu den „in Schriftzeichen festgehaltenen Lauten des Alphabets“ gehören.
Zu den Sonderzeichen gehören beispielsweise Satzzeichen, Klammern und mathematische Symbole. Auch Diakritika sind Sonderzeichen, z.B. Akut oder Breve (é, ă). Zu den Sonderzeichen werden auch die nicht-druckenden Zeichen gezählt, die bei der Gestaltung einer Druckvorlage als Orientierungshilfe dienen.
In den frühen Zeiten der Informationstechnik war die Beschränkung von Zeichensätzen auf 7 oder 8 Bit technisch bedingt. Aufgrund vieler damit verbundener Probleme – so musste zur Einführung des Euro-Zeichens ein anderes Zeichen aus der 8-Bit-Erweiterung von ASCII aus ISO 8859-15 herausgenommen werden – verfügt man heute zunehmend über eine höhere Bitzahl je Zeichen.
Inhaltsverzeichnis |
Auf modernen Systemen lassen sich auch recht entlegene Sonderzeichen ohne große Umstände benutzen. Dabei haben sich (aus der Not heraus) verschiedene Methoden entwickelt.
Unicode gilt als die modernste und generischste Form der Umsetzung. Jedes Zeichen auf dieser Welt, ob es nun ein Recycling-Symbol oder ein chinesisches Schriftzeichen ist, bekommt einen Platz in den Unicode-Tabellen und wird auf einem Rechner als 1 oder mehr Bytes umfassende Speicherstelle abgebildet. Jedes Unicode-Zeichen hat eine eigene Nummer. In den Zeichentabellen findet sich etwa:
In HTML-Dokumenten werden Sonderzeichen durch sogenannte Zeichen-Entität-Referenzen (engl.: character entity references, auch Entities genannt) dargestellt. Sie beginnen mit einem Und-Zeichen (&) und enden mit einem Semikolon (;), die Zeichenfolge dazwischen bestimmt das Zeichen (amp für das Und-Zeichen selbst, nbsp für ein geschütztes Leerzeichen, gt für das Größer-als-Zeichen).
Dabei muss für die korrekte Anzeige von HTML-Dokumenten im Browser a) die im Dokument angegebene, b) die vom Webserver angegebene und c) die im Browser eingestellte (oder erkannte) Kodierung übereinstimmen. Nutzt man dabei Unicode wie UTF-8, so entfällt die Notwendigkeit der Zeichen-Entity-Referenzen, mit der Ausnahme von HTML-spezifischen Zeichen (&, ", ', <, >).
Populär zur Erstellung wissenschaftlicher Dokumente ist LaTeX, in denen die Sonderzeichen durch spezielle ASCII-Zeichenketten repräsentiert werden. Bei Umlauten schreibt man beispielsweise einfach vor den Basisvokal das doppelte Hochkomma ("). Auch für TeX und LaTeX gibt es mittlerweile UTF-8-Pakete.
Um Umlaute und andere Sonderzeichen in Domainnamen darstellen zu können, hat man das Verfahren Punycode entwickelt, welches zusammen mit Nameprep den Standard für internationalisierte Domain-Namen (IDN) ergibt. Dabei werden Nicht-ASCII-Zeichen durch Bindestriche ersetzt und deren Repräsentation an das Ende des Wortes angehängt.