HTML und Entities

  • Ersteller Ersteller Tankred
  • Erstellt am Erstellt am
T

Tankred

Gast
Hallo,

wie haltet ihr das eigentlich mit HTML und Entities? Ich habe noch einige Seiten zu betreuen, die im "good old" HTML und ISO 8859-1 sind. Da ich zum Codeschreiben gerne PSPad verwende, bleiben beim Copy&Paste von Inhalten meist haufenweise nicht-ASCII-Zeichen, also Umlaute, Anführungszeichen u.ä. im Text. Wie macht ihr das, ersetzt ihr zum Beispiel Umlaute mit Entities wie ä für ä oder vertraut ihr darauf, dass der Browser die Codeanweisung ISO 8859-1 schon korrekt umsetzt? Wenn ihr die Zeichen ersetzt, wie macht ihr das?

Schöne Grüße,

Tankred
 
Ich ersetze nur die Zeichen, die ich ersetzen muss, damit der Code valid bleibt, d.h. das & oder das bullet zeichen.
umlaute schreib ich auch als umlaute und gib dann halt die codierung im headbereich an, mit der ich die datei abgespeichert hab.
 
Ein HTML-fähiger User-Agent, der nicht mit Latin 1 aka ISO 8859-1 zurecht kommt, ist mir in meiner Laufbahn nur selten untergekommen… ;)
Die Entities für Latin 1-Zeichen jenseits der ASCII-Zeichen dienen primär der Bequemlichkeit bzw. Unabhängigkeit, auf diese Weise lassen sich die Zeichen auch ohne entsprechende Eingabegeräte oder bei abweichendem Zeichensatz auf der lokalen Maschine eingeben, ohne sich mit Zeichentabellen und Darstellungsproblemen bzw. -abweichungen herumschlagen zu müssen. Bis auf das Et-Zeichen sowie die öffnende spitze Klammer notiere ich nichts als Entity, nur in äußerst seltenen Fällen, in denen Quote-Zeichen innerhalb von Attributswerten vorkommen, die mit den gleichen Quote-Zeichen umschlossen werden, werden diese natürlich auch als Entity notiert.

greetings, Keita
 
Vielen Dank für euer Feedback!

Computer Freak schrieb:
Ich ersetze nur die Zeichen, die ich ersetzen muss, damit der Code valid bleibt, d.h. das & oder das bullet zeichen.

Stimmt, das bemängelt der Validator bei mir auch immer, weil ich das in a href URLs regelmäßig vergesse. Ansonsten ist mein Code aber stets valide, da ärgert so ein kleiner faux pas, der den Validator in der Folgeinterpretation zudem ganz schön aus dem Tritt bringt.

Keita schrieb:
Ein HTML-fähiger User-Agent, der nicht mit Latin 1 aka ISO 8859-1 zurecht kommt, ist mir in meiner Laufbahn nur selten untergekommen… ;)

"Selten" bedeutet dann wohl, dass es durchaus schon vorgekommen ist!? Ich hatte das Problem mal bei einem Firefox-User, der trotz Latin 1-Deklaration im Source die nicht-ASCII-Zeichen nicht darstellen konnte. Man darf den Einfallsreichtum der User hinsichtlich ihrer Rechnerkonfiguration einfach nicht unterschätzen. ;)
 
Vorgekommen ist sowas durchaus schon mal, allerdings waren es irgendwelche Gehversuche aus den frühen 90ern ;) Bei "Web-Browsern" gehört Latin 1 zum Standardrepertoire, zum HTTP Latin 1 als Standardzeichensatz vorgibt, es dürfte auch schwierig werden ein gängiges Betriebssystem zu finden, welches kein Latin 1 unterstützt.
Nichtsdestotrotz gibt es natürlich auch beim Einsatz von Latin 1 (bzw. Latin 9 aka ISO 8859-15 als Substitut wg. des EUR-Zeichens) die Notwendigkeit mit Entities zu hantieren, wenn ein nicht im Zeichensatz vorkommendes Zeichen dargestellt werden soll. Um solche Frickeleien zu umschiffen, sollte man schlicht und einfach ein Unicode-Derivat wählen, für nahezu alle Fälle bietet sich UTF-8 an.

greetings, Keita
 
Zurück
Oben