Umlaute

Jacky007

Lieutenant
Registriert
Okt. 2006
Beiträge
663
Hallo,

ich habe eine Seite, die ganzen Unterseiten sind in .html - jedoch ist dort php Code enthalten. Gelöst habe ich das mit htaccess:

Code:
AddType application/x-httpd-php php php4 php3 html htm

es sind viele unterseiten mit viel texten, leider wurden die Umlaute nicht richtig in html konvetiert also in html wurde einfach ä geschrieben und nicht in ä - nun habe ich das problem, dass alle umlaute und zeichen als � dargestellt werden. Das Problem lässt sich lösen, wenn ich die html datei in php umändere und es aufrufe, dann erscheint alles richtig... nun möchte ich aber die dateien in als html belassen bzw. nicht umändern

hat jemand ne idee, wie ich das problem lösen kann?
 
http header -> zeichensatz
 
Ja UTF-8 als charset definieren in den HTML-Dateien. Heutzutage muss man die HTML Entities nicht mehr benutzen. Wenn Du kannst auch dem Webserver als default charset utf-8 Konfigurieren.
 
Die komplette Kette muss als UTF-8 vorliegen. Das fängt bei deiner Datei an, geht weiter bei den Daten die du verarbeitest, weiter wie du die Daten in der DB speicherst, hin zum Server und ganz zum Schluss bleibt der Browser. Alles muss als UTF-8 ausgewiesen sein bzw. übertragen werden.
 
ich habe in jeder html Datei folgendes gefunden:

<meta http-equiv="content-type" content="text/html; charset=iso-8859-1">

aber der tipp von bog hat geholfen, ich habe eine zufällige html Datei mit dem html-editor geöffnet und gespeichert und nochmal hochgeladen. Jetzt sieht alles gut aus. Nur ist es blöd, dass ich jetzt alle 100 html seiten manuell öffnen und speichern darf?
 
Ich bin immer noch der Meinung -- auch und nicht zuletzt dem beschriebenen Problem folgend --- daß, leider, immer noch kein Weg a HTMLEntities vorbeiführt.

Ja, man sollte eigentlich irgendeine Implementierung von Unicode verwenden können. Ja, das sollte dann am Client ordentlich angezeigt werden.

Tut es meistens auch. Aber blöderweise nicht immer. Und wenn man eine Datenbank hinter seiner Webanwendung hat und die ist in irgendwas-außer-Unicode... dann kriegt man schon deswegen arge Probleme, wenn man nicht aufpaßt wie ein Schießhund und am besten noch einen eigenen Zeichensatzkonverter implementiert und dazwischenschiebt... und da reden wir noch nicht von irgendwelchen Editoren, die der Meinung sind, das mal eben automatisch umzuschreiben entsprechend irgendwelcher Einstellungen die sie meinen irgendwo gefunden zu haben.

Irgendwann(tm) wird sich hoffentlich Unicode allgemein durchgesetzt haben. Aber momentan ist das leider noch nicht. ISO-8859-1 ist auch nicht kompatibel zu Unicode... aber ASCII ist, und wenn man seinen HTML-Code mit Entities statt Sonderzeichen ausfüttert (unter der Annahme, daß nicht ellenlanger kyrillischer Text da stehen soll) dann wird der als ISO lesbar sein und als UTF-8 ebenfalls, ohne daß da irgendwas falsch angezeigt wird.

Entitäten braucht man eh für & ( &amp; ). Merkt man spätestens in XHTML,weil einem das das übelnimmt, wenn man das nicht macht. Da kann man also auch gleich in die Vollen gehen.
 
Zurück
Oben