AW: Umlaute ü,ä,ö etc.
Informier dich doch einfach mal etwas genauer über die beiden Kodierungen.
Kleines Zitat von der Wikipedia-Seite: "UTF-8 hat eine zentrale Bedeutung als globale Zeichenkodierung im Internet"
Probleme mit Sonderzeichen gibt es bei UTF-8
nicht - nur Probleme durch falsches Benutzen der Kodierungen ;-)
(wobei nicht vielleicht sogar ein wenig übertrieben ist^^ Die Entwicklung der Zeichen steht ja nicht still und in UTF-8 nicht enthaltene Zeichen könnten schon Probleme machen - wie bspw. neue bzw. den Verantwortlichen bis dato unbekannte Zeichen. Hier gibt es dann noch UTF-16 und UTF-32, wobei ich da jetzt nicht auf dem Laufenen bin, was den Entwicklungsstand angeht. Derzeit sollte man aber schon von keinen Problemen ausgehen können.)
Darüber hinaus: UTF-8 ist quasi Standard, was die Kodierung im Internet angeht und jeder Browser sendet bspw. Formulardaten automatisch im UTF-8 Format an den Server, wo es dann entsprechend der dortigen Wünsche und Konfigurationen weiterverarbeitet wird.
Würd' mich jetzt mal ein wenig aus dem Fenster lehnen und behaupten, dass nur Anfänger kein UTF-8 verwenden.
Zudem: Eigentlich sollte man für Umlaute (Zeichen, die nicht global unterstützt werden) die HTML-Entitäten verwenden - also für "ü" etwa "ü". Durch UTF-8, einer global verständlichen Kodierung geht man langsam dazu über, dies nicht mehr zu machen. Dies kann man natürlich mal wieder so oder so sehen.
Besonders bei mehrsprachigen Seiten kommt man einfach nicht um UTF-8 herum.
Ich verstehe schon, dass für dich das Ganze vielleicht nicht allzu viel Sinn machen könnte, wenn du vielleicht nur Seite für dich und Bekannte oder einen kleinen, begrenzten Nutzerkreis machst (kleine Vermutung meinerseits, kann man mich da natürlich auch täuschen).
Wenn du aber erstmal mit Sachen wie I18n gearbeitet hast, wird das für dich sicherlich einen größeren Sinn geben.
Von der regionalen Differenzierung mal abgesehen, gibt es zudem auch noch Unterschiede bei den Kodierungen bei den verschiedenen Betriebssystemen. Windows benutzt hier Latin1 / ISO 8859-1 (bzw. eigentlich eine etwas erweiterte Version) und alle anderen in der Regel UTF-8.
Zudem existiert beispielsweise das Euro-Zeichen € nicht in Latin1. Windows verwendet eine Windows-eigene Kodierung, die ein wenig mehr Zeichen als Latin1 enthält, wie unter anderem auch dieses. Verwendest du also das Euro-Zeichen auf deiner Seite, kannst du eigentlich mit Latin1 / ISO 8859-1 nichts mehr anfangen bzw. müsstest halt die HTML-Entität verwenden (hier wohl aber nicht gewünscht).
Das war jetzt nur ein Beispiel, gibt sicherlich noch mehr.
Wenn du dich da ein wenig mehr damit beschäftigen möchtest:
Grundlagen der Zeichenkodierung [toscho.design] + die bereits schon geposteten Links und die darin enthaltenen weiterführenden Links.
Gibt da aber sicherlich auch noch andere interessante und informative Seiten. Am besten einfach mal googlen.
Gruß, PatrickJ
Edit:
Datenbanken verwenden normalerweise standardmäßig die UTF-8-Kodierung, es sei denn, der Benutzer wählt eine andere. Wenn dann ein Update gemacht wird, sollte dies natürlich berücksichtigt werden. Auch sollte man darauf achten, dass die Kodierung in der Datenbank zu der auf der eigenen Seite verwendeten passt.
Probleme treten eigentlich immer dann auf, wenn die Seite in einer anderen Kodierung gespeichert wurde, als es dann dem Browser mitgeteilt wird oder auch wenn die Daten in der Datenbank in einer anderen Kodierung vorliegen, als auf der eigenen Seite verwendet wird.
Das sind eigentlich die (Haupt--)Sachen, die meistens die Ursache von Problemen in diesem Umfeld sind.