Was ist Unicode
Bisher wurden Computer so konfiguriert, daß es für jedes Land bzw. Gegend eine entsprechende Codepage gab und spezielle lokale Zeichen (wie z.B. die deutschen Umlaute: öäüÖÄÜß) benutzt werden konnten. Da diese Codepages zuerst einmal auf 256 Zeichen begrenzt wurden, waren bei einer russischen Einstellung nicht mehr genügend Zeichen übrig für z.B. deutsche Umlaute.
Bei russischen eingestellten Computern kann man also nun nicht mehr deutsche Umlaute benutzen.
Bei vielen asiatischen Schriften werden - ganz im unterschied zur westlichen lateinischer Schrift - mit einem Zeichen gleich eine ganze Silbe bezeichnet. An unterschiedlichen Silben gibt es gleich wesentlich mehr als 256. Noch Schlimmer wird es mit den chinesischen Symbolen, wo es gleich ein Symbol pro Wort gibt.
Warum sollte ich das einsetzen?
Schon heute gibt bei den west-europäischen PCs Verwirrungen, auch wenn man unter sich bleibt. So gibt es für uns hier die Codepages ISO8859-1 und ISO8859-15. Erstere ist die ältere bereits länger vorhandene Version und die zweite enthält auch das Eurosymbol (). Da die Briten keinen Euro haben, brauchen sie folglich auch kein Eurozeichen und somit gibt es auch eine en_UK.iso8859-15 Codepages. Was aber, wenn man seinen PC auf Englisch haben möchte, aber doch das Euro-Symbol benutzen möchte. Nun entweder greift man zu der Zwischenlösung und nimmt die en_IE.iso8859-15 Einstellung (Irland hat ja auch den Euro), oder wenn man schon bei der Umstellung ist, macht man gleich den Schritt auf UTF-8 (Ein Unicode Format) und läßt zukünftige Formatprobleme jetzt schon hinter sich.
Und wäre es nicht schön wenn man seine Dateinamen auch gleich mit chinesischen (風沙), japanischen Kantana (マンア), koreanischem Hangul (안녕), russischem Kyrillisch (течение) schmücken kann?
Programme
Gnome 2.2 oder KDE 2 basierte Programme sollten direkt mit Unicode klar kommen.
Utilities
gucharmap Gnome Unicode Character Map
iconv (Convertiert von Encoding zu Encoding. z.B. vom altem westeuropäischem System nach Unicode: iconv -f iso8859-1 -t utf8 altedate > neuedatei)
yudit (Ein freier Unicode Editor mit vielen Inputmöglichkeiten)
Screenshots
Gnome 2.2 Desktop (208K) |
Der XMMS rechts oben als (noch) nicht Unicode fähiges Programm zeigt ganz schön, wie Dateinamen in UTF-8 encodiert werden (Wobei die Schriftzeichen zur chinesischen BIG5 Encodierung gehören, sieht das fast genauso aus). Ansonsten finden sich auf dem Desktop japanische, koreanische und chinesische Schriftzeichen. |
Links
Kontakt
Prinzipiell ist Alain Schröder <alain@parkautomat.net> gewillt Fragen zu Unicode zu beantworten.