Zeichencodierung

Zeichencodierung
Die ursprüngliche Tabelle war die ASCII-Tabelle (American Standard Code for Information Interchange). Sie enthielt nur 128 Zeichen, wovon die ersten 32 Zeichen sog. Steuerzeichen (Zeilensprung, Tabulatormarken, etc.) waren und deckte so den Zeichenbedarf im englischen Sprachraum ab.
Die ASCII-Tabelle wurde später um 128 Zeichen auf 256 erweitert. So wurden auch Sonderzeichen, wie die französischen Akzente, oder die deutschen Umlaute, sowie Währungszeichen in der erweiterten ASCII-Tabelle möglich.
Es wurde eine neue Standardtabelle, die ANSI-Tabelle entwickelt – jedoch gab es anfangs häufig Inkompatibilitäten zwischen verschiedenen Systemen.
Durch Internet/Globalisierung stieg mit den unterschiedlichen Schriftkulturen auch der Bedarf an darstellbaren Zeichen am Computer. So entstand die ISO-8859-Zeichencodierunge, die auf die ASCII-Tabelle aufbaut und je nach Bedarf auch andere Sonderzeichen zur Verfügung stellt. Diese Zeichencodierungen lassen sich z.B. in jedem Browser je nach Sprache aktivieren und somit anzeigen.

Aber auch dieses System ist inzwischen veraltet, da man hier immer nur einen Zeichensatz verwenden kann.
Deshalb wurde das sog. Unicode-System entwickelt. Dieses enthält bis zu 65536 Zeichen (bis Vers.3).

Unicode 6.0 enthällt bereits über 100.000 Glyphen (siehe Film unten).

Außerdem kann es zusätzliche Informationen zu den Zeichen enthalten (z.B. Schreibrichtung,   Sortierregeln, …) Mit Unicode ist es möglich z.B. mitten in einem deutschen Text ein chinesisches Sprichwort in der Originalsprache einzufügen: 霮鞹櫼躆 oder so: 仜仚叩司, oder so was: ﰎﰋﲔ
(sorry, ich habe keine Ahnung welche Zeichen ich da zufällig ausgewählt habe!)
P.S. Mac OS X verwendet standardmäßig das Unicode-System.

Dank Zeichensätze weiß also nun der Computer welche Zahl  er einem Schriftzeichen zuordnen soll, bzw., welchem Schriftzeichen eine Zahl entspricht. Er weiß also 65 = A. Nun kann der Computer nicht einmal das A selbständig schreiben, sondern er braucht eine zweite Tabelle, wo er sich das Bildchen für das A holen kann, um es am Bildschirm anzuzeigen oder es auf eine Drucker auszudrucken. Dies nennt man Schriftart.


 

Der Directors Cut zeigt in 2,5 Stunden nun alle Unicode-6.0-Schriftzeichen, das sind genau 109.242 Glyphen, zusammengetragen aus 66 verschiedenen Fonts, macht 12 Zeichen/s. Darunter jede Menge Highlights, zum Beispiel die Keilschrift ab Sekunde 1:17:40 oder die ägyptischen Hieroglyphen ab 1:19:00. Decodeunicode: The Movie D, engl, 2012, 152 min, FSK 0 Besetzung: 109.242 Unicode-Schriftzeichen (12 Zeichen/s) Regie: Johannes Bergerhausen Design: Daniel A. Becker, Johannes Bergerhausen, Siri Poarangan, Wenzel S. Spingler, Mathias Wollin Softwareentwicklung: Daniel A. Becker Ton: Andreas Leo Meyer

Video zur Zeichencodierung:


Weitere interessante Links zum Thema Zeichencodierung für Non-Printer:

Zeichencodierung

Zeichencodierung fürs Web