Die Zeichencodierung


Unter Zeichencodierung (encoding) versteht man die eindeutige Zuordnung von Buchstaben, Ziffern und Symbolen innerhalb eines Zeichensatzes (auch Zeichenvorrat oder Repertoire genannt). In der EDV werden Zeichen über einen Zahlenwert codiert und können somit übertragen oder auch gespeichert werden. Dank der Zeichencodierung ist es zudem möglich, Zeichencodes in Bytes im Speicher des Computers umzusetzen und Bytes erneut in Zeichencodes zurückzuverwandeln.

Unicode (universaler Code)

Mit dem Unicode werden alle Zeichencodierungsprobleme in der EDV gelöst. Da die meisten Webseiten mit allen Schriften der Welt genutzt werden, ist es für HTML 4.0 und XML bzw. XHTML erlaubt, alle in Unicode definierten Zeichen einzufügen. Dank Unicode können die mittlerweile über 100.000 Unicode-Zeichen in einem einzigen Text verwendet werden.

UTF-8 ist die am weitesten verbreitete Zeichencodierung für Unicode-Zeichen. UTF-8 ist in den ersten 128 Zeichen deckungsgleich mit dem American Standard Code for Information Interchange (ASCII). UTF-8 ist der Standard für die Zeichencodierung des Internets. Knapp 90 Prozent aller Webseiten der Welt verwenden UTF-8 (Stand Oktober 2017).

Die ISO-8859-Familie

In Westeuropa werden insbesondere zwei Codierungen aus der ISO-8859-Familie verwendet: ISO-8859-1 und ISO-8859-15. Die Codierungen der ISO-8859-Familie können 256 verschiedene Zeichen codieren. Dabei wird jedes Zeichen mit einem Byte codiert. Jede dieser Codetabellen versucht, möglichst alle Zeichen der verschiedenen Schriften zu speichern.

Für die Zeichen 0 bis 127 verwenden alle die ASCII-Codetabelle und definieren zusätzlich die Werte 160 bis 255. Neben der ISO-8859-Familie wird auch häufig die Codierung Windows-1252 verwendet. Diese wurde auf Basis von ISO-8859-1 aufgebaut und verwendet zusätzlich die Zeichen 128 bis 159.

Foto: © whitehoune - 123RF.com

Unsere Inhalte werden in Zusammenarbeit mit IT-Experten erstellt, unter der Leitung von Jean-François Pillou, Gründer von CCM.net. CCM ist eine führende internationale Technologie-Webseite und in elf Sprachen verfügbar.
Lesen Sie auch
Das Dokument mit dem Titel « Die Zeichencodierung » wird auf CCM (de.ccm.net) unter den Bedingungen der Creative Commons-Lizenz zur Verfügung gestellt. Unter Berücksichtigung der Lizenzvereinbarungen dürfen Sie das Dokument verwenden, verändern und kopieren, wenn Sie dabei CCM deutlich als Urheber kennzeichnen.