Infos Home | Impressum | Original Artikel & Autoren Liste


ISO 8859-1

ISO 8859-1, genauer ISO/IEC 8859-1, ist ein von der ISO zuletzt 1998 aktualisierter Standard für die Informationstechnik zur Zeichenkodierung mit acht Bit und der erste Teil der Normenfamilie ISO/IEC 8859.

Die mit sieben Bit kodierbaren Zeichen entsprechen US-ASCII mit führendem Nullbit. Zusätzlich zu den 95 darstellbaren ASCII-Zeichen (0x20-0x7E) kodieren alle ISO 8859-Varianten 96 weitere (0xA0-0xFF), also insgesamt jeweils 191 von theoretisch möglichen 256 (= 2^8). Den Positionen 0x00-0x1F und 0x7F-0x9F sind in ISO/IEC 8859 und damit ISO/IEC 8859-1 keine Zeichen zugewiesen. ISO-8859-1 jedoch besetzt alle diese Stellen mit nicht darstellbaren Steuerzeichen.

Windows-1252 wiederum weicht von ISO-8859-1 im Bereich 0x80-0x9F ab, dessen 32 Positionen hier 27 darstellbare Zeichen beinhalten, u.a. die in ISO 8859-15 hinzugekommenen und einige für bessere Typographie notwendige.

ISO 8859-1 versucht möglichst viele Sonderzeichen westeuropäischer Sprachen abzudecken. Da zur Vollständigkeit neben dem Eurosymbol vor allem für Französisch einige Zeichen fehlen, wurde ISO/IEC 8859-15 geschaffen.

Die Unwissenheit um die Unterschiede zwischen ISO/IEC 8859-1, ISO-8859-15 und Windows-1252 sowie ggf. weiterer 8-Bit-Zeichensätze bzw. überhaupt deren Existenz sind steter Quell für Software- und Websitefehler. Der Grund liegt darin, dass man mit dieser Codierung ein Fundamentalgesetz der Informatik verletzt, nämlich dass man ein Ding (eine Einheit) nur mit einer Code-Nummer repräsentieren soll. Eine Codenummer soll nicht verschiedene Dinge bedeuten können. Dieses Chaos wird durch Unicode massiv entschärft.

Inhalt
1 Tabellen
2 Verwendung

Tabellen

ISO/IEC 8859-1

Code -0 -1 -2 -3 -4 -5 -6 -7 -8 -9 -A -B -C -D -E -F
0- nicht belegt
1-
2- SP ! " # $ % & ' ( ) * ,
. /
3- 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4- @ A B C D E F G H I J K L M N O
5- P Q R S T U V W X Y Z [ \\ ] ^ _
6- ` a b c d e f g h i j k l m n o
7- p q r s t u v w x y z {
||~|| |- !8- |rowspan=2 colspan=16 align=center|nicht belegt |- !9- |- !A- |NBSP||¡||¢||£||¤||¥||¦||§||¨||©||ª||«||¬||­||®||¯ |- !B- |°||±||²||³||´||µ||¶||·||¸||¹||º||»||¼||½||¾||¿ |- !C- |À||Á||Â||Ã||Ä||Å||Æ||Ç||È||É||Ê||Ë||Ì||Í||Î||Ï |- !D- |Ð||Ñ||Ò||Ó||Ô||Õ||Ö||×||Ø||Ù||Ú||Û||Ü||Ý||Þ||ß |- !E- |à||á||â||ã||ä||å||æ||ç||è||é||ê||ë||ì||í||î||ï |- !F- |ð||ñ||ò||ó||ô||õ||ö||÷||ø||ù||ú||û||ü||ý||þ||ÿ |} SP (0x20, "space") ist das Leerzeichen, NBSP (0xA0, "non-breaking space") das
feste Leerzeichen und an 0xAD ist der bedingte Trennstrich (SHY, "soft hyphen"), der normalerweise nur am Zeilenende sichtbar ist.

ISO-8859-1

Code -0 -1 -2 -3 -4 -5 -6 -7 -8 -9 -A -B -C -D -E -F
0- NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
1- DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
2- wie ISO/IEC 8859, Windows-125X und US-ASCII
3-
4-
5-
6-
7- wie ISO/IEC 8859, Windows-125X und US-ASCII DEL
8- PAD HOP BPH NBH IND NEL SSA ESA HTS HTJ VTS PLD PLU RI SS2 SS3
9- DCS PU1 PU2 STS CCH MW SPA EPA SOS SGCI SCI CSI ST OSC PM APC
A- wie ISO/IEC 8859-1 und Windows-1252
B-
C-
D-
E-
F-

Die IANA hat folgende gleichwertige großschreibungsunabhängige Bezeichnungen für diese Codetabelle registriert:

Windows-1252

Code -0 -1 -2 -3 -4 -5 -6 -7 -8 -9 -A -B -C -D -E -F
0- wie ISO-8859-1 und US-ASCII
1-
2- wie ISO/IEC 8859, ISO-8859-1 und US-ASCII
3-
4-
5-
6-
7- wie ISO-8859-1 und US-ASCII
8- ƒ ˆ Š Œ Ž
9- - ˜ š œ ž Ÿ
A- wie ISO/IEC 8859-1 und ISO-8859-1
B-
C-
D-
E-
F-

Windows-1252 ist ebenfalls bei der IANA registriert und akzeptiert u.a. "CP1252" als Synonym.

8859-1 vs. -15

Unterschiede Latin-1 zu Latin-9
Position 0xA4 0xA6 0xA8 0xB4 0xB8 0xBC 0xBD 0xBE
8859-1 ¤ ¦ ¨ ´ ¸ ¼ ½ ¾
8859-15 Š š Ž ž Œ œ Ÿ

Verwendung

ISO 8859-1 ist neben US-ASCII und UTF-8 die wohl wichtigste und am häufigsten gebrauchte Kodierungstabelle.

Für mindestens folgende Sprachen reicht ISO 8859-1 aus:

Da dies fast alle heutzutage in Westeuropa, Amerika, Australien und Afrika (außer Arabisch) verwendeten (Schrift-)Sprachen sind, ist es überall dort die dominierende Zeichenkodierung.

Siehe auch: ISO 8859, ISO 8859-2, ISO 8859-3, ISO 8859-4, ISO 8859-5, ISO 8859-6, ISO 8859-7, ISO 8859-8, ISO 8859-9, ISO 8859-10, ISO 8859-11, ISO 8859-13, ISO 8859-14, ISO 8859-15, ISO 8859-16, MacRoman


Der Ursprungsartikel stammt von der deutschsprachigen Wiki pedia (siehe oben: "Original Artikel & Autoren Liste").
Der Text steht unter der GNU Freie Dokumentation Lizenz.



Webtipps: | Handy Lexikon