Infos Home | Impressum | Original Artikel & Autoren Liste


UTF-32

UTF-32 ist eine Kodierung für Unicode-Zeichen, bei der jedes Zeichen mit 4 Bytes kodiert wird. Eine andere Bezeichnung für UTF-32 ist deshalb auch UCS-4.

UTF-32 ermöglicht bis zu 4 Milliarden Kodierungen, von denen aber nur etwa eine Million verwendet werden. Daher bleibt das erste Byte und der obere Teil des zweiten Bytes immer auf dem Wert 0. UTF-32 ist eine sehr ineffiziente Speicherungsform, lässt sich aber sehr leicht implementieren. Ein weiterer Vorteil ist, dass man schon an der Länge einer Zeichenkette erkennen kann, wie viele Zeichen enthalten sind.

Andere gängige Kodierungen für Unicode sind UTF-8, UTF-16 und UTF-7.


Der Ursprungsartikel stammt von der deutschsprachigen Wiki pedia (siehe oben: "Original Artikel & Autoren Liste").
Der Text steht unter der GNU Freie Dokumentation Lizenz.