Unicode

Logo von Unicode

Der Unicode-Standard (Aussprachen: amerikanisches Englisch [ˈjuːnikoʊd], britisches Englisch [ˈjuːnikəʊd]; dt. [ˈjuːnikoːt]) legt fest, wie Schrift elektronisch gespeichert wird, z. B. auf einem Computer oder Telefon. Der durch den Standard festgelegte Zeichensatz enthält 154.998 Zeichen in der Version Unicode 16.0.[1] Das Unicode-Konsortium hat dazu 161 moderne und alte Schriften berücksichtigt, wie auch Symbole, Emojis und nicht druckbare Steuerzeichen. Die ISO bezeichnet den Standard als ISO 10646 und den Zeichensatz als Universal Coded Character Set (UCS).

Unicode muss für die Verarbeitung im Computer in Nullen und Einsen (Binärcode) übersetzt werden. Eine solche Umwandlung wird als Unicode Transformation Format (UTF) bezeichnet. Durchgesetzt hat sich dabei UTF-8. In einigen Fällen ist auch noch UTF-16 anzutreffen, speziell bei Betriebssystemen und Programmiersprachen, für die eine Verwendung von UTF-8 nicht so einfach ist.

  1. Latest Version. In: Unicode® Technical Site. 12. September 2023, abgerufen am 31. Januar 2024 (amerikanisches Englisch).

Developed by StudentB