Unicode é un estándar de codificación e exhibición de caracteres que foi proxectado para facilitar o tratamento informático, transmisión e visualización de textos en variadas linguaxes e sistema de escrita, cuxo contido posúe conxuntos de gráficos de código para referencia visual, un método de codificación e unha táboa para caracteres estándar, un conxunto de arquivos de datos da referencia e un número de elementos atinentes ós código, como propiedades, regras para normalización, descomposición, colación, exposición, e orde de exhibición bidireccional (para amosar de forma correcta o texto, tanto os escritos da esquerda para dereita coma os de dereita para esquerda).[1][2]
O desenvolvemento foi polo Unicode Consortium e o Universal Coded Character Set (UCS). Represéntase con tres tipos de codificación, UTF-8, UTF-16 e UTF-32, segundo o número de bits necesarios para identificar cada carácter. Unicode asigna un número (e un nome) a cada carácter de xeito independente ao programa, plataforma ou lingua. Unicode cobre case todas as escritas en uso, ademais das escritas históricas xa extintas e símbolos en especial os matemáticos e os musicais. A primeira versión (1991), baseada na codificación de 16 bit tiña capacidade para codificar 65.536 caracteres, mentres que a Unicode 4.1 aproxímase ao millón. Hai dezasete planos e 262 bloques, nos que se atopan os signos.[3]