Unicode é um padrão da indústria de computação que define um conjunto de caracteres de texto usado em todos os sistemas de computador modernos. Ele é mantido pelo Unicode Consortium, uma organização sem fins lucrativos que trabalha com órgãos de padronização líderes do setor para manter e expandir o padrão Unicode.
O padrão Unicode atribui um número exclusivo, ou ponto de código, a cada caractere usado nas tecnologias de computação modernas, incluindo emojis e outros símbolos. Esses pontos de código permitem que vários sistemas de computador compartilhem dados, independentemente do idioma em que estejam.
O padrão Unicode é dividido em várias seções – chamadas versões – que contêm um conjunto específico de pontos de código para requisitos de uso específicos. Por exemplo, a versão 10.0 define 11.953 caracteres gráficos, 7.834 caracteres de formato e 513 caracteres de controle. À medida que a tecnologia e os requisitos de uso mudam, novas versões do padrão Unicode são lançadas para garantir que permaneçam atualizados.
Um sistema habilitado para Unicode é necessário ao usar símbolos e emojis ou para situações que exigem linguagens de script complexas. Símbolos e emojis permitem que os usuários transmitam rapidamente significado e emoção em uma conversa, enquanto linguagens de escrita complexa referem-se a sistemas de escrita que diferem do conjunto de caracteres padrão. Por exemplo, a escrita árabe requer um conjunto especial de caracteres codificados em Unicode.
Unicode é compatível com todos os sistemas operacionais modernos e quase todas as linguagens de programação modernas. Além disso, os navegadores da Web suportam caracteres Unicode, o que permite que sejam exibidos em páginas da Web.
O padrão Unicode é um componente crítico para muitas aplicações de computação modernas e desempenha um papel importante no progresso da tecnologia informática.