Uma codificação de caracteres é
um padrão de relacionamento entre um conjunto de caracteres com um conjunto de
outra coisa, como por exemplo números ou pulsos elétricos com o objetivo de
facilitar o armazenamento de texto em computadores e sua transmissão através de
redes de telecomunicação. Exemplos comuns são o código Morse que codifica as
letras do alfabeto latino e os numerais como sequências de pulsos elétricos de
longa e curta duração e também o ASCII que codifica os mesmos grafemas do
código Morse.
Código ASCII
ASCII (American Standard Code for
Information Interchange) é o Código Padrão Americano para o Intercâmbio de
Informação. Trata-se de um código binário (cadeias de bits: 0s e 1s) que
codifica um conjunto de 128 sinais: 96 sinais gráficos (letras do alfabeto
latino, sinais de pontuação e sinais matemáticos) e 32 sinais de controle. Cada
código binário possui 8 bits (=1 byte ): 7 bits para o propósito de codificação
e 1 bit de paridade (detecção de erro).
A codificação ASCII é usada para
representar textos em computadores, equipamentos de comunicação, entre outros
dispositivos que trabalham com texto. Desenvolvida a partir de 1960, grande
parte das codificações de caracteres modernas a herdaram como base. Os sinais
não-imprimíveis, conhecidos como caracteres de controlo, são amplamente
utilizados em dispositivos de comunicação e afetam o processamento do texto.
Código Unicode
Unicode é um padrão que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente. Publicado no livro The Unicode Standard 1, 2 o padrão consiste de pouco mais de 107 mil caracteres, um conjunto de diagramas de códigos para referência visual, uma metodologia para codificação e um conjunto de codificações padrões de caracteres, uma enumeração de propriedades de caracteres como caixa alta e caixa baixa, um conjunto de arquivos de computador com dados de referência, além de regras para normalização, decomposição e ordenação alfabética.
Unicode é um padrão que permite aos computadores representar e manipular, de forma consistente, texto de qualquer sistema de escrita existente. Publicado no livro The Unicode Standard 1, 2 o padrão consiste de pouco mais de 107 mil caracteres, um conjunto de diagramas de códigos para referência visual, uma metodologia para codificação e um conjunto de codificações padrões de caracteres, uma enumeração de propriedades de caracteres como caixa alta e caixa baixa, um conjunto de arquivos de computador com dados de referência, além de regras para normalização, decomposição e ordenação alfabética.
Sem comentários:
Enviar um comentário