2. Representando Textos
Digitalmente
• Realizado através de um esquema de codificação
• Métodos de codificação mais utilizados:
Código ASCII (7 bits) - American Standard Code for
Information Interchange
Códigos ASCII Estendidos (8 bits ou 1 byte)
Código Unicode (até 32 bits ou 4 bytes)
7. Representando Textos
Digitalmente
• Exemplo de tabela ASCII estendida (8 bits)
Atenção: existem vários padrões diferentes
• OBS: + Código (no teclado numérico, com ele
ativado) → caractere
8. Representando Textos
Digitalmente
• Código Unicode (www.unicode.org)
Desenvolvido para unificar os diversos padrões de
codificação existentes
• eliminar incompatibilidades entre diferentes sistemas
• Suporta até 32 bits, possibilitando que muito
Representando Textos Digitalmente 49 mais
caracteres sejam codificados (até 2^32)
Repertório atual contém mais de 100.000 caracteres
Abrange caracteres de todas as línguas – Ex.: grego,
hebreu, japonês, ...
• Tem sido adotado por diversos fabricantes e
desenvolvedores de software
9. Representa
ndo Textos
Digitalmen
te
UTF-8
• O encoding da família Unicode mais amplamente
usado e difundido em sistemas operacionais, web e
linguagens de programação é o UTF-8, que foi co-
criado no início dos anos 90 por um dos
arquitetos da linguagem Go (Rob Pike). Além
disso, UTF-8 é o encoding padrão adotado pela W3C
para a Web e ele é 100% compatível com a tabela
ASCII.
• Ele é um padrão de encoding variável e pode usar
de 1 até 4 bytes, a depender do caractere que se
está representando. Ele resolve o problema de não
se fixar 32 bits para todos os caracteres, o que
naturalmente faria um texto escrito em inglês
ocupar um espaço muito maior do que ele poderia
ocupar.
• No seu HTML quando você indica:
• <meta charset="utf-8">
15. Decimal Caractere Decimal Caractere
nulo 0 escape do link de dados 16
início do título 1 controle de dispositivo 1 17
início do texto 2 controle de dispositivo 2 18
fim do texto 3 controle de dispositivo 3 19
fim da transmissão 4 controle de dispositivo 4 20
Inquérito 5 reconhecimento negativo 21
Reconhecer 6 ocioso síncrono 22
Bell 7 fim do bloco de transmissão 23
Backspace 8 cancelar 24
guia horizontal 9 fim do médio 25
feed de linha/nova linha 10 Substituto 26
guia vertical 11 Escapar 27
feed de formulário/nova página 12 separador de arquivos 28
retorno do carro 13 separador de grupo 29
shift out 14 separador de registros 30
shift in 15 separador de unidade 31
espaço 32 Del 127