SlideShare uma empresa Scribd logo
Unicode Tecnologias e Programação Multimédia – 2009/10 Ana Sofia Neves
Código ASCII Como os computadores só interpretam números, tornou-se necessário criar algo, dentro destes, capaz de representar os caracteres existentes. Com efeito, e tendo como base o alfabeto inglês, surgiu o código ASCII (American Standard Code for InformationInterchange) que constitui uma codificação de caracteres de 7 bits. 2 TPM - Unicode Fig. 1 – Caracteres que podem  ser impressos ,[object Object],[object Object]
ISO 8859 e ISO 8859 - 1 Fig. 2 – Caracteres do alfabeto latino 4 TPM - Unicode
Quando se deu o fim do suporte à codificação anteriormente referida, o grupo passou a concentrar-se no UCS (Universal CharacterSet) e no Unicode. Por conseguinte, apareceu a norma internacional ISO/IEC 10646 que define o Conjunto Universal de Caracteres (do inglês Universal CharacterSet) e contém, aproximadamente, 100000 códigos, representando símbolos, letras, números e ideogramas. A Unicode Consortium tem vindo a trabalhar com a ISO, desde 1991, para desenvolver o padrão Unicode e a ISO/IEC 10646 em conjunto, assim, o número e a nomenclatura dos caracteres são idênticos na versão 2.0 do Unicode e na ISO/IEC 10646-1:1993. 5 TPM - Unicode ISO/IEC 10646
O Unicode é um padrão de caracteres normalizado que possibilita aos computadores representar e manipular texto dos diversos sistemas de escrita existentes. Este tinha como principal fim ultrapassar as limitações de codificações de caracteres tradicionais, como as definidas pela ISO 8859, nomeadamente, o facto de permitirem o processamento bilingue mas não o multilingue.  Existem dois métodos possíveis para mapear os códigos Unicode em códigos de implementação, o  UCS (Universal CharacterSet) e o UTF (Unicode TransformationFormat). O número associado ao mapeamento UCS indica o número de bytes por código, por outro lado, o número associado ao UTF indica o número de bits por código. 6 TPM - Unicode Unicode
É um tipo de codificação Unicode de comprimento variável e pode representar qualquer caracter universal padrão do Unicode, sendo também compatível com o código  ASCII.  Por ser uma codificação de comprimento variável representa uma forma de optimizar o espaço alocado para textos Unicode. 7 TPM - Unicode UTF - 8
Tanto o UTF – 16 como o UCS – 2 correspondem a codificações de 16 bits. O primeiro possui uma largura variável e pode incluir uma ou duas palavras 16 bits para representar os caracteres, no entanto, o segundo possui uma largura fixa que apenas suporta o plano básico de línguas, tornando-o assim desusado. 8 TPM - Unicode UTF – 16 e UCS - 2
No campo das codificações de 32 bits existe o UCS – 4 e o UTF – 32. Ambos  usam uma largura fixa para cada caracterUnicode.  Inicialmente, na norma ISO 10646, definiu-se uma forma de representação denominada UCS – 4, em que cada caractercodificado no UCS era representado por um valor de código de 32 bits num espaço de código de inteiros entre 0 e 7FFFFFFF hexadecimal. Como algumas pessoas acharam que era um desperdício reservar um espaço tão grande de código para o mapeamento, surgiu o UTF – 32, um subconjunto do UCS -4 que usa valores de 32 bits num espaço de código de 0 a 10FFFF hexadecimal, apenas. 9 TPM - Unicode UCS - 4
http://pt.wikipedia.org/wiki/ASCII http://pt.wikipedia.org/wiki/ISO_8859-1 http://pt.wikipedia.org/wiki/ISO/IEC_10646 http://pt.wikipedia.org/wiki/Unicode http://pt.wikipedia.org/wiki/UTF-8 http://pt.wikipedia.org/wiki/UTF-16 http://pt.wikipedia.org/wiki/UTF-32/UCS-4 TPM - Unicode 10 Referências
T.P.C.   Unicode

Mais conteúdo relacionado

Destaque

La sociedad del conocimiento
La sociedad del conocimientoLa sociedad del conocimiento
La sociedad del conocimiento
yulicristinamedina
 
Ensaio - Antimatéria: Alternativa Energética
Ensaio - Antimatéria: Alternativa EnergéticaEnsaio - Antimatéria: Alternativa Energética
Ensaio - Antimatéria: Alternativa Energética
Jean Michel Gallo Soldatelli
 
Apresentação VI semana de turismo da UNIRIO
Apresentação VI semana de turismo da UNIRIOApresentação VI semana de turismo da UNIRIO
Apresentação VI semana de turismo da UNIRIO
Douglas Assis
 
C O N C U R S O D E C O C H E S
C O N C U R S O  D E  C O C H E SC O N C U R S O  D E  C O C H E S
C O N C U R S O D E C O C H E S
Jorge Llosa
 
Seo E Sem
Seo E SemSeo E Sem
Seo E Sem
cmykcomunicacao
 
Como se libertar dos pensamentos negativos
Como se libertar dos pensamentos negativosComo se libertar dos pensamentos negativos
Como se libertar dos pensamentos negativos
andremanoel06
 
Sealguemteprocurar
SealguemteprocurarSealguemteprocurar
Sealguemteprocurar
Céu de Kuan Yin
 
Segmentacion de mercados
Segmentacion de mercadosSegmentacion de mercados
Segmentacion de mercados
paulate14
 
teste
testeteste
teste
Suproc
 
Programa 7
Programa 7Programa 7
Programa 7
Ansd
 
Galileo galilei paola naffy anyerly
Galileo galilei paola naffy anyerlyGalileo galilei paola naffy anyerly
Galileo galilei paola naffy anyerly
ricardo_102
 
Bioetica
BioeticaBioetica
Bioetica
isabella9601
 
Audio
AudioAudio
Laboratório Audivisual Hipermedia Aula3 4 13 22 03
Laboratório Audivisual Hipermedia Aula3 4 13 22 03Laboratório Audivisual Hipermedia Aula3 4 13 22 03
Laboratório Audivisual Hipermedia Aula3 4 13 22 03
Pedro Tavares
 
2. dermatología elemental
2. dermatología elemental2. dermatología elemental
2. dermatología elemental
evelimm Nilo Romero
 
A Viagem
A ViagemA Viagem
A Viagem
Paulo Sutto
 
Matrizes de impressão - Fotolito
Matrizes de impressão - FotolitoMatrizes de impressão - Fotolito
Matrizes de impressão - Fotolito
dualpixel
 
Facebook para Empresas: Conteúdo Programático | Veja só o que te espera
Facebook para Empresas: Conteúdo Programático | Veja só o que te esperaFacebook para Empresas: Conteúdo Programático | Veja só o que te espera
Facebook para Empresas: Conteúdo Programático | Veja só o que te espera
Hey, make it Better
 
Buscadores. metodos
Buscadores. metodosBuscadores. metodos
Buscadores. metodos
MajaReino
 
Programa 8
Programa 8Programa 8
Programa 8
Ansd
 

Destaque (20)

La sociedad del conocimiento
La sociedad del conocimientoLa sociedad del conocimiento
La sociedad del conocimiento
 
Ensaio - Antimatéria: Alternativa Energética
Ensaio - Antimatéria: Alternativa EnergéticaEnsaio - Antimatéria: Alternativa Energética
Ensaio - Antimatéria: Alternativa Energética
 
Apresentação VI semana de turismo da UNIRIO
Apresentação VI semana de turismo da UNIRIOApresentação VI semana de turismo da UNIRIO
Apresentação VI semana de turismo da UNIRIO
 
C O N C U R S O D E C O C H E S
C O N C U R S O  D E  C O C H E SC O N C U R S O  D E  C O C H E S
C O N C U R S O D E C O C H E S
 
Seo E Sem
Seo E SemSeo E Sem
Seo E Sem
 
Como se libertar dos pensamentos negativos
Como se libertar dos pensamentos negativosComo se libertar dos pensamentos negativos
Como se libertar dos pensamentos negativos
 
Sealguemteprocurar
SealguemteprocurarSealguemteprocurar
Sealguemteprocurar
 
Segmentacion de mercados
Segmentacion de mercadosSegmentacion de mercados
Segmentacion de mercados
 
teste
testeteste
teste
 
Programa 7
Programa 7Programa 7
Programa 7
 
Galileo galilei paola naffy anyerly
Galileo galilei paola naffy anyerlyGalileo galilei paola naffy anyerly
Galileo galilei paola naffy anyerly
 
Bioetica
BioeticaBioetica
Bioetica
 
Audio
AudioAudio
Audio
 
Laboratório Audivisual Hipermedia Aula3 4 13 22 03
Laboratório Audivisual Hipermedia Aula3 4 13 22 03Laboratório Audivisual Hipermedia Aula3 4 13 22 03
Laboratório Audivisual Hipermedia Aula3 4 13 22 03
 
2. dermatología elemental
2. dermatología elemental2. dermatología elemental
2. dermatología elemental
 
A Viagem
A ViagemA Viagem
A Viagem
 
Matrizes de impressão - Fotolito
Matrizes de impressão - FotolitoMatrizes de impressão - Fotolito
Matrizes de impressão - Fotolito
 
Facebook para Empresas: Conteúdo Programático | Veja só o que te espera
Facebook para Empresas: Conteúdo Programático | Veja só o que te esperaFacebook para Empresas: Conteúdo Programático | Veja só o que te espera
Facebook para Empresas: Conteúdo Programático | Veja só o que te espera
 
Buscadores. metodos
Buscadores. metodosBuscadores. metodos
Buscadores. metodos
 
Programa 8
Programa 8Programa 8
Programa 8
 

Semelhante a T.P.C. Unicode

PTM - Unicode
PTM - UnicodePTM - Unicode
PTM - Unicode
guest61e02d
 
Fique ninja na codificação de caracteres
Fique ninja na codificação de caracteresFique ninja na codificação de caracteres
Fique ninja na codificação de caracteres
Sebastian Webber
 
Unicode: Os segredos da Codificação de Caracteres
Unicode: Os segredos da Codificação de CaracteresUnicode: Os segredos da Codificação de Caracteres
Unicode: Os segredos da Codificação de Caracteres
Douglas V. Pasqua
 
Ze E Jorge
Ze E JorgeZe E Jorge
Ze E Jorge
Zepedrosa
 
Sistemas de numeração
Sistemas de numeraçãoSistemas de numeração
Radiotelegrafia código morse
Radiotelegrafia   código morseRadiotelegrafia   código morse
Radiotelegrafia código morse
Fmoreira4
 
Componentes de Sistemas de Comunicação
Componentes de Sistemas de ComunicaçãoComponentes de Sistemas de Comunicação
Componentes de Sistemas de Comunicação
Mauro
 
Aula sobre bite e byte
Aula sobre bite e byteAula sobre bite e byte
Aula sobre bite e byte
gastaovalle
 

Semelhante a T.P.C. Unicode (8)

PTM - Unicode
PTM - UnicodePTM - Unicode
PTM - Unicode
 
Fique ninja na codificação de caracteres
Fique ninja na codificação de caracteresFique ninja na codificação de caracteres
Fique ninja na codificação de caracteres
 
Unicode: Os segredos da Codificação de Caracteres
Unicode: Os segredos da Codificação de CaracteresUnicode: Os segredos da Codificação de Caracteres
Unicode: Os segredos da Codificação de Caracteres
 
Ze E Jorge
Ze E JorgeZe E Jorge
Ze E Jorge
 
Sistemas de numeração
Sistemas de numeraçãoSistemas de numeração
Sistemas de numeração
 
Radiotelegrafia código morse
Radiotelegrafia   código morseRadiotelegrafia   código morse
Radiotelegrafia código morse
 
Componentes de Sistemas de Comunicação
Componentes de Sistemas de ComunicaçãoComponentes de Sistemas de Comunicação
Componentes de Sistemas de Comunicação
 
Aula sobre bite e byte
Aula sobre bite e byteAula sobre bite e byte
Aula sobre bite e byte
 

T.P.C. Unicode

  • 1. Unicode Tecnologias e Programação Multimédia – 2009/10 Ana Sofia Neves
  • 2.
  • 3. ISO 8859 e ISO 8859 - 1 Fig. 2 – Caracteres do alfabeto latino 4 TPM - Unicode
  • 4. Quando se deu o fim do suporte à codificação anteriormente referida, o grupo passou a concentrar-se no UCS (Universal CharacterSet) e no Unicode. Por conseguinte, apareceu a norma internacional ISO/IEC 10646 que define o Conjunto Universal de Caracteres (do inglês Universal CharacterSet) e contém, aproximadamente, 100000 códigos, representando símbolos, letras, números e ideogramas. A Unicode Consortium tem vindo a trabalhar com a ISO, desde 1991, para desenvolver o padrão Unicode e a ISO/IEC 10646 em conjunto, assim, o número e a nomenclatura dos caracteres são idênticos na versão 2.0 do Unicode e na ISO/IEC 10646-1:1993. 5 TPM - Unicode ISO/IEC 10646
  • 5. O Unicode é um padrão de caracteres normalizado que possibilita aos computadores representar e manipular texto dos diversos sistemas de escrita existentes. Este tinha como principal fim ultrapassar as limitações de codificações de caracteres tradicionais, como as definidas pela ISO 8859, nomeadamente, o facto de permitirem o processamento bilingue mas não o multilingue. Existem dois métodos possíveis para mapear os códigos Unicode em códigos de implementação, o UCS (Universal CharacterSet) e o UTF (Unicode TransformationFormat). O número associado ao mapeamento UCS indica o número de bytes por código, por outro lado, o número associado ao UTF indica o número de bits por código. 6 TPM - Unicode Unicode
  • 6. É um tipo de codificação Unicode de comprimento variável e pode representar qualquer caracter universal padrão do Unicode, sendo também compatível com o código ASCII. Por ser uma codificação de comprimento variável representa uma forma de optimizar o espaço alocado para textos Unicode. 7 TPM - Unicode UTF - 8
  • 7. Tanto o UTF – 16 como o UCS – 2 correspondem a codificações de 16 bits. O primeiro possui uma largura variável e pode incluir uma ou duas palavras 16 bits para representar os caracteres, no entanto, o segundo possui uma largura fixa que apenas suporta o plano básico de línguas, tornando-o assim desusado. 8 TPM - Unicode UTF – 16 e UCS - 2
  • 8. No campo das codificações de 32 bits existe o UCS – 4 e o UTF – 32. Ambos usam uma largura fixa para cada caracterUnicode. Inicialmente, na norma ISO 10646, definiu-se uma forma de representação denominada UCS – 4, em que cada caractercodificado no UCS era representado por um valor de código de 32 bits num espaço de código de inteiros entre 0 e 7FFFFFFF hexadecimal. Como algumas pessoas acharam que era um desperdício reservar um espaço tão grande de código para o mapeamento, surgiu o UTF – 32, um subconjunto do UCS -4 que usa valores de 32 bits num espaço de código de 0 a 10FFFF hexadecimal, apenas. 9 TPM - Unicode UCS - 4
  • 9. http://pt.wikipedia.org/wiki/ASCII http://pt.wikipedia.org/wiki/ISO_8859-1 http://pt.wikipedia.org/wiki/ISO/IEC_10646 http://pt.wikipedia.org/wiki/Unicode http://pt.wikipedia.org/wiki/UTF-8 http://pt.wikipedia.org/wiki/UTF-16 http://pt.wikipedia.org/wiki/UTF-32/UCS-4 TPM - Unicode 10 Referências