I18n
Locale
Language ISO 639
Country ISO 3166
Variant
pt_BR = Português, Brasil
pt_BR_ PE  = Português, Brasil,  Pernambuco
Números
Datas
Surpresas
Resource Bundle
JSP
JSTL  fmt javadoc
Struts  bean javadoc
Grails  tag message javadoc
Charsets
Unicode  é um conjunto universal de caracteres, um padrão que define, em um único lugar, todos os caracteres necessários p...
Arabic Greek Khmer Runic Armenian Gujurati Lao Sinhala Bengali Gurmukhi Latin Tamil Cherokee Hangul Mongolian Telugu Cyril...
primeiros 65,536 códigos =  B asic  M ultilingual  P lane
próximos  65,536 códigos = supplementary characters
atualmente catalogados mais de  cem mil caracteres
character set   ≠  character encoding
character set  é um conjunto de caracteres para os quais cada caractere é representado por um único número
‘ à’ = 255  Unicode
character encoding reflete o modo como os caracteres são mapeados para bytes para que o computador possa entende-los
ISO-8859-1  =  Latin 1
ISO-8859-1   não é Unicode
ISO-8859-1   abandonado em 2004...
... em favor do  UTF-8
UTF-8   é Unicode
Escolhendo um Encoding
Unicode
Unicode
Unicode
Unicode
Um encoding baseado no Unicode pode suportar  muitas linguagens  acomodar páginas e formulários  que misturem essas lingua...
?
Marcos Pereira [email_address] http://marcospereira.wordpress.com
Próximos SlideShares
Carregando em…5
×

Java I18n Basics

1.905 visualizações

Publicada em

Some basic concepts about i18n in Java

Publicada em: Tecnologia
  • Seja o primeiro a comentar

Java I18n Basics

  1. 1. I18n
  2. 2. Locale
  3. 3. Language ISO 639
  4. 4. Country ISO 3166
  5. 5. Variant
  6. 6. pt_BR = Português, Brasil
  7. 7. pt_BR_ PE = Português, Brasil, Pernambuco
  8. 8. Números
  9. 9. Datas
  10. 10. Surpresas
  11. 11. Resource Bundle
  12. 12. JSP
  13. 13. JSTL fmt javadoc
  14. 14. Struts bean javadoc
  15. 15. Grails tag message javadoc
  16. 16. Charsets
  17. 17. Unicode é um conjunto universal de caracteres, um padrão que define, em um único lugar, todos os caracteres necessários para escrever na maioria dos idiomas vivos usados nos computadores
  18. 18. Arabic Greek Khmer Runic Armenian Gujurati Lao Sinhala Bengali Gurmukhi Latin Tamil Cherokee Hangul Mongolian Telugu Cyrillic Hebrew Tibetan Thaana Devanagari Ethiopic Georgian etc...
  19. 19. primeiros 65,536 códigos = B asic M ultilingual P lane
  20. 20. próximos  65,536 códigos = supplementary characters
  21. 21. atualmente catalogados mais de cem mil caracteres
  22. 22. character set ≠ character encoding
  23. 23. character set é um conjunto de caracteres para os quais cada caractere é representado por um único número
  24. 24. ‘ à’ = 255 Unicode
  25. 25. character encoding reflete o modo como os caracteres são mapeados para bytes para que o computador possa entende-los
  26. 26. ISO-8859-1 = Latin 1
  27. 27. ISO-8859-1 não é Unicode
  28. 28. ISO-8859-1 abandonado em 2004...
  29. 29. ... em favor do UTF-8
  30. 30. UTF-8 é Unicode
  31. 31. Escolhendo um Encoding
  32. 32. Unicode
  33. 33. Unicode
  34. 34. Unicode
  35. 35. Unicode
  36. 36. Um encoding baseado no Unicode pode suportar muitas linguagens acomodar páginas e formulários que misturem essas linguagens
  37. 37. ?
  38. 38. Marcos Pereira [email_address] http://marcospereira.wordpress.com

×