O slideshow foi denunciado.

e-dictor - uma ferramenta para as humanidades digitais

0

Compartilhar

Carregando em…3
×
1 de 146
1 de 146

e-dictor - uma ferramenta para as humanidades digitais

0

Compartilhar

Baixar para ler offline

Slides da palestra "e-dictor - uma ferramenta para as humanidades digitais", na Semana do Libolo. Universidade de São Paulo, 24 de abrril de 2014 - Maria Clara Paixão de Sousa.

Slides da palestra "e-dictor - uma ferramenta para as humanidades digitais", na Semana do Libolo. Universidade de São Paulo, 24 de abrril de 2014 - Maria Clara Paixão de Sousa.

Mais Conteúdo rRelacionado

Livros relacionados

Gratuito durante 14 dias do Scribd

Ver tudo

e-dictor - uma ferramenta para as humanidades digitais

  1. 1. São Paulo, 24 de abril de 2014 Semana do Projeto Libolo CEA | Universidade de São Paulo
  2. 2. Semana do Projeto Libolo Centro de Estudos Africanos Universidade de São Paulo São Paulo, 24 de abril de 2014
  3. 3. Maria Clara Paixão de Sousa Grupo de Pesquisas Humanidades Digitais Departamento de Letras Clássicas e Vernáculas Uma Ferramenta para as Humanidades Digitaisdictore
  4. 4. dictore
  5. 5. Como se faz? > Para que serve? O que me importa? O que é? dictore
  6. 6. Como funciona?> Para que serve? O que me importa? O que é? dictore
  7. 7. Como funciona? > Para que serve? O que me importa? O que é? dictore
  8. 8. Como funciona? > Para que serve? O que é? dictore
  9. 9. > Uma ferramenta para edição filológica eletrônica e análise linguística automática dictore
  10. 10. > É um software livre, atualmente com duas versões: dictore
  11. 11. > Versão 1.0 Beta 10 dictore
  12. 12. > Versão 1.0 Beta 10 dictore Versão Web – em teste
  13. 13. > Versão 1.0 Beta 10 dictore Versão Web – em teste
  14. 14. > Versão 1.0 Beta 10 dictore Disponível para windows, por download em http://edictor.net
  15. 15. http://edictor.net
  16. 16. eDictor 1.0 Beta 10 – Módulo Transcrição
  17. 17. eDictor 1.0 Beta 10 – Módulo Transcrição
  18. 18. eDictor 1.0 Beta 10 – Módulo Edição
  19. 19. eDictor 1.0 Beta 10 – Módulo Etiquetação
  20. 20. > Versão 1.0 Beta 10 dictore Usada atualmente por seis grupos de pesquisa no Brasil e em Portugal
  21. 21. > Versão 1.0 Beta 10 dictore Usada atualmente por seis grupos de pesquisa no Brasil e em Portugal
  22. 22. Corpus Anotado do Português Histórico Tycho Brahe, (Universidade Estadual de Campinas) Grupo de Pesquisas Humanidades Digitais (Universidade de São Paulo) P.S. Arquivo Digital de Escrita Quotidiana em Portugal e Espanha na Época Moderna (Universidade de Lisboa) Corpus Eletrônico de Documentos Históricos do Sertão, CEDOHS (Universidade Federal de Feira de Santana) Laboratório de História do Português Brasileiro (Universidade Federal do Rio de Janeiro) Memória Conquistense (Universidade Estadual do Sudoeste da Bahia)
  23. 23. > Versão 1.0 Beta 10 dictore Exemplo de aplicação: edição de obras raras digitalizadas - Projeto Edições Filológicas na Brasiliana Digital, 2009-2013
  24. 24. Bibioteca Brasiliana Guita e José Mindlin, doada à Universidade de São Paulo em 2006: 40.000 obras dos séculos XVI a XXI…
  25. 25. Oba! Tudo “digitalizado...”
  26. 26. “digitalizado...”
  27. 27. i m a g e m = “digitalizado...”
  28. 28. RELAÇAÕPA ENTRJDJ QUE FEZO EXCELI, ENTlSSIMO, E REVERENDÍSSIMO SENHORD. F RANTONIO DO DESTERRO MALHEYROAiſpoào Rio de Janeiro, em o primeiro dia defle prtzente Anno de 1747,havendo fidoſeis Annos Biſpo do B, eyno de Angola, donde por no-miacaõ de Sua Mageftade, e Bulla Pontificia, foy promovidopara ella Diocefi. COMPOSTA PELO DOUTORLÜIZ ANTONIO ROSADODA CUNHA£ fm de Fora, e Provedor dos defuntos, e au-Z$nte$ y Capella*, c ReJĩdos do Rio de Janeiro. RIO DE JANEIRO tía Segunda Officina de ANTONIO ISID. ORO DAĩONCECA, Anno de M. CC. XLVII. Com licenças do Senhor Bijfo, OCR “Optical Character Recognition” texto i m a g e m
  29. 29. RELAÇAÕPA ENTRJDJ QUE FEZO EXCELI, ENTlSSIMO, E REVERENDÍSSIMO SENHORD. F RANTONIO DO DESTERRO MALHEYROAiſpoào Rio de Janeiro, em o primeiro dia defle prtzente Anno de 1747,havendo fidoſeis Annos Biſpo do B, eyno de Angola, donde por no-miacaõ de Sua Mageftade, e Bulla Pontificia, foy promovidopara ella Diocefi. COMPOSTA PELO DOUTORLÜIZ ANTONIO ROSADODA CUNHA£ fm de Fora, e Provedor dos defuntos, e au-Z$nte$ y Capella*, c ReJĩdos do Rio de Janeiro. RIO DE JANEIRO tía Segunda Officina de ANTONIO ISID. ORO DAĩONCECA, Anno de M. CC. XLVII. Com licenças do Senhor Bijfo,?
  30. 30. Relação da entrada que fez o excelentíssimo, e reverendíssimo senhor Dom Frei Antonio do Desterro Malheiro, Bispo do Rio de Janeiro, em o primeiro dia deste presente Ano de 1747 havendo sido seis Anos Bispo do Reino de Angola, donde por nomeação de Sua Majestade, e Bula Pontifícia, foi promovido para esta Diocese. Composta pelo doutor Luiz Antonio Rosado da Cunha Juiz de Fora, e Provedor dos defuntos, e ausentes, Capelas, e Residos do Rio de Janeiro. Rio de Janeiro, Na Segunda Oficina de Antonio Isidoro da Fonseca, Ano de MCCXLVII. Com licenças do Senhor Bispo. !
  31. 31. CUNHA, Luís Antonio Rosado da. Relaçãoo da entrada que fez o excellentissimo, e reverendissimo senhor D. Fr. Antonio [...].Rio de Janeiro : Na Segunda Oficina de Antonio Isidoro da Fonseca, 1747.
  32. 32. CUNHA, Luís Antonio Rosado da. Relaçãoo da entrada que fez o excellentissimo, e reverendissimo senhor D. Fr. Antonio [...].Rio de Janeiro : Na Segunda Oficina de Antonio Isidoro da Fonseca, 1747. O primeiro livro impresso no Brasil !
  33. 33. > O Projeto Edições Filológicas na Brasiliana Digital (2009-2013) criou, com o eDictor, edições corrigidas e modernizadas para algumas obras do acervo, além de um banco de dados de erros de reconhecimento automático (OCR).
  34. 34. eDictor 1.0 Beta 10 – Módulo Transcrição
  35. 35. eDictor 1.0 Beta 10 – Módulo Edição
  36. 36. eDictor 1.0 Beta 10 – Módulo Etiquetação
  37. 37. Apresentação Diplomática
  38. 38. textoimagem
  39. 39. Apresentação Modernizada
  40. 40. Apresentação Modernizada
  41. 41. RELAÇÃO/NPR DA/P+D-F ENTRADA/NPR QUE/WPRO FEZ/NPR O/D EXCELENTÍSSIMO/NPR ,/, E/CONJ REVERENDÍSSIMO/NPR SENHOR/NPR DOM/NPR FREI/NPR ANTONIO/NPR DO/P+D DESTERRO/NPR MALHEYRO/NPR Bispo/NPR do/P+D Rio/NPR de/P Janeiro/NPR ,/, em/P o/D primeiro/ADJ dia/N deste/P+D presente/ADJ-G Ano/NPR de/P 1747/NUM havendo/HV-G sido/SR-PP seis/NUM Anos/N-P Bispo/NPR do/P+D Reino/NPR de/P Angola/NPR ,/, donde/P+WADV por/P nomeação/N de/P Sua/PRO$-F Magestade/NPR ,/, e/CONJ Bula/NPR Pontifícia/N ,/, foi/SR-D promovido/VB-AN para/P esta/D-F Diocese/NPR ./. 06_Realacao,2.7/ID COMPOSTA/NPR PELO/NPR DOUTOR/NPR LUIZ/NPR ANTONIO/NPR ROSADO/NPR DA/P+D-F CUNHA/NPR Juíz/NPR de/P Fora/NPR ,/, e/CONJ Provedor/NPR dos/P+D-P defuntos/ADJ-P ,/, e/CONJ ausentes/ADJ-G-P ,/, Capelas/NPR-P ,/, e/CONJ Residos/NPR-P do/P+D Rio/NPR de/P Janeiro/NPR ./. 06_Realacao,2.8/ID RIO/NPR DE/P JANEIRO/ADJ 06_Realacao,2.9/ID Na/P+D-F Segunda/ADJ-F Oficina/NPR de/P ANTONIO/NPR ISIDORO/NPR DA/P+D-F FONCECA/NPR ./. 06_Realacao,2.10/ID Ano/NPR de/P M./NPR CC./. XLVII./. 06_Realacao,2.11/ID Com/P licenças/N-P do/P+D Senhor/NPR Bispo/NPR ./. 06_Realacao,2.12/ID Texto anotado: P.O.S.
  42. 42. Léxico das edições
  43. 43. > Versão 1.0 Beta 10 dictore Outro exemplo de aplicação: edição de manuscritos (LaborHistórico e CEDOHS)
  44. 44. LaborHistorico Laboratório de História do Português Brasileiro Universidade Federal do Rio de Janeiro. Coord. Célia Lopes http://www.letras.ufrj.br/laborhistorico/ >
  45. 45. LaborHistorico Corpus de cartas pessoais brasileiras – Acervo Cupertino do Amaral http://www.letras.ufrj.br/laborhistorico/
  46. 46. LaborHistorico Corpus de cartas pessoais brasileiras – Acervo Cupertino do Amaral http://www.letras.ufrj.br/laborhistorico/
  47. 47. CEDOHS Corpus Eletrônico de Documentos Históricos do Sertão, Coord. Zenaide Carneiro http://www2.uefs.br/cedohs/ >
  48. 48. CEDOHS Acervo - Cartas particulares do Recôncavo da Bahia (1818-1886)) http://www2.uefs.br/cedohs/
  49. 49. > Versão 1.0 Beta 10 dictore Versão Web – em teste
  50. 50. http://www.tycho.iel.unicamp.br/workflow/index.action
  51. 51. <page data-uid="1"> RELAÇÃO DA ENTRADA QUE FEZ O EXCELENTÍSSIMO, E REVERENDÍSSIMO SENHOR DOM FREI ANTONIO DO DESTERRO MALHEYRO Bispo do Rio de Janeiro, em o primeiro dia deste presente Ano de 1747 havendo sido seis Anos Bispo do Reino de Angola, donde por nomeação de Sua Magestade, e Bula Pontifícia, foi promovido para esta Diocese. COMPOSTA PELO DOUTOR LUIZ ANTONIO ROSADO DA CUNHA Juiz de Fora, e Provedor dos defuntos, e ausentes, Capelas, e Residos do Rio de Janeiro. RIO DE JANEIRO Na Segunda Oficina de ANTONIO ISIDORO DA FONCECA. Ano de M. CC. XLVII. Com licenças do Senhor Bispo. </page>
  52. 52. Como funciona?> Para que serve? O que é? dictore
  53. 53. A interface do eDictor simula um editor de textos normal, mas a ferramenta é em essência um anotador linguístico, que aplica uma linguagem de marcação sobre os textos > dictore
  54. 54. A interface do eDictor simula um editor de textos normal, mas a ferramenta é em essência um anotador linguístico, que aplica uma linguagem de marcação sobre os textos? dictore
  55. 55. > XML
  56. 56. XML t e n d e d a r k u p a n g u a g e e >
  57. 57. XML t e n d e d a r k u p a n g u a g e e >
  58. 58. XML t e n d e d a r k u p a n g u a g e e >
  59. 59. XML t e n d e d a r k u p a n g u a g e e >
  60. 60. >
  61. 61. eDictor 1.0 Beta 10 – Módulo Edição
  62. 62. eDictor 1.0 Beta 10 – Módulo Edição
  63. 63. eDictor 1.0 Beta 10 – Módulo Edição
  64. 64. eDictor 1.0 Beta 10 – Configuração de preferências
  65. 65. eDictor 1.0 Beta 10 – Configuração de preferências
  66. 66. eDictor 1.0 Beta 10 – Configuração de preferências
  67. 67. eDictor 1.0 Beta 10 – Configuração de preferências
  68. 68. > XML Código-base do eDictor 1.0 Beta 10
  69. 69. > XML Código-base do eDictor Web
  70. 70. > XML Código-base do eDictor Web
  71. 71. XML - Código-base do eDictor Web
  72. 72. XML - Código-base do eDictor Web
  73. 73. XML - Código-base do eDictor Web
  74. 74. A interface do eDictor simula um editor de textos normal, mas a ferramenta é em essência um anotador linguístico, que aplica uma linguagem de marcação sobre os textos! dictore
  75. 75. Como funciona? > Para que serve? O que me importa? O que é? dictore
  76. 76. > Para que serve? O que me importa? dictore
  77. 77. > O que me importa? dictoreA principal finalidade do eDictor é oferecer uma interface amigável aliada a um alto nível de controle e flexibilidade na codificação de textos eletrônicos com finalidade de pesquisa linguística.
  78. 78. ? O que me importa? dictoreA principal finalidade do eDictor é oferecer uma interface amigável aliada a um alto nível de controle e flexibilidade na codificação de textos eletrônicos com finalidade de pesquisa linguística. mas... pra que a gente precisa de “controle” e “flexibilidade” ?
  79. 79. 1É bom lembrar que todo editor de textos é uma ferramenta de anotação… … a diferença é que nós não temos nenhum controle sobre a anotação dos editores comuns! mas... pra que a gente precisa de “controle” e “flexibilidade” ?
  80. 80. 1É bom lembrar que todo editor de textos é uma ferramenta de anotação… … a diferença é que nós não temos nenhum controle sobre a anotação dos editores comuns! mas... pra que a gente precisa de “controle” e “flexibilidade” ?
  81. 81. É bom lembrar que todo editor de textos é uma ferramenta de anotação… … a diferença é que nós não temos nenhum controle sobre a anotação dos editores comuns! 1 mas... pra que a gente precisa de “controle” e “flexibilidade” ?
  82. 82. mas... pra que a gente precisa de “controle”
  83. 83. mas... pra que a gente precisa de “controle”
  84. 84. Ou seja – o “texto digital”, i.e., o arquivo eletrônico de texto, é sempre um banco de dados, um objeto lógico codificado por alguma linguagem artificial. 1 mas... pra que a gente precisa de “controle” e “flexibilidade” ?
  85. 85. Ou seja – o “texto digital”, i.e., o arquivo eletrônico de texto, é sempre um banco de dados, um objeto lógico codificado por alguma linguagem artificial. 1 mas... pra que a gente precisa de “controle” e “flexibilidade” ?
  86. 86. Para algumas disciplinas, os textos em sua materialidade são o objeto de estudo; e nesses casos, depender de codificações sobre as qual não se tem controle pode ser prejudicial à pesquisa. 1 mas... pra que a gente precisa de “controle” e “flexibilidade” ?
  87. 87. 2 precisa de “controle” e “flexibilidade” ?
  88. 88. Além disso, construir a própria anotação abre um leque de possibilidades impensáveis nos processadores comuns. 2 precisa de “controle” e “flexibilidade” ?
  89. 89. De fato, isso proporciona novas abordagens sobre a língua e sobre o texto 2 precisa de “controle” e “flexibilidade” ?
  90. 90. De fato, isso proporciona novas abordagens sobre a língua e sobre o texto – ou seja, abordagens que seriam impossíveis fora do meio digital. 2 precisa de “controle” e “flexibilidade” ?
  91. 91. Um exemplo de abordagem exclusiva do meio digital é a análise linguística automática, objeto da Linguística Computacional. 2 precisa de “controle” e “flexibilidade” ?
  92. 92. Um exemplo de abordagem exclusiva do meio digital é a análise linguística automática, objeto da Linguística Computacional. A próxima palestra falará sobre isso! 2 precisa de “controle” e “flexibilidade” ?
  93. 93. 2
  94. 94. Há vários outros exemplos de abordagens próprias do meio digital, e elas vem sendo exploradas em corpora construídos desde a década de 1970. 2 precisa de “controle” e “flexibilidade” ?
  95. 95. Há vários outros exemplos de abordagens próprias do meio digital, e elas vem sendo exploradas em corpora construídos desde a década de 1970. Vamos ver alguns casos interessantes. 2 precisa de “controle” e “flexibilidade” ?
  96. 96. esse exemplo é para animar filólogos ...( )
  97. 97. Projeto DigiPal – Digital Paleography http://www.digipal.eu/
  98. 98. Projeto DigiPal – Digital Paleography http://www.digipal.eu/
  99. 99. esse exemplo é para animar latinistas ...( )
  100. 100. Corpus Thomisticum http://www.corpusthomisticum.org/
  101. 101. Corpus Thomisticum http://www.corpusthomisticum.org/
  102. 102. Corpus Thomisticum http://www.corpusthomisticum.org/
  103. 103. esse exemplo é para animar o pessoal de linguística histórica( )
  104. 104. Anglo Saxon Cluster: Projeto LangScape http://www.langscape.org.uk
  105. 105. Anglo Saxon Cluster: Projeto LangScape http://www.langscape.org.uk
  106. 106. Anglo Saxon Cluster: Projeto LangScape http://www.langscape.org.uk
  107. 107. Anglo Saxon Cluster: Projeto Anglo Saxon Charters http://www.aschart.kcl.ac.uk
  108. 108. Anglo Saxon Cluster: Projeto Anglo Saxon Charters http://www.aschart.kcl.ac.uk
  109. 109. Anglo Saxon Cluster: Projeto Anglo Saxon Charters http://www.aschart.kcl.ac.uk
  110. 110. Anglo Saxon Cluster: Projeto Anglo Saxon Charters http://www.aschart.kcl.ac.uk
  111. 111. esse exemplo é para animar o pessoal da língua falada !( )
  112. 112. British National Corpus http://www.natcorp.ox.ac.uk/XMLedition/
  113. 113. British National Corpus http://www.natcorp.ox.ac.uk/XMLedition/
  114. 114. Um ponto em comum liga todos os exemplos mostrados: >
  115. 115. Um ponto em comum liga todos os exemplos mostrados: todos tem por base uma anotação XML, adaptada caso a caso, segundo as diferentes necessidades das pesquisas. >
  116. 116. Era isso o que eu queria dizer sobre “controle” e “flexibilidade”. >
  117. 117. Era isso o que eu queria dizer sobre “controle” e “flexibilidade”. > Ah, tá!
  118. 118. Mas... E as tais das Humanidades Digitais?
  119. 119. Todos esses projetos que vimos são característicos desse campo difusamente conhecido como “Humanidades Digitais”… >
  120. 120. Há muitas definições para esse termo, e muito debate sobre elas. >
  121. 121. Há muitas definições para esse termo, e muito debate sobre elas. (veja alguns exemplos em http://humanidadesdigitais.org/ sobre-as-humanidades-digitais ) >
  122. 122. Aqui, nos interessam dois pontos: essa incursão das humanidades pelo reino da técnica digital não refluirá para as próprias humanidades? >
  123. 123. Nunca é demais lembrar que as Humanidades Digitais são uma maneira de fazer Humanidades – ou seja, não se trata de uma invasão tecnógica nas ciências humanas, mas sim de uma incursão das ciências humanas pelo reino da computação. 1
  124. 124. Os projetos em Humanidades Digitais pretendem continuar fazendo o que as humanidades sempre fizeram, mas com novas ferramentas. 1
  125. 125. Assim, a anotação digital cumpre, na base, a mesma função da anotação não-digital: 1
  126. 126. Assim, a anotação digital cumpre, na base, a mesma função da anotação não-digital: é a aplicação de uma camada de representação sobre o texto. 1
  127. 127. Assim, a anotação digital cumpre, na base, a mesma função da anotação não-digital: é a aplicação de uma camada de representação sobre o texto. Nesse sentido, a anotação é a explicitação da interpretação de um texto. 1
  128. 128. Assim, a anotação digital cumpre, na base, a mesma função da anotação não-digital: é a aplicação de uma camada de representação sobre o texto. Nesse sentido, a anotação é a explicitação da interpretação de um texto. 1 de uma
  129. 129. O texto anotado eletronicamente, entretanto, abre a possibilidade de inúmeras novas formas de representação, como vimos. 1
  130. 130. O texto anotado eletronicamente, entretanto, abre a possibilidade de inúmeras novas formas de representação, como vimos. De fato, os elementos que anotamos se transformam em dados, que podem passar a fazer parte de bases de dados abertas a diferentes cálculos e visualizações. 1
  131. 131. Isso é muito poderoso… 1
  132. 132. Isso é muito poderoso… e nos leva a uma última observação, em forma de pergunta: 1
  133. 133. A incursão das humanidades pelo reino da técnica digital não acabará refluindo para as próprias humanidades? 2
  134. 134. Não poderá transformar, lentamente, nossa abordagem do texto, nos obrigando a tecer com novos fios os tecidos das nossas perguntas e interpretações? 2
  135. 135. E, se isso acontecer… 2
  136. 136. E, se isso acontecer… – será bom ou ruim? 2
  137. 137. Era isso...
  138. 138. Era isso... Obrigada!
  139. 139. Era isso. Obrigada! Universidade de São Paulo Maria Clara Paixão de Sousa humanidadesdigitais.org mariaclara@usp.br
  140. 140. PAIXÃO DE SOUSA, M. C. eDictor: a chronology. Apresentação na mesa redonda “eDictor: advances and perspectives”. Workshop Construction and use of large annotated corpora. Campinas, Unicamp, 09/09/2013. [Slides - Slideshare] PAIXÃO DE SOUSA, M. C.; KEPLER, F. N.; FARIA, P. P. F. E-Dictor: Novas perspectivas na codificação e edição de corpora de textos históricos. In: Tania Shepherd; Tony Berber Sardinha; Marcia Veirano Pinto. (Org.). Caminhos da linguística de corpus. Campinas: Mercado de Letras, 2010. [PDF] FARIA, P. P. F.; PAIXÃO DE SOUSA, M. C.; KEPLER, F. N. An Integrated Tool for Annotating Historical Corpora. The Fourth Linguistic Annotation Workshop (LAW IV) at The 48th Annual Meeting of the Association for Computational Linguistics (ALC 2010), Uppsala, 2010. (Congresso). [PDF (poster)] PAIXÃO DE SOUSA, M. C.; KEPLER, F. N.; FARIA, P. P. F. O Processamento automático de textos antigos: Desafios e Experiências. Workshop de Linguística de Corpus do Projeto Para a História do Português Brasileiro (PHPB), São Paulo, 2010. (Conferência). [PDF (slides)] PAIXÃO DE SOUSA, M. C. Desafios do processamento de textos antigos: primeiros experimentos na Brasiliana Digital. I Workshop de Linguística Computacional da USP, 2009. (Conferência). [PDF(slides)] PAIXÃO DE SOUSA, M. C.; KEPLER, F. N.; FARIA, P. E-dictor: Novas perspectivas na codificação e edição de corpora de textos históricos. VIII Encontro de Linguística de Corpus, Rio de Janeiro, 2009. (Comunicação). PAIXÃO DE SOUSA, M. C.; KEPLER, F. N.; FARIA, P. E-dictor: Novas perspectivas na codificação e edição de corpora de textos históricos. In: VIII Encontro de Linguística de Corpus, 2009, Rio de Janeiro. Resumos, 2009. [PDF (slides)] PAIXÃO DE SOUSA, M. C.; KEPLER, F. N. E-Dictor: Uma ferramenta integrada para a anotação de edição e classe de palavras. VI Encontro de Lingüística de Corpus, São Paulo, 2007. [abrir página]

Notas

  • https://www.dropbox.com/sh/pnxotfuab574owe/v0H5Eeux72/2010_PAIXAODESOUSA_KEPLER_FARIA_EDictor.pdf
  • ×