4. 33
Texto...
• uma sequência estruturada de símbolos convencionados que registra uma
informação, de acordo com uma língua, por meio da escrita.
• Um texto seria, então, basicamente o que é conhecido, nas linguagens de programação, como
uma string mas não qualquer string: uma string que registra uma informação em uma língua,
usando para isso uma forma escrita da mesma.
• uma manifestação da linguagem, uma mensagem usada para transmitir informação
de um autor para um leitor. [Marinho, 2023]
• Pode ser definido como tudo aquilo que é dito por um emissor e interpretado por um receptor.
Dessa forma, tudo que é interpretável é um texto. Outra forma de conceituação é pensar que
tudo aquilo que produz um sentido completo, que seja uma mensagem compreensível, é um
texto.
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
4
5. 33
Definição da Linguística
• Para a Linguística, texto se refere a qualquer passagem, falada ou escrita, de
qualquer tamanho, que forma um todo unificado (Haliday e Hasan, 1976)
• uma passagem de discurso que é coerente em duas visões: é coerente em respeito ao
contexto da situação, e portanto consistente no registro, e é coerente em respeito a si
mesma, e portanto coesiva (Haliday e Hasan, 1976)
• Todo unificado não é compatível com algumas formas que estudamos, como
anúncios, ou mensagens em redes sociais (Atkins, Clear e Ostler, 1992)
• Porém, alguma coerência é esperada
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
5
6. 33
3 Tipos de Textos
• Verbais
• Usam palavras
• Não-verbais
• Usam apenas imagens (gestos, barulhos, etc…)
• Mistos
• Usam palavras e imagens (gestos, barulhos, etc…)
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
6
7. O Que é um Documento?
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
7
8. 33
Documentos
• Documentos eram vistos apenas nos registros textuais
• cartas, contratos e livros
• Com a evolução da Ciência da Informação, e de outras formas de mídia
• fotografias e filmes
• ampliação do conceito.
• documentos de forma funcional, o que levaria a incluir esculturas, objetos de museu, e até
mesmo animais, sendo que documento poderia ser visto como uma
• Evidência física organizada (Buckland, 1997)
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
8
9. 33
Definições
• Qualquer fonte de informação, em forma material, capaz de ser usada para
referência, ou estudo, ou como uma autoridade.
• Exemplos: manuscritos, material impresso, ilustrações, diagramas, espécimes de museu, etc.
• (Buckland, 1997)
• Briet, 1951:
• Uma estrela é um documento? Um seixo rolado por um rio é um documento? Um animal vivo é
um documento? Não. Mas são documentos as fotografias e os catálogos de estrela, as pedras
de um museu de mineralogia, os animais catalogados e expostos em um zoológico
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
9
10. 33
Intenção e Atribuição (Meyriat, 1981)
• Documentos por intenção
• Criados como documentos
• Livros, jornais
• Documentos por atribuição
• Antílope exposto
• O documento pode ser definido como um objeto que suporta a informação, que serve
para comunicar e que é durável (a comunicação pode, assim, ser repetida)
• (Meyriat, 1981)
• Cada mensagem tem um significado e não se pode definir um documento
independentemente do significado da mensagem que ele tem a função de transmitir
• (Meyriat, 2016)
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
10
11. 33
Protagonismo do Receptor (Meyriat, 1981)
• A noção de documento é mais ampla do que o “escrito”.
• Quem dá informação ao objeto é o receptor, ao interpretá-lo
• Jornal → Papel de embrulho de peixe → lido de novo ao desembrulhar
• Horário de Trens em 1920 → Pesquisa sobre uso de transportes no século passado
em 2020
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
11
12. 33
O que é importante no documento? (Meyriat, 1981)
• Não é o registro físico, mas sim a informação associada a ele
• Essa informação depende do desejo e da interpretação tanto do emissor quanto do
receptor
• Há uma transformação no tempo, no espaço e pelos agentes que agem sobre ela
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
12
13. 33
Aspectos do Documento
• Indexicalidade
• pois são representações que apontam para ou discutem outras coisas, conceito também chamado de
aboutness;
• Pluralidade ou complementaridade
• possuindo vários aspectos, como informacional, material e social;
• Estabilidade (Fixity)
• em sua forma física, sendo um móvel imutável, porém a Web trouxe também um grau de fluidez;
• Documentalidade
• a capacidade de produzir, suportar, permitir, encorajar, permitir, influenciar, tornar possível, proibir... em
seus arranjos com outras coisas, e
• Produtividade
• que permite a construção de outros documentos a partir dele.
• (Document Academy, 2022)
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
13
14. 33
Revisão dos conceitos (1/2)
• Documentos, porém, como chama a atenção Briet (1951), não são apenas textos,
mas textos tratados de alguma forma, de maneira que possam ser organizados e
catalogados.
• Isso é feito por meio de dados sobre o documento, ou dados sobre os dados, o que é
chamado de metadado.
• Uma mensagem de micromídia social, um livro, notícias de jornal, são documentos
não só porque contém texto, mas também porque é possível identificá-los de várias
formas, como autor, fonte, data e hora de produção, etc.
• Textos, porém, ao contrário de outros objetos, já contém dados que permitem
identificá-los: o próprio texto.
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
14
15. 33
Revisão dos conceitos (2/2)
• Um documento é qualquer item que transmite informação ou fornece
evidências.
• Os documentos podem ser criados como tal, transformados em documentos
ou podem ser qualquer entidade considerada como documento.
• Os documentos são identificados como tal por possuírem indexicalidade,
documentalidade, complementaridade, fixidez e produtividade.
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
15
17. 33
Compreender o texto
• Os problemas que serão tratados computacionalmente neste livro implicariam que,
como seres humanos, tivéssemos a capacidade de processar imensas quantidades
de texto com a mesma facilidade que podemos processar, enquanto lemos e
pensamos sobre eles, uma sentença ou um livro, e na compreensão de texto em
uma, ou mais, línguas.
• É importante chamar a atenção que mesmo essa solução não seria perfeita, porque
há problemas de compreensão de texto até para humanos, ligados não só ao poder
cognitivo, mas também ao contexto específico e geral em que o texto é
processado.
• Com o computador, apesar de termos um grande aumento de velocidade, os
problemas de buscar um significado se acumulam.
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
17
18. 33
Estrutura em camadas da língua - Níveis
• Fonético
• o estudo dos sons da língua;
• Morfológico
• que estuda partes significativas das palavras;
• Léxico
• que trata das palavras como um todo;
• gramatical ou sintático
• que trata das estruturas das sentenças;
• Semântico
• que trata do significado dessas estruturas;
• Pragmático
• como a língua é usada para alcançar objetivos, e
• Discurso
• que estuda unidades de texto
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
18
19. 33
O menino viu a mulher com o binóculo
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
19
20. 33
Outras problemas
• A manga verde
• Fruta? Manga de Camisa? – Léxico
• De graça até injeção na testa
• Ironia? Piada? – Pragmática
• Quem casa quer casa
• Léxico, sintático, semântico
• ...
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
20
24. 33
Escrita
• “o uso de marcas gráficas para representar enunciados linguísticos específicos” (Rogers 2005).
• Um sistema de escrita é uma forma de comunicação por símbolos, que registram uma língua
falada por caracteres ou grafemas
• Podem ser independentes da língua
• Relação NxM
• Fonema:
• Menores unidades sonoras que formam as palavras de uma língua (Araújo, 2017)
• Grafema:
• Elemento significante mínimo de um sistema de escrita
• Podem ser representados de mais de uma forma (Alógrafos) – a, a,
• Fontes
• Glifo, signo ou caractere
• Grafema x Fonema
• Relação NxM
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
24
25. 33
Sistemas de Escrita (Daniels, 2003)
• Logográficos
• grafemas são ideogramas ou pictogramas que denotam morphemas, as unidades indivisíveis da língua, como o chinês;
• Silábicos
• grafemas representam sílabas, como o Katakana para japonês;
• Abjad
• grafemas representam consoantes com uma vogal inerente variações são indicadas por diacríticos opcionais e não
dominantes, como o Hebraico;
• Abugida (semi-alfabétido)
• grafemas são consoantes e as vogais são representadas por diacríticos, símbolos secundários, como o Devanagari;
• Alfabéticos
• grafemas representam vogais e consoantes (e sons), como os alfabetos Latino, Cirílico e Grego;
• Trácicos (featural)
• cada parte de um símbolo representa um traço fonético, como o Coreano.
• Sistemas mistos.
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
25
26. 33
Logográficos
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
26
By Anonymous - Clio20, CC BY-SA 3.0,
https://commons.wikimedia.org/w/index.php?curid=592581
Public Domain,
https://commons.wikimedia.org/w/index.php?curid=686312
27. 33
Silabário
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
27
By Luke; Semarang, Soerabaja, 1910 -
http://www.d.umn.edu/lib/bible/displays/writing/south.htm, Public Domain,
https://commons.wikimedia.org/w/index.php?curid=29574132
Balinês
By Sakurambo at English Wikipedia - Transferred from en.wikipedia to Commons. Transfer was stated to be made by User:Mike.lifeguard.,
Public Domain, https://commons.wikimedia.org/w/index.php?curid=3240704
Cherokee
28. 33
Abjads
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
28
By see en:Aleppo Codex; scanned by http://www.aleppocodex.org -
http://www.aleppocodex.org, Public Domain,
https://commons.wikimedia.org/w/index.php?curid=9663094
By Dan Pelleg - Own work, Public Domain,
https://commons.wikimedia.org/w/index.php?curid=9568260
Hebraico
Alef-bet Ivrit
Alfabeto Hebraico
(da direita para a esquerda)
E foi depois de Moshé…
29. 33
Abugida
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
29
By Unknown author - http://www.nb.no/baser/schoyen/5/5.20/ms2097.jpg[dead link], Public Domain,
https://commons.wikimedia.org/w/index.php?curid=103513
Devanagari
देवनागरी
कि ki, ि
ु ku, ि
े ke, िो ko
30. 33
Trácico
Geraldo Xexéo - xexeo@ufrj.br O que é Texto
30
Hangul (Hangeul)
Alfabeto Coreano
By metalslick - Own work, CC BY-SA 4.0,
https://commons.wikimedia.org/w/index.php?
curid=63996191
34. 33
Bibliografia
• Araújo, Luciana Kuchenbecker. "O que é fonema?"; Brasil Escola. Disponível em: https://brasilescola.uol.com.br/o-que-e/portugues/o-que-e-fonema.htm. Acesso em 19 de março de
2022.
• Atkins, S., J. Clear e N. Ostler (1 de jan. de 1992). “Corpus Design Criteria”. Literary and Linguistic Computing 7.1, pp. 1–16. doi: 10.1093/llc/7.1.1.
• Bawden, D., & Robinson, L. (2022). Introduction to information science (2nd ed.). Facet.
• Briet, S (1951). Qu’est-ce que la documentation. Paris.
• Buckland, Michael K. (1997). “What Is a ‘‘Document”?” Journal Of The American Society For Information Science 48.9. John Wiley & Sons, Inc., pp. 804–809.
• Daniels, Peter T. (2003). “Writing Systems”. Em: The Handbook of Linguistics. Ed. Por Mark Aronoff e Janie Rees-Miller. Oxford: Blackwell. Cap. 3.
• Document Academy, The (2022). What is a document? url: http://documentacademy.
org/?what-is-a-document (acesso em 04/01/2022).
• Marinho, Fernando (2023) “O que é texto?” Mundo Educação https://mundoeducacao.uol.com.br/redacao/o-que-texto.htm (acesso em 1/2/2023)
• Meyriat, Jean (1981). “Document, documentation, documentologie”. Schéma et Schematisation 14, pp. 51–63.
• Meyriat, Jean (2016). “Documento, documentação, documentologia”. Trad. por Marcílio de Cristina Ortega e Camila Mariana A. da Silva. Revista Perspectivas em Ciência da
Informação 21.3, pp. 240–253. issn: 19815344. url: http://portaldeperioeci.ufmg.br/index.php/pci/article/view/2891 (acesso em 04/01/2022)
• Rogers, H. (2005). Writing Systems: A Linguistic Approach. Blackwell Textbooks in Linguistics. Wiley.