SlideShare uma empresa Scribd logo
1 de 15
UGF – Profa. Ms. Simone Vieira Resende
 Linguística de corpus (ou córpus) é uma área da Linguística que
se ocupa da coleta e análise de corpus, que é um conjunto de dados
linguísticos.
 A LC surgiu com a necessidade que estudiosos da língua sentiram de
se apoiar em usos reais para fazerem generalizações ou esboçarem
teorias a respeito do funcionamento linguístico.
 Atualmente, a LC está intimamente ligada ao uso do computador,
visto que os corpora/córpora (plural de corpus) são eletrônicos.
 O corpus deve ser constituído de dados autênticos (não inventados),
legíveis por computador e representativos de uma língua ou
variedade da língua da qual se deseja estudar.
 As ferramentas computacionais mais comuns são:
 Programas para listar palavras - fazem a
contagem das palavras em um corpus;
 Concordanciadores - programas que permitem que
o usuário procure por palavras específicas em um
corpus, fornecendo exaustivas listas para as
ocorrências da palavra em contexto;
 Etiquetadores - fazem análises automáticas do
corpus e inserem etiquetas (códigos) de ordem 
morfossintática, sintática, semântica oudiscursiva.
 É fato que o fazer terminológico é laborioso,
principalmente se dependermos da nossa atenção
para observarmos a recorrência de certas
combinações.
 O que geralmente ocorre é que, ao notarmos uma
combinação que já vimos antes, não nos
lembramos de onde a vimos, e provavelmente não
somos capazes de localizá-la novamente se
quisermos, por exemplo, compilar uma lista de
espressões consagradas ou montar um glossário.
 Com o advento do computador, tornou-se
possível construir grandes bancos de textos e
consultá-los com ferramentas computacionais
apropriadas para detectar essas ocorrências,
co-ocorrências e recorrências.
 A LC oferece uma metodologia que veio facilitar
muito a identificação das unidades
convencionais de uma língua, assim como os
termos técnicos de uma área de especialidade.
 Os corpus eletronicos nos permitem notar as
ocorrências das unidades fixas.
 Para a LC, um corpus é uma coletânea de
textos
 Um exemplo de aplicação: o Vocabulário para
Culinária SBS (série 1001 Termos)
 Glossário de Gastronomia da Disal
 Slide baseado no item 2 da bibliografia
comentada.
 Corpara e Ensino de tradução
 Linguística de Corpus
 Exemplo do artigo: elaboração de um glossário
técnico com base em corpus.
 Conhecer palavras da área de pesquisa:
sementes.
 Fazer uma limpeza do corpus.
 Fotos – figuras – tabelas
 Corpus comparável: conteúdo similar nas duas
línguas.
 Número de palavras (texto jurídico)
 Número de textos
 Extrair os termos, colocações e fraseologias.
 3 etapas:
 Gera-se uma lista de palavras mais frequentes no
corpus.
 Compara-se com outra de um corpus mais geral, ou
seja, não específico do tema investigado, para
identificar as palavras peculiares, essas seriam as
candidatas.
 Finalmente produzem-se as listas de concordância para
validar as candidatas.
 A frequência leva à identificação de padrões
fraseológicos (colocações).
 A identificação é feita pela observação dos
termos e suas colocações.
 Exemplo da pimenta / gol contra / fazer cera
 A quinta e última etapa seria a compilação de
um glossário.
 Links sobre pesquisa com corpora.
 http://www2.lael.pucsp.br/corpora/
 http://www2.lael.pucsp.br/corpora/bp/conc/
 http://www2.lael.pucsp.br/corpora/bricle/
 http://www.corpusdoportugues.org/
 http://www.termium.com/ (Canadense)
 http://www.geterm.ufscar.br/ (blog sobre terminologia)
 http://www.geltra.ibilce.unesp.br/grupo.php (GELTRA)
 http://www6.ufrgs.br/termisul/ (UFRGS)
 http://www6.ufrgs.br/textquim/ (TextQuim)
 http://www.fflch.usp.br/citrat/citrat.htm (CITRAT)
 http://www.nilc.icmc.usp.br/nilc/tools/pagina-visualtca/visualtca/tca.htm# (VISUAL TCA frases)
 http://www.nilc.icmc.usp.br/nilc/index.html
 http://www2.lael.pucsp.br/corpora/index.htm
 http://corpus.byu.edu/bnc/
 http://corpus.byu.edu/coca/
 http://www.linguateca.pt/
 http://www.linguateca.pt/COMPARA/
 http://www.nilc.icmc.usp.br/nilc/tools/visuallihla/lihla.htm (VISUAL TCA - palavras)
 http://www.termcat.cat/es (Centro de Terminologia em Catalão)
 http://www.corpusdelespanol.org/
 www.webcorp.org.uk
 http://davies-linguistics.byu.edu/
 http://www.natcorp.ox.ac.uk/
Linguística de Corpus, Terminologia e Tradução

Mais conteúdo relacionado

Mais procurados

Que língua é essa
Que língua é essaQue língua é essa
Que língua é essa
marciaorion
 
30954366 beberibe-plano-de-aula-ingles
30954366 beberibe-plano-de-aula-ingles30954366 beberibe-plano-de-aula-ingles
30954366 beberibe-plano-de-aula-ingles
ADRIANA BECKER
 
Libras na escola
Libras na escolaLibras na escola
Libras na escola
NRTE
 
Texto basico -_aspectos_introdutorios_a_libras_-_unidade_ii
Texto basico -_aspectos_introdutorios_a_libras_-_unidade_iiTexto basico -_aspectos_introdutorios_a_libras_-_unidade_ii
Texto basico -_aspectos_introdutorios_a_libras_-_unidade_ii
Paula Aparecida Alves
 

Mais procurados (20)

Elaboração e utilização de materiais didáticos para o ensino de Português c...
Elaboração e utilização de materiais didáticos   para o ensino de Português c...Elaboração e utilização de materiais didáticos   para o ensino de Português c...
Elaboração e utilização de materiais didáticos para o ensino de Português c...
 
Que língua é essa
Que língua é essaQue língua é essa
Que língua é essa
 
Colóquio sobre os surdos
Colóquio sobre os surdosColóquio sobre os surdos
Colóquio sobre os surdos
 
Hábito de Leitura
Hábito de LeituraHábito de Leitura
Hábito de Leitura
 
Sistema de transcrição em libras
Sistema de transcrição em librasSistema de transcrição em libras
Sistema de transcrição em libras
 
Língua e ensino
Língua e ensinoLíngua e ensino
Língua e ensino
 
30954366 beberibe-plano-de-aula-ingles
30954366 beberibe-plano-de-aula-ingles30954366 beberibe-plano-de-aula-ingles
30954366 beberibe-plano-de-aula-ingles
 
Libras na escola
Libras na escolaLibras na escola
Libras na escola
 
Língua port. ii sociolinguística
Língua port. ii   sociolinguísticaLíngua port. ii   sociolinguística
Língua port. ii sociolinguística
 
Libras trab&u apres
Libras trab&u apresLibras trab&u apres
Libras trab&u apres
 
Texto basico -_aspectos_introdutorios_a_libras_-_unidade_ii
Texto basico -_aspectos_introdutorios_a_libras_-_unidade_iiTexto basico -_aspectos_introdutorios_a_libras_-_unidade_ii
Texto basico -_aspectos_introdutorios_a_libras_-_unidade_ii
 
LIBRAS AULA 11: Aspectos Linguísticos da língua de sinais - Aspectos fonológicos
LIBRAS AULA 11: Aspectos Linguísticos da língua de sinais - Aspectos fonológicosLIBRAS AULA 11: Aspectos Linguísticos da língua de sinais - Aspectos fonológicos
LIBRAS AULA 11: Aspectos Linguísticos da língua de sinais - Aspectos fonológicos
 
1. curiosidades sobre a libras
1. curiosidades sobre a libras1. curiosidades sobre a libras
1. curiosidades sobre a libras
 
Mitos e verdades em relação a Libras e seu usuário surdo.
Mitos e verdades em relação a Libras e seu usuário surdo.Mitos e verdades em relação a Libras e seu usuário surdo.
Mitos e verdades em relação a Libras e seu usuário surdo.
 
Direitos autorais
Direitos autoraisDireitos autorais
Direitos autorais
 
Cartilha de libras
Cartilha de librasCartilha de libras
Cartilha de libras
 
Literatura Surda
Literatura SurdaLiteratura Surda
Literatura Surda
 
Novas tecnologias para o aprendizado e uso de inglês
Novas tecnologias para o aprendizado e uso de inglêsNovas tecnologias para o aprendizado e uso de inglês
Novas tecnologias para o aprendizado e uso de inglês
 
Libras basico
Libras basicoLibras basico
Libras basico
 
Plano de curso 9 ano inglês
Plano de curso  9 ano inglêsPlano de curso  9 ano inglês
Plano de curso 9 ano inglês
 

Destaque

Arte en america y en europa durante la conquista
Arte en america y en europa durante la conquistaArte en america y en europa durante la conquista
Arte en america y en europa durante la conquista
mvalle78
 
Presentación transculturacion
Presentación transculturacionPresentación transculturacion
Presentación transculturacion
Tatiana Valverde
 
Enculturación, transculturación y aculturación
Enculturación, transculturación y aculturaciónEnculturación, transculturación y aculturación
Enculturación, transculturación y aculturación
Dannaacg
 
Cultura, aculturación, transculturacion y enculturacion.
Cultura, aculturación, transculturacion y enculturacion. Cultura, aculturación, transculturacion y enculturacion.
Cultura, aculturación, transculturacion y enculturacion.
Marianaa MoOrales
 
La transculturización por Katherin Rojas
La transculturización por Katherin RojasLa transculturización por Katherin Rojas
La transculturización por Katherin Rojas
katerinrojass
 

Destaque (12)

RP e Branding: O Regionalismo como estratégia de gestão de marcas e relaciona...
RP e Branding: O Regionalismo como estratégia de gestão de marcas e relaciona...RP e Branding: O Regionalismo como estratégia de gestão de marcas e relaciona...
RP e Branding: O Regionalismo como estratégia de gestão de marcas e relaciona...
 
Transculturación
Transculturación Transculturación
Transculturación
 
La transculturalización
La transculturalizaciónLa transculturalización
La transculturalización
 
Diagrama de transculturacion
Diagrama de transculturacionDiagrama de transculturacion
Diagrama de transculturacion
 
Historia de misiones 2 clase 6
Historia de misiones 2   clase 6Historia de misiones 2   clase 6
Historia de misiones 2 clase 6
 
Arte en america y en europa durante la conquista
Arte en america y en europa durante la conquistaArte en america y en europa durante la conquista
Arte en america y en europa durante la conquista
 
Sobre la identidad de la literatura latinoamericana
Sobre la identidad de la literatura latinoamericanaSobre la identidad de la literatura latinoamericana
Sobre la identidad de la literatura latinoamericana
 
Identidad latinoamerica
Identidad latinoamericaIdentidad latinoamerica
Identidad latinoamerica
 
Presentación transculturacion
Presentación transculturacionPresentación transculturacion
Presentación transculturacion
 
Enculturación, transculturación y aculturación
Enculturación, transculturación y aculturaciónEnculturación, transculturación y aculturación
Enculturación, transculturación y aculturación
 
Cultura, aculturación, transculturacion y enculturacion.
Cultura, aculturación, transculturacion y enculturacion. Cultura, aculturación, transculturacion y enculturacion.
Cultura, aculturación, transculturacion y enculturacion.
 
La transculturización por Katherin Rojas
La transculturización por Katherin RojasLa transculturización por Katherin Rojas
La transculturización por Katherin Rojas
 

Semelhante a Linguística de Corpus, Terminologia e Tradução

IV encontro de pesquisas do francês_gisele galafacci
IV encontro de pesquisas do francês_gisele galafacciIV encontro de pesquisas do francês_gisele galafacci
IV encontro de pesquisas do francês_gisele galafacci
Gisele Galafacci
 
Dicionários e Recuperação Tolerante
Dicionários e Recuperação ToleranteDicionários e Recuperação Tolerante
Dicionários e Recuperação Tolerante
Alexandre Duarte
 
Descrição e análise morfológica com vistas à disponibilização on-line das ter...
Descrição e análise morfológica com vistas à disponibilização on-line das ter...Descrição e análise morfológica com vistas à disponibilização on-line das ter...
Descrição e análise morfológica com vistas à disponibilização on-line das ter...
Joel S. Coleti
 
00787439a6207a953f6842c5eedfd23a
00787439a6207a953f6842c5eedfd23a00787439a6207a953f6842c5eedfd23a
00787439a6207a953f6842c5eedfd23a
Erinho Marinho
 
Dt 2008 o_que_mudou_resumo
Dt 2008 o_que_mudou_resumoDt 2008 o_que_mudou_resumo
Dt 2008 o_que_mudou_resumo
Eduardcoelho
 
Ingles instrumental
Ingles instrumentalIngles instrumental
Ingles instrumental
elzakiss
 
Obras de referência
Obras de referênciaObras de referência
Obras de referência
fbritol10
 

Semelhante a Linguística de Corpus, Terminologia e Tradução (20)

Crop10 abdu
Crop10 abduCrop10 abdu
Crop10 abdu
 
IV encontro de pesquisas do francês_gisele galafacci
IV encontro de pesquisas do francês_gisele galafacciIV encontro de pesquisas do francês_gisele galafacci
IV encontro de pesquisas do francês_gisele galafacci
 
Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnolog...
Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnolog...Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnolog...
Compilação de Corpus em Língua Portuguesa na área de Nanociência/Nanotecnolog...
 
Dificuldades no trabalho do revisor de textos: possíveis contribuições da lin...
Dificuldades no trabalho do revisor de textos: possíveis contribuições da lin...Dificuldades no trabalho do revisor de textos: possíveis contribuições da lin...
Dificuldades no trabalho do revisor de textos: possíveis contribuições da lin...
 
Apostila Redação Técnica CFS
Apostila Redação Técnica CFSApostila Redação Técnica CFS
Apostila Redação Técnica CFS
 
Entrevistias ronice miller
Entrevistias ronice millerEntrevistias ronice miller
Entrevistias ronice miller
 
Dicionários e Recuperação Tolerante
Dicionários e Recuperação ToleranteDicionários e Recuperação Tolerante
Dicionários e Recuperação Tolerante
 
Descrição e análise morfológica com vistas à disponibilização on-line das ter...
Descrição e análise morfológica com vistas à disponibilização on-line das ter...Descrição e análise morfológica com vistas à disponibilização on-line das ter...
Descrição e análise morfológica com vistas à disponibilização on-line das ter...
 
00787439a6207a953f6842c5eedfd23a
00787439a6207a953f6842c5eedfd23a00787439a6207a953f6842c5eedfd23a
00787439a6207a953f6842c5eedfd23a
 
As ferramentas, os percursos e as estratégias de tradução no universo digital...
As ferramentas, os percursos e as estratégias de tradução no universo digital...As ferramentas, os percursos e as estratégias de tradução no universo digital...
As ferramentas, os percursos e as estratégias de tradução no universo digital...
 
Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...
Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...
Dicionário-piloto de Nanociência e Nanotecnologia: do corpus à disponibilizaç...
 
Dt 2008 o_que_mudou_resumo
Dt 2008 o_que_mudou_resumoDt 2008 o_que_mudou_resumo
Dt 2008 o_que_mudou_resumo
 
Plataforma Kuhi-pei
Plataforma Kuhi-peiPlataforma Kuhi-pei
Plataforma Kuhi-pei
 
Corpora para Processamento de Linguagem Natural
Corpora para Processamento de Linguagem NaturalCorpora para Processamento de Linguagem Natural
Corpora para Processamento de Linguagem Natural
 
Exame de Qualificação - BASE DE DADOS MORFOLÓGICOS DE TERMINOLOGIAS DO PORTUG...
Exame de Qualificação - BASE DE DADOS MORFOLÓGICOS DE TERMINOLOGIAS DO PORTUG...Exame de Qualificação - BASE DE DADOS MORFOLÓGICOS DE TERMINOLOGIAS DO PORTUG...
Exame de Qualificação - BASE DE DADOS MORFOLÓGICOS DE TERMINOLOGIAS DO PORTUG...
 
Ingles instrumental
Ingles instrumentalIngles instrumental
Ingles instrumental
 
Aula_4_LN_LA_LD_2015 (3) (1).pptx
Aula_4_LN_LA_LD_2015 (3) (1).pptxAula_4_LN_LA_LD_2015 (3) (1).pptx
Aula_4_LN_LA_LD_2015 (3) (1).pptx
 
Obras de referência
Obras de referênciaObras de referência
Obras de referência
 
Elab2010
Elab2010Elab2010
Elab2010
 
Resenha do Artigo Ciéntifico: Implementação, Avaliação e Validação de Algorit...
Resenha do Artigo Ciéntifico: Implementação, Avaliação e Validação de Algorit...Resenha do Artigo Ciéntifico: Implementação, Avaliação e Validação de Algorit...
Resenha do Artigo Ciéntifico: Implementação, Avaliação e Validação de Algorit...
 

Mais de Bruno Sampaio Garrido (20)

Vocabulary ii slide marcelle 2
Vocabulary ii   slide marcelle 2Vocabulary ii   slide marcelle 2
Vocabulary ii slide marcelle 2
 
Vocabulary ii slide marcelle 1
Vocabulary ii   slide marcelle 1Vocabulary ii   slide marcelle 1
Vocabulary ii slide marcelle 1
 
Vocabulary ii slide 2
Vocabulary ii   slide 2Vocabulary ii   slide 2
Vocabulary ii slide 2
 
Vocabulary ii day ii
Vocabulary ii   day iiVocabulary ii   day ii
Vocabulary ii day ii
 
Vocabulary ii day i
Vocabulary ii   day iVocabulary ii   day i
Vocabulary ii day i
 
Vocabulary i
Vocabulary iVocabulary i
Vocabulary i
 
Tradução literária ii
Tradução literária iiTradução literária ii
Tradução literária ii
 
Grammar iii slide 2
Grammar iii   slide 2Grammar iii   slide 2
Grammar iii slide 2
 
Grammar iii slide 1
Grammar iii   slide 1Grammar iii   slide 1
Grammar iii slide 1
 
Grammar ii prepositions and conjunctions
Grammar ii   prepositions and conjunctionsGrammar ii   prepositions and conjunctions
Grammar ii prepositions and conjunctions
 
Grammar ii adverbs and adjectives
Grammar ii   adverbs and adjectivesGrammar ii   adverbs and adjectives
Grammar ii adverbs and adjectives
 
Requisitos do tradutor profissional
Requisitos do tradutor profissionalRequisitos do tradutor profissional
Requisitos do tradutor profissional
 
Terminologia e Tradução
Terminologia e TraduçãoTerminologia e Tradução
Terminologia e Tradução
 
Gestão de Terminologia
Gestão de TerminologiaGestão de Terminologia
Gestão de Terminologia
 
A Identidade da Terminologia
A Identidade da TerminologiaA Identidade da Terminologia
A Identidade da Terminologia
 
Tradumática
TradumáticaTradumática
Tradumática
 
25664
2566425664
25664
 
12706 aula jonh agosto sábado
12706 aula jonh agosto sábado12706 aula jonh agosto sábado
12706 aula jonh agosto sábado
 
12044
1204412044
12044
 
4196
41964196
4196
 

Linguística de Corpus, Terminologia e Tradução

  • 1. UGF – Profa. Ms. Simone Vieira Resende
  • 2.  Linguística de corpus (ou córpus) é uma área da Linguística que se ocupa da coleta e análise de corpus, que é um conjunto de dados linguísticos.  A LC surgiu com a necessidade que estudiosos da língua sentiram de se apoiar em usos reais para fazerem generalizações ou esboçarem teorias a respeito do funcionamento linguístico.  Atualmente, a LC está intimamente ligada ao uso do computador, visto que os corpora/córpora (plural de corpus) são eletrônicos.  O corpus deve ser constituído de dados autênticos (não inventados), legíveis por computador e representativos de uma língua ou variedade da língua da qual se deseja estudar.
  • 3.  As ferramentas computacionais mais comuns são:  Programas para listar palavras - fazem a contagem das palavras em um corpus;  Concordanciadores - programas que permitem que o usuário procure por palavras específicas em um corpus, fornecendo exaustivas listas para as ocorrências da palavra em contexto;  Etiquetadores - fazem análises automáticas do corpus e inserem etiquetas (códigos) de ordem  morfossintática, sintática, semântica oudiscursiva.
  • 4.  É fato que o fazer terminológico é laborioso, principalmente se dependermos da nossa atenção para observarmos a recorrência de certas combinações.  O que geralmente ocorre é que, ao notarmos uma combinação que já vimos antes, não nos lembramos de onde a vimos, e provavelmente não somos capazes de localizá-la novamente se quisermos, por exemplo, compilar uma lista de espressões consagradas ou montar um glossário.
  • 5.  Com o advento do computador, tornou-se possível construir grandes bancos de textos e consultá-los com ferramentas computacionais apropriadas para detectar essas ocorrências, co-ocorrências e recorrências.  A LC oferece uma metodologia que veio facilitar muito a identificação das unidades convencionais de uma língua, assim como os termos técnicos de uma área de especialidade.
  • 6.  Os corpus eletronicos nos permitem notar as ocorrências das unidades fixas.  Para a LC, um corpus é uma coletânea de textos  Um exemplo de aplicação: o Vocabulário para Culinária SBS (série 1001 Termos)  Glossário de Gastronomia da Disal
  • 7.  Slide baseado no item 2 da bibliografia comentada.  Corpara e Ensino de tradução  Linguística de Corpus  Exemplo do artigo: elaboração de um glossário técnico com base em corpus.
  • 8.
  • 9.  Conhecer palavras da área de pesquisa: sementes.  Fazer uma limpeza do corpus.  Fotos – figuras – tabelas
  • 10.  Corpus comparável: conteúdo similar nas duas línguas.  Número de palavras (texto jurídico)  Número de textos
  • 11.  Extrair os termos, colocações e fraseologias.  3 etapas:  Gera-se uma lista de palavras mais frequentes no corpus.  Compara-se com outra de um corpus mais geral, ou seja, não específico do tema investigado, para identificar as palavras peculiares, essas seriam as candidatas.  Finalmente produzem-se as listas de concordância para validar as candidatas.  A frequência leva à identificação de padrões fraseológicos (colocações).
  • 12.
  • 13.  A identificação é feita pela observação dos termos e suas colocações.  Exemplo da pimenta / gol contra / fazer cera  A quinta e última etapa seria a compilação de um glossário.
  • 14.  Links sobre pesquisa com corpora.  http://www2.lael.pucsp.br/corpora/  http://www2.lael.pucsp.br/corpora/bp/conc/  http://www2.lael.pucsp.br/corpora/bricle/  http://www.corpusdoportugues.org/  http://www.termium.com/ (Canadense)  http://www.geterm.ufscar.br/ (blog sobre terminologia)  http://www.geltra.ibilce.unesp.br/grupo.php (GELTRA)  http://www6.ufrgs.br/termisul/ (UFRGS)  http://www6.ufrgs.br/textquim/ (TextQuim)  http://www.fflch.usp.br/citrat/citrat.htm (CITRAT)  http://www.nilc.icmc.usp.br/nilc/tools/pagina-visualtca/visualtca/tca.htm# (VISUAL TCA frases)  http://www.nilc.icmc.usp.br/nilc/index.html  http://www2.lael.pucsp.br/corpora/index.htm  http://corpus.byu.edu/bnc/  http://corpus.byu.edu/coca/  http://www.linguateca.pt/  http://www.linguateca.pt/COMPARA/  http://www.nilc.icmc.usp.br/nilc/tools/visuallihla/lihla.htm (VISUAL TCA - palavras)  http://www.termcat.cat/es (Centro de Terminologia em Catalão)  http://www.corpusdelespanol.org/  www.webcorp.org.uk  http://davies-linguistics.byu.edu/  http://www.natcorp.ox.ac.uk/

Notas do Editor

  1. Um corpus é um conjunto de textos. Pode ser escrito ou oral, representa o uso que se faz de uma língua, assume a forma eletrônica.