Linguística de Corpus, Terminologia e Tradução

2.933 visualizações

Publicada em

0 comentários
5 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

Sem downloads
Visualizações
Visualizações totais
2.933
No SlideShare
0
A partir de incorporações
0
Número de incorporações
3
Ações
Compartilhamentos
0
Downloads
89
Comentários
0
Gostaram
5
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide
  • Um corpus é um conjunto de textos. Pode ser escrito ou oral, representa o uso que se faz de uma língua, assume a forma eletrônica.
  • Linguística de Corpus, Terminologia e Tradução

    1. 1. UGF – Profa. Ms. Simone Vieira Resende
    2. 2.  Linguística de corpus (ou córpus) é uma área da Linguística que se ocupa da coleta e análise de corpus, que é um conjunto de dados linguísticos.  A LC surgiu com a necessidade que estudiosos da língua sentiram de se apoiar em usos reais para fazerem generalizações ou esboçarem teorias a respeito do funcionamento linguístico.  Atualmente, a LC está intimamente ligada ao uso do computador, visto que os corpora/córpora (plural de corpus) são eletrônicos.  O corpus deve ser constituído de dados autênticos (não inventados), legíveis por computador e representativos de uma língua ou variedade da língua da qual se deseja estudar.
    3. 3.  As ferramentas computacionais mais comuns são:  Programas para listar palavras - fazem a contagem das palavras em um corpus;  Concordanciadores - programas que permitem que o usuário procure por palavras específicas em um corpus, fornecendo exaustivas listas para as ocorrências da palavra em contexto;  Etiquetadores - fazem análises automáticas do corpus e inserem etiquetas (códigos) de ordem  morfossintática, sintática, semântica oudiscursiva.
    4. 4.  É fato que o fazer terminológico é laborioso, principalmente se dependermos da nossa atenção para observarmos a recorrência de certas combinações.  O que geralmente ocorre é que, ao notarmos uma combinação que já vimos antes, não nos lembramos de onde a vimos, e provavelmente não somos capazes de localizá-la novamente se quisermos, por exemplo, compilar uma lista de espressões consagradas ou montar um glossário.
    5. 5.  Com o advento do computador, tornou-se possível construir grandes bancos de textos e consultá-los com ferramentas computacionais apropriadas para detectar essas ocorrências, co-ocorrências e recorrências.  A LC oferece uma metodologia que veio facilitar muito a identificação das unidades convencionais de uma língua, assim como os termos técnicos de uma área de especialidade.
    6. 6.  Os corpus eletronicos nos permitem notar as ocorrências das unidades fixas.  Para a LC, um corpus é uma coletânea de textos  Um exemplo de aplicação: o Vocabulário para Culinária SBS (série 1001 Termos)  Glossário de Gastronomia da Disal
    7. 7.  Slide baseado no item 2 da bibliografia comentada.  Corpara e Ensino de tradução  Linguística de Corpus  Exemplo do artigo: elaboração de um glossário técnico com base em corpus.
    8. 8.  Conhecer palavras da área de pesquisa: sementes.  Fazer uma limpeza do corpus.  Fotos – figuras – tabelas
    9. 9.  Corpus comparável: conteúdo similar nas duas línguas.  Número de palavras (texto jurídico)  Número de textos
    10. 10.  Extrair os termos, colocações e fraseologias.  3 etapas:  Gera-se uma lista de palavras mais frequentes no corpus.  Compara-se com outra de um corpus mais geral, ou seja, não específico do tema investigado, para identificar as palavras peculiares, essas seriam as candidatas.  Finalmente produzem-se as listas de concordância para validar as candidatas.  A frequência leva à identificação de padrões fraseológicos (colocações).
    11. 11.  A identificação é feita pela observação dos termos e suas colocações.  Exemplo da pimenta / gol contra / fazer cera  A quinta e última etapa seria a compilação de um glossário.
    12. 12.  Links sobre pesquisa com corpora.  http://www2.lael.pucsp.br/corpora/  http://www2.lael.pucsp.br/corpora/bp/conc/  http://www2.lael.pucsp.br/corpora/bricle/  http://www.corpusdoportugues.org/  http://www.termium.com/ (Canadense)  http://www.geterm.ufscar.br/ (blog sobre terminologia)  http://www.geltra.ibilce.unesp.br/grupo.php (GELTRA)  http://www6.ufrgs.br/termisul/ (UFRGS)  http://www6.ufrgs.br/textquim/ (TextQuim)  http://www.fflch.usp.br/citrat/citrat.htm (CITRAT)  http://www.nilc.icmc.usp.br/nilc/tools/pagina-visualtca/visualtca/tca.htm# (VISUAL TCA frases)  http://www.nilc.icmc.usp.br/nilc/index.html  http://www2.lael.pucsp.br/corpora/index.htm  http://corpus.byu.edu/bnc/  http://corpus.byu.edu/coca/  http://www.linguateca.pt/  http://www.linguateca.pt/COMPARA/  http://www.nilc.icmc.usp.br/nilc/tools/visuallihla/lihla.htm (VISUAL TCA - palavras)  http://www.termcat.cat/es (Centro de Terminologia em Catalão)  http://www.corpusdelespanol.org/  www.webcorp.org.uk  http://davies-linguistics.byu.edu/  http://www.natcorp.ox.ac.uk/

    ×