[1] A apresentação discute a compreensão de linguagem natural e o uso de bases de conhecimento semânticas para extrair informações de texto. [2] Ela descreve os projetos do Insight Centre for Data Analytics em detecção de tópicos, opinião e emoções em textos e o mapeamento desses conceitos em bases de dados semânticas. [3] A apresentação também aborda os desafios da heterogeneidade semântica entre bases de dados e da análise de múltiplos idiomas.
Compreensão de Linguagem Natural no Insight: Construindo a Ponte entre Texto e Base de Dados Semântica
1. COMPREENSÃO DE LINGUAGEM
NATURAL NO INSIGHT
Construindo a Ponte entre Texto e Base
de Dados Semântica.
Bianca Pereira
Primeiro Encontro em Computação Semântica
2. Quem sou eu?
• Insight Centre for Data Analytics
• National University of Ireland,
Galway
• Aluna de PhD em “Entity Linking
with Multiple Knowledge Bases”
5. • Sobre o que as pessoas estão falando?
• Qual a opinião delas?
• Que tipo de emoção está sendo expressa?
I like apple and
banana for
breakfast.
Haha! I prefer my
Apple and the
newspaper
11. Detecção de Opinião
Desejo, sugestão, conselho, requisição, possibilidade,
necessidade ou ação que ainda não ocorreu.
Fonte: http://nlp.insight-centre.org/wp-
content/uploads/2014/05/PhDdaySapnaApril2014.pdf
16. • Qual o conteúdo da Base de Conhecimento?
• Como lidar com múltiplos idiomas?
17. Sumarização
Base Descrição Top Entradas
DBpedia Enciclopédia
Contém informações sobre ciência,
tecnologia, matemática, história..
:history, :structure
outbreakdatabase Provê sumários de eventos de surtos de
problemas relacionados a comida e água
:outbreak, :illness
… … …
Adaptado de http://nlp.insight-centre.org/wp-
content/uploads/2014/12/AndrejsPhD-Day-presentation-.pdf
23. Desafios
• Heterogeneidade Semântica nas Bases de
Conhecimento.
• Múltiplos Idiomas.
• Idiomas com poucos recursos linguísticos.
• Geração e Uso de Recursos Linguísticos em
Formato de Dados Ligados.
• Visualização de Informação.