Armazenamento, Indexação e Recuperação de Informação

Trabalho Prático 3
Armazenamento, Indexação e
Recuperação de informação - MSI - UA
Autores:
Emanuel Pires (77994)
Mário Monteiro (77910)

Objetivo
Criar um algoritmo de indexação em java utilizando o Apache Solr e o SolrJ
API para indexar o Europarl Corpus usado nos primeiros trabalhos.

Tecnologias e Recursos
Tecnologia Java - Orientado a o Objetos
IDE Netbeans
Computador de desenvolvimento e teste:
Processador Intel Core i7, 3.30 GHz
4 GB de memória RAM
Apache Solr (http://lucene.apache.org/solr/)
Jquery & JavaScript, HTML5, SolrAjax

Estatística
Query
Resultado
(Average Precision)
Q1 = {text:imigrantes} 0.33
Q2 = {text:presidente Barroso} 0.68
Q3 = {text:estratégia de lisboa ambiente e
energias renováveise}
0.92
Q4 = {text:quota de pesca} 0.70
Q5 = {text:áreas estratégicas investigação e
desenvolvimento}
0.85
Mean Average Precision 0,70

Configuração do Schema Solr
Configuração dos fields

Configuração do Schema Solr
Configuração dos fields (copyField)

Configuração do Schema Solr (cont…)
Configuração do fieldType

Aplicação Cliente (Página Principal)

Aplicação Cliente (facet por língua)

Aplicação Cliente (did you mean)

Aplicação Cliente (pesquisa por date range)

Considerações
• Todos os requisitos foram cumpridos sem grandes sobre saltos;

Armazenamento, Indexação e Recuperação de Informação

Recomendados

Recomendados

Mais conteúdo relacionado

Destaque

Destaque (19)

Semelhante a Armazenamento, Indexação e Recuperação de Informação

Semelhante a Armazenamento, Indexação e Recuperação de Informação (20)

Mais de Mário Monteiro

Mais de Mário Monteiro (6)

Armazenamento, Indexação e Recuperação de Informação