Este documento descreve um projeto de indexação de documentos usando Apache Solr. O objetivo era criar um algoritmo de indexação em Java para indexar o Europarl Corpus. As tecnologias utilizadas incluem Java, Netbeans, Apache Solr, HTML5, JavaScript e SolrAjax. O documento explica a configuração do esquema Solr e apresenta estatísticas e screenshots da aplicação cliente desenvolvida.
Armazenamento, Indexação e Recuperação de Informação
1. Trabalho Prático 3
Armazenamento, Indexação e
Recuperação de informação - MSI - UA
Autores:
Emanuel Pires (77994)
Mário Monteiro (77910)
2. Objetivo
Criar um algoritmo de indexação em java utilizando o Apache Solr e o SolrJ
API para indexar o Europarl Corpus usado nos primeiros trabalhos.
3. Tecnologias e Recursos
Tecnologia Java - Orientado a o Objetos
IDE Netbeans
Computador de desenvolvimento e teste:
Processador Intel Core i7, 3.30 GHz
4 GB de memória RAM
Apache Solr (http://lucene.apache.org/solr/)
Jquery & JavaScript, HTML5, SolrAjax