Aplicação do processo KDD nos Livros da Amazon.com
1. Mineração de Dados
Projeto de Aplicação
AMAZON BOOKS
Osvaldo Matos Júnior
UFMG
2. AMAZON BOOKS
• Construção: Amazon Web Services (AWS)
• 6.314.312 livros coletados em 47 categorias
• Objetivo: Classificação Textual
• Seleção de Atributos: Ganho de Informação
• Regras de Associação: Apriori
3. ATRIBUTOS
Título Autores Editorial
ISBN Edição Editora
Categoria Dimensões Número de Págians
Ranking de
Data de Publicação Preço
Venda
Revisões de
Nota do usuário Livros relacionados
usuários
7. SELEÇÃO DE ATRIBUTOS
Experimento Instâncias Atributos Acurácia
Sem seleção 10.000 38.579 50,87%
Ganho de
10.000 3.857 50,98%
Informação
Classificação textual no Weka com SVM Linear
8. REGRAS DE ASSOCIAÇÃO
• Apriori: atributos nominais
• Discretização:
• Nota do usuário = {pessimo, ruim, medio, bom, otimo}
• Revisões de usuários = {nenhum, pouco, muito}
• Ranking de venda = {pouco, razoavel, muito}