O documento descreve um estudo sobre a análise da eficiência da produção de leite em fazendas brasileiras utilizando técnicas de mineração de dados. O estudo usará bases de dados sobre fazendas no Brasil e softwares de seleção de características e classificação para identificar os principais fatores que influenciam a eficiência e classificar as fazendas em grupos de baixa, média ou alta eficiência.
1. II Workshop de Trabalhos de Graduação
e Pós-Graduação do DCC
Análise da Eficiência da Produção de Leite
das Fazendas Brasileiras Utilizando
Mineração de Dados
Renan Marques dos Santos (xxrenan@gmail.com)
Thiago Bellotti Furtado (thiagobellotti@gmail.com)
Custódio Gouvêa Lopes da Motta (custodio.motta@iceçufjf.br)
2. II Workshop de Trabalhos de Graduação
e Pós-Graduação do DCC
Descoberta de conhecimento em bancos
de dados - KDD
• Explorar grandes quantidades de dados à procura
de padrões consistentes.
• Etapas:
– Consolidação dos dados
– Seleção e pré-processamento
– Mineração de dados
– Avaliação e interpretação
3. II Workshop de Trabalhos de Graduação
e Pós-Graduação do DCC
Mineração de dados - DM
• É um conjunto de técnicas e ferramentas usadas para
identificar padrões (conhecimentos) embutidos nos
dados.
• Os padrões extraídos devem ser válidos, novos,
potencialmente úteis e compreensíveis.
• DM é usada principalmente quando a solução
matemática é muito cara ou impossível (exemplo:
problemas relacionados com a natureza).
4. II Workshop de Trabalhos de Graduação
e Pós-Graduação do DCC
Mineração de dados
• Não é uma tecnologia nova, mas sim um campo de
pesquisa multidisciplinar:
Banco de Dados
Data Warehouse
Métodos Estatísticos Arquiteturas Paralelas
Análise Multivariada Grid Computing
Data Mining
Lógica Fuzzy
Visualização de Dados
Redes Neurais
Métodos Qualitativos
Algoritmos Genéticos
Aprendizado de Máquina
Sistemas Especialistas
5. II Workshop de Trabalhos de Graduação
e Pós-Graduação do DCC
O problema da produção de leite nas
fazendas brasileiras
Informações dispersas
Coleta (Embrapa e FGV)
Base de dados
Pesquisas (estatísticas)
MEDIDA DE EFICIÊNCIA
6. II Workshop de Trabalhos de Graduação
e Pós-Graduação do DCC
Proposta de análise de eficiência
Base de dados MEDIDA DE EFICIÊNCIA
Mineração de dados
Avaliação e interpretação
CONHECIMENTO
7. II Workshop de Trabalhos de Graduação
e Pós-Graduação do DCC
Material e Métodos
1. Medida de eficiência e as Bases de dados contendo
todas as fazendas do Brasil e separadas por região e por
raça de gado.
2. Softwares: Feature Selection e Weka.
3. Tarefas de mineração: classificação de dados e seleção
de características.
Objetivos Principais
1. Classificar as fazendas conforme suas produções de
leite sejam de Baixa, Média ou Alta eficiência.
2. Identificar as características que mais influenciam na
eficiência da produção de leite e o grau de influência
de cada uma delas.
8. II Workshop de Trabalhos de Graduação
e Pós-Graduação do DCC
Agora eu tenho o
conhecimento