2. Data Mining
• “Mineração de dados é a exploração e análise de
dados, por meios automáticos ou semiautomáticos, em
grandes quantidades de dados, com o objetivo de
descobrir regras ou padrões interessantes.”
Michael J. A. Berry; Gordon Linoff, “Data Mining Techiques for Marketing, Sales, and customer
Support”; John Wiley & Sons, Inc., 1997.
3. Data Mining
Bancos de Dados
Limpeza (consistência, preenchimento de
informações, remoção de ruído e
redundâncias)
(Data Marts e Data Warehouses)
Um analista refina e conduz o processo até
que valiosos padrões apareçam.
11. Algoritmos Genéticos
Algoritmos Genéticos
“Quanto melhor um indivíduo se adaptar ao seu
meio ambiente, maior será sua chance de
sobreviver e gerar descendentes.”
(DARWIN, 1859)
12. Algoritmos Genéticos
Algoritmos Genéticos – O que são?
Os Algoritmos Genéticos são uma classe de
procedimentos, com passos distintos bem
definidos.
Essa classe se fundamenta em analogias a
conceitos biológicos já testadas à exaustão.
Cada passo distinto pode ter diversas versões
diferentes.
13. Algoritmos Genéticos
Algoritmos Genéticos – Para que
servem?
Busca e Otimização
Amplamente utilizados, com sucesso, em
problemas de difícil manipulação pelas técnicas
tradicionais
Eficiência X Flexibilidade
14. Algoritmos Genéticos
Algoritmos Genéticos –
Funcionamento Fundamental
1. Gerar População Inicial
2. Descartar uma parte dos Indivíduos menos
aptos
3. Aplicar operadores de reprodução
4. Aplicar operadores de mutação
5. Se o critério de parada foi satisfeito, encerrar.
Senão, voltar ao passo 2.
15. Algoritmos Genéticos
Algoritmos Genéticos - Desvantagens
Desvantagens:
Larga super produção de indivíduos;
Envolve enorme quantidade de energia e tempo;
Todo o processo parece ter pouco propósito, pois
que o melhoramento das espécies depende do fator
sorte
16. Algoritmos Genéticos
Algoritmos Genéticos - Vantagens
Vantagens:
Solidez e paralelismo inerente (o processo não fica
preso em um local nem fica retido em soluções
genéricas)
17. Algoritmos Genéticos
Algoritmos Genéticos – Aplicação
Alocação de tarefas
Configuração de sistemas complexos
Seleção de Rotas
Problemas de Otimização e de Aprendizagem de
Máquina
Problemas cuja solução seja um estado final e não
um caminho
18. Data Mining
Conclusão
Data mininig é um processo que
permite
compreender o comportamento dos dados
Pode ser bem aplicado em diversas áreas de
negócios
Para que a mineração de dados seja bem sucedida
é preciso, uma busca apropriada, analise e
preparação dos dados encontrados
19. Exemplos
Empresas de software para Data mining:
SAS http://www.sas.com
Information Havesting http://www.convex.com
Red Brick http://www.redbrick.com
Oracle http://www.oracle.com
Sybase http://www.sybase.com
Informix http://www.informix.com
IBM http://www.ibm.com
20. Data Mining
Ferramentas para Data Mining
Os softwares para data mining custam muito
caro (uma licença single-user pode custar
mais de 40.000 dólares).
Leia mais em: Data Mining – Novos Recursos nos Sistemas de Banco de Dados
http://www.devmedia.com.br/data-mining-novos-recursos-nos-sistemas-de-banco-de-
dados/5892#ixzz2Baq5JZfy
21. Referências
Referências
Michael J. A. Berry; Gordon Linoff, “Data Mining Techiques for
Marketing, Sales, and customer Support”; John Wiley & Sons, Inc., 1997
http://www-pcc.qub.ac.uk/tec/courses/datamining
http://www.santafe.edu/~kurt
http://www.devmedia.com.br/data-mining-novos-recursos-nos-sistemas-
de-banco-de-dados/5892#ixzz2Baq5JZfy
http://www.infoescola.com/informatica/data-mining/
http://amigonerd.net/trabalho/19327-data-mining
http://www.mackenzie.br/7589.html