Data Mining
Autores
Breno Fernandes
(Bren0_fernandes@hotmail.com)
Fabio Pereira
(fabioeletrotec@hotmail.com)

Natal, 14/10/2013

1
Universidade Federal do Rio Grande do Norte (UFRN)
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
Roteiro
•Introdução
•Desenvolvimento
•Conceito.
•Comparações.
•Benefícios.
•Limitações.
•Aplicações.

•Conclusão
•Referência

•Aspectos do projeto.
Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

2
Introdução
•Princípio: Possuir dados, não é o suficiente, é preciso saber
utilizá-los.
•Os sistemas computacionais iniciaram a era da informação – a
informação é composta por dados.
•A manipulação eficiente de dados, auxilia na tomada de
decisões mais rápidas.
•Na década de 80, surge o conceito de mineração de dados.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

3
Conceito
•O que é Data Mining?

•Em que se baseia?
•Por que se usar?

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

4
Conceito
• Utiliza as seguintes técnicas:
– Classificação.
– Regressão.
– Clustering.
– Regras de associação.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

5
Conceitos
• Classificação:
– Construção de um modelo de dados através de uma curva de
aprendizado e valores de atributos classificadores que
permitem determinar novas classes de dados.
Job
Engineer

Carpenter

Income
<30K

Bad

>50K

Good

Income
<40K

Bad

>90K

Good

Doctor

Income
>100K

<50K

Bad

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

Good

6
Conceitos

• Clustering
– Através dessa ferramenta podemos separar em dois grupos
todas os nossos dados, o primeiro grupo é composto daqueles
que são similares entre sim(alocamos no mesmo cluster) e os
que não são similares(alocados em outro cluster).

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

7
Conceitos

• Regressão
– Através de uma gama de dados podemos traçar uma função de
aprendizado que mapeia de forma os nosso dados.
– A partir desses dados podemos traçar a melhor curva que
representa essa função.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

8
Conceitos
• Regras de associação.
– Através da analise do nosso banco de dados encontra padrões
frequentes e correlações podemos definir regras que regem o
acesso aos dados presentes no nosso banco.
– Cria regras que descrevem como eventos diferentes ocorrem
dependentes do outro.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

9
Comparação entre modelos
• Sistema de gerenciamento de banco de dados – SGBD
- Tem como função organizar e manipular os dados.
- Utiliza apenas palavras chave para encontrar os dados desejados.
- Retorna todos os resultados possíveis.

• Data Warehouse
- Trata grandes volumes de dados.
- Normalmente aplicado a sistemas transacionais.
- Devido ao tipo de sistema de aplicação , trabalha com bancos estáticos.

• Data Mining
- Trata grandes volumes de dados.
- Trabalha com bancos dinâmicos.
- Tem como função desconsiderar padrões específicos para conseguir criar
padrões genéricos.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

10
Benefícios
• Necessidade acessar informação da ordem de Peta.
• Permite atribuir informação a um conjunto de dados existente.
• Conjuntos de informações antigas podem ser utilizadas para gerar
novos dados.
• Através do Data Mining as empresas podem prestar serviços com
maior qualidade e direcionamento aos seus clientes.
• Não possui limitação de aplicação, partindo desde o mundo de
P&D até aplicações em mercado, industria e saúde.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

11
Limitações
• Necessita de parâmetros-guia adequados.
– Caso contrário, o processo se torna lento.

• Necessita de um banco de dados altamente confiável.
– Sem redundâncias

• Custo para implementação é relativamente alto.
– Devido ao custo das ferramentas utilizadas na mineração.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

12
Aplicações

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

13
Conclusão
• A quantidade de dados só tende a crescer com o surgimento de
novas tecnologias.

• Cada vez mais será necessário a presença de ferramentas
como o Data Mining.
• Em telecomunicações não será diferente visto a presença de
sistemas smarts, estes que exigem uma grande carga de
metadados.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

14
Bibliografia
• Camilo, Cássio O.; Silva, João C.; Mineração de dados:
conceitos, tarefas, métodos e ferramentas. UFG, 2009.
• Cardoso,Olinda N. P.; Machado, RosaT. M. Gestão do
conhecimento usando Data Mining. FGV,2007.
• Cortês, Sérgio C.; Porcaro, Rosa M.; Lifschitz, Sérgio. Mineração
de dados. PUC-Rio, 2002.
• Goldschimidt, Ronaldo; Passos, Emmanuel. Data mining: um
guia prático. Ed. Campus.
• Navega, Sérgio. Princípios essenciais do data mining.
Infoimagem, 2002.

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

15
Muito obrigado pela atenção 

Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN

16

Data Mining

  • 1.
    Data Mining Autores Breno Fernandes (Bren0_fernandes@hotmail.com) FabioPereira (fabioeletrotec@hotmail.com) Natal, 14/10/2013 1 Universidade Federal do Rio Grande do Norte (UFRN) Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN
  • 2.
  • 3.
    Introdução •Princípio: Possuir dados,não é o suficiente, é preciso saber utilizá-los. •Os sistemas computacionais iniciaram a era da informação – a informação é composta por dados. •A manipulação eficiente de dados, auxilia na tomada de decisões mais rápidas. •Na década de 80, surge o conceito de mineração de dados. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 3
  • 4.
    Conceito •O que éData Mining? •Em que se baseia? •Por que se usar? Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 4
  • 5.
    Conceito • Utiliza asseguintes técnicas: – Classificação. – Regressão. – Clustering. – Regras de associação. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 5
  • 6.
    Conceitos • Classificação: – Construçãode um modelo de dados através de uma curva de aprendizado e valores de atributos classificadores que permitem determinar novas classes de dados. Job Engineer Carpenter Income <30K Bad >50K Good Income <40K Bad >90K Good Doctor Income >100K <50K Bad Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN Good 6
  • 7.
    Conceitos • Clustering – Atravésdessa ferramenta podemos separar em dois grupos todas os nossos dados, o primeiro grupo é composto daqueles que são similares entre sim(alocamos no mesmo cluster) e os que não são similares(alocados em outro cluster). Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 7
  • 8.
    Conceitos • Regressão – Atravésde uma gama de dados podemos traçar uma função de aprendizado que mapeia de forma os nosso dados. – A partir desses dados podemos traçar a melhor curva que representa essa função. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 8
  • 9.
    Conceitos • Regras deassociação. – Através da analise do nosso banco de dados encontra padrões frequentes e correlações podemos definir regras que regem o acesso aos dados presentes no nosso banco. – Cria regras que descrevem como eventos diferentes ocorrem dependentes do outro. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 9
  • 10.
    Comparação entre modelos •Sistema de gerenciamento de banco de dados – SGBD - Tem como função organizar e manipular os dados. - Utiliza apenas palavras chave para encontrar os dados desejados. - Retorna todos os resultados possíveis. • Data Warehouse - Trata grandes volumes de dados. - Normalmente aplicado a sistemas transacionais. - Devido ao tipo de sistema de aplicação , trabalha com bancos estáticos. • Data Mining - Trata grandes volumes de dados. - Trabalha com bancos dinâmicos. - Tem como função desconsiderar padrões específicos para conseguir criar padrões genéricos. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 10
  • 11.
    Benefícios • Necessidade acessarinformação da ordem de Peta. • Permite atribuir informação a um conjunto de dados existente. • Conjuntos de informações antigas podem ser utilizadas para gerar novos dados. • Através do Data Mining as empresas podem prestar serviços com maior qualidade e direcionamento aos seus clientes. • Não possui limitação de aplicação, partindo desde o mundo de P&D até aplicações em mercado, industria e saúde. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 11
  • 12.
    Limitações • Necessita deparâmetros-guia adequados. – Caso contrário, o processo se torna lento. • Necessita de um banco de dados altamente confiável. – Sem redundâncias • Custo para implementação é relativamente alto. – Devido ao custo das ferramentas utilizadas na mineração. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 12
  • 13.
    Aplicações Departamento de Engenhariade Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 13
  • 14.
    Conclusão • A quantidadede dados só tende a crescer com o surgimento de novas tecnologias. • Cada vez mais será necessário a presença de ferramentas como o Data Mining. • Em telecomunicações não será diferente visto a presença de sistemas smarts, estes que exigem uma grande carga de metadados. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 14
  • 15.
    Bibliografia • Camilo, CássioO.; Silva, João C.; Mineração de dados: conceitos, tarefas, métodos e ferramentas. UFG, 2009. • Cardoso,Olinda N. P.; Machado, RosaT. M. Gestão do conhecimento usando Data Mining. FGV,2007. • Cortês, Sérgio C.; Porcaro, Rosa M.; Lifschitz, Sérgio. Mineração de dados. PUC-Rio, 2002. • Goldschimidt, Ronaldo; Passos, Emmanuel. Data mining: um guia prático. Ed. Campus. • Navega, Sérgio. Princípios essenciais do data mining. Infoimagem, 2002. Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 15
  • 16.
    Muito obrigado pelaatenção  Departamento de Engenharia de Comunicações (DCO) - Curso de Engenharia de Telecomunicações (CETEL) - UFRN 16