UNIVERSIDADE FEDERAL DO PARÁ
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
Daiara Barbosa Furtado
Gleyciane Barroso de Freitas
Jéssica Luzia Gonçalves Martins
Leandra Darlian Miranda da Silva
Laciene Alves Melo
Algoritmo de Árvore de Decisão para Prever
uma Base de Dados de Monitoramento Iot
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
AGENDA
1.
2. Objetivos: Geral e Específico
3. Metodologia
4.
5.
Introdução
Resultados
4.
Considerações Finais
5.
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
INTRODUÇÃO
 Analise de uma base de dados oriunda de
sensores que coletam as condições do
ambiente.
 Os sensores são monitorados por serviços de
internet das coisas (IoT).
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
OBJETIVOS
 Geral :
 Procurar soluções baseadas em IA, por meio do
algoritmo de Árvore de Decisão para uma
análise exata em relação a classificação.
4
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
OBJETIVOS
 Específicos :
 Fazer o levantamento de uma base de dados
através de sensores de monitoramento do
ambiente IoT.
 Desenvolver e implementar soluções baseadas em
aprendizagem de máquina (Árvore de Decisão) a
fim de verificar padrões.
 Possibilitar com a IoT o compartilhamento de
informações do mundo real para o virtual.
 Analisar os resultados obtidos do processo.
5
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
6
Figura 1. Conjectura do Primeiro Cenário de Medição.
 Cenário de Aplicação:
 Foram selecionados os prédios e as áreas verdes
do Campus da UFPA, para monitorar os dados
ambientais em áreas de concreto e arborizadas.
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
7
Figura 2. Arquitetura de Software Implementada.
 Arquitetura do Sistema – Protótipo.
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
8
 Google Colaboratory:
 Permite a escrita de código Python usando o
navegador.
 Compartilhamento fácil, Acesso Gratuito a GPUs,
e não há necessidade de configurar a
ferramenta.
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
9
 Aquisição de Dados:
 A coleta dos dados deu-se através de um IoT
Agent.
 Os dados coletados pelos sensores foram
armazenados no banco de dados interno da
Dojot.
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
 Pré-processamentos de Dados:
 Exploração de dados: para tratar a base de dados
exportada utilizou-se o método de exploração.
10
Figura 3. Exploração de Dados.
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
 Pré-processamentos de Dados:
 Eliminação Manual de Atributos:
11
Figura 4. Conjunto de atributos eliminados. (a) Execução da função drop. (b) Dados após a
Avaliação. (c) Contagem de Registros Vazios.
(a)
(b)
(c)
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
 Pré-processamentos de Dados:
 Classificação dos Dados:
12
Figura 5. Classificação dos Dados.
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
 Pré-processamentos de Dados:
 Treinamento e Teste Utilizando Árvore de
Decisão:
13
Figura 6. Separação das Amostras de Treino e Teste.
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
 Pré-processamentos de Dados:
 Construção da árvore de decisão:
14
𝐼𝐻 = − 𝑃 ⅈ ∕ 𝑡 𝑙𝑜𝑔2 𝑃 ⅈ ∕ 𝑡
𝐶
𝑙=1
 Métrica de Entropia (IH): Usada para descobrir o
Split-point da árvore de decisão, determinando a
aleatoriedade (impureza) de uma variável.
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
 Pré-processamentos de Dados:
 Treinamento e Teste Utilizando Árvore de
Decisão:
15
Figura 7. Parâmetros de Definição da Árvore.
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
RESULTADOS
16
 Plotagem da Árvore de Decisão:
 Processo de treinamento: aplicou-se o algoritmo de
IA para árvore de decisão de variável categórica
com aprendizagem supervisionada.
 Critério de segregação: luminosidade, temperatura
e umidade.
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
RESULTADOS
 Plotagem da Árvore de Decisão:
17
Figura 8. Árvore de Decisão de Variável Categórica.
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
RESULTADOS
18
 Comparação Entre Amostras de Treino e Teste :
 Função predict do python: foi aplicada no
modelo de dados, para prever as saídas de
treino (pred_train) e teste (pred_test).
Figura 9. Predição para Treino e Teste.
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
RESULTADOS
19
 Comparação Entre Amostras de Treino e teste :
 Relatório de Classificação:
Figura 10. Comparação de Amostras. (a) Relatório de Teste. (b) Relatório de Treino.
(a)
(b)
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
RESULTADOS
20
 Matriz de Confusão: expõe a frequência de classificação
para cada modelo.
 Levando em consideração as seguintes frequências:
 Verdadeiro positivo (TP)
 Falso positivo (FP)
 Falso verdadeiro (TN)
 Falso negativo (FN)
Figura 11. Matriz de Confusão.
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
CONCLUSÃO
 Através de treinamento e teste, verificou que a
Árvore de decisão foi um método adequado para o
problema proposto, predizendo as saídas com uma
taxa acima de 95%.
 Para trabalhos futuros pretende-se realizar teste
mais aprofundados para Árvore de decisão.
21
UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
REFERÊNCIAS
 Camilo, C. O., Silva, J. C. (2009). Mineração de Dados:
Conceitos, Tarefas, Métodos e Ferramentas. Relatório
Técnico. Instituto de Informática Universidade Federal de
Goiás.
 Pinto, K. S. et al. (2020) “Um Estudo de Caso de Internet das
Coisas Utilizando o Ecossistema Dojot: Da Configuração a
Utilização”, Conferência Nacional em Comunicações, Redes e
Segurança da Informação, X Edição, p. 95.
 Rajput, RAJPUT, Shubhangini; SINGH, Surya Prakash.
Identifying Industry 4.0 IoT enablers by integrated PCA-ISM-
DEMATEL approach. Management Decision, [s.l.], v. 57, n. 8,
p.1784-1817, 12 set. 2019.
22
UNIVERSIDADE FEDERAL DO PARÁ
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
OBRIGADA
Perguntas?

trabalho2_IA_algoritmo-de-arvore-de-decisao.pptx

  • 1.
    UNIVERSIDADE FEDERAL DOPARÁ CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ Daiara Barbosa Furtado Gleyciane Barroso de Freitas Jéssica Luzia Gonçalves Martins Leandra Darlian Miranda da Silva Laciene Alves Melo Algoritmo de Árvore de Decisão para Prever uma Base de Dados de Monitoramento Iot
  • 2.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ AGENDA 1. 2. Objetivos: Geral e Específico 3. Metodologia 4. 5. Introdução Resultados 4. Considerações Finais 5.
  • 3.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ INTRODUÇÃO  Analise de uma base de dados oriunda de sensores que coletam as condições do ambiente.  Os sensores são monitorados por serviços de internet das coisas (IoT).
  • 4.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ OBJETIVOS  Geral :  Procurar soluções baseadas em IA, por meio do algoritmo de Árvore de Decisão para uma análise exata em relação a classificação. 4
  • 5.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ OBJETIVOS  Específicos :  Fazer o levantamento de uma base de dados através de sensores de monitoramento do ambiente IoT.  Desenvolver e implementar soluções baseadas em aprendizagem de máquina (Árvore de Decisão) a fim de verificar padrões.  Possibilitar com a IoT o compartilhamento de informações do mundo real para o virtual.  Analisar os resultados obtidos do processo. 5
  • 6.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ METODOLOGIA 6 Figura 1. Conjectura do Primeiro Cenário de Medição.  Cenário de Aplicação:  Foram selecionados os prédios e as áreas verdes do Campus da UFPA, para monitorar os dados ambientais em áreas de concreto e arborizadas.
  • 7.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ METODOLOGIA 7 Figura 2. Arquitetura de Software Implementada.  Arquitetura do Sistema – Protótipo.
  • 8.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ METODOLOGIA 8  Google Colaboratory:  Permite a escrita de código Python usando o navegador.  Compartilhamento fácil, Acesso Gratuito a GPUs, e não há necessidade de configurar a ferramenta.
  • 9.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ METODOLOGIA 9  Aquisição de Dados:  A coleta dos dados deu-se através de um IoT Agent.  Os dados coletados pelos sensores foram armazenados no banco de dados interno da Dojot.
  • 10.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ METODOLOGIA  Pré-processamentos de Dados:  Exploração de dados: para tratar a base de dados exportada utilizou-se o método de exploração. 10 Figura 3. Exploração de Dados.
  • 11.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ METODOLOGIA  Pré-processamentos de Dados:  Eliminação Manual de Atributos: 11 Figura 4. Conjunto de atributos eliminados. (a) Execução da função drop. (b) Dados após a Avaliação. (c) Contagem de Registros Vazios. (a) (b) (c)
  • 12.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ METODOLOGIA  Pré-processamentos de Dados:  Classificação dos Dados: 12 Figura 5. Classificação dos Dados.
  • 13.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ METODOLOGIA  Pré-processamentos de Dados:  Treinamento e Teste Utilizando Árvore de Decisão: 13 Figura 6. Separação das Amostras de Treino e Teste.
  • 14.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ METODOLOGIA  Pré-processamentos de Dados:  Construção da árvore de decisão: 14 𝐼𝐻 = − 𝑃 ⅈ ∕ 𝑡 𝑙𝑜𝑔2 𝑃 ⅈ ∕ 𝑡 𝐶 𝑙=1  Métrica de Entropia (IH): Usada para descobrir o Split-point da árvore de decisão, determinando a aleatoriedade (impureza) de uma variável.
  • 15.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ METODOLOGIA  Pré-processamentos de Dados:  Treinamento e Teste Utilizando Árvore de Decisão: 15 Figura 7. Parâmetros de Definição da Árvore.
  • 16.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ RESULTADOS 16  Plotagem da Árvore de Decisão:  Processo de treinamento: aplicou-se o algoritmo de IA para árvore de decisão de variável categórica com aprendizagem supervisionada.  Critério de segregação: luminosidade, temperatura e umidade.
  • 17.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ RESULTADOS  Plotagem da Árvore de Decisão: 17 Figura 8. Árvore de Decisão de Variável Categórica.
  • 18.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ RESULTADOS 18  Comparação Entre Amostras de Treino e Teste :  Função predict do python: foi aplicada no modelo de dados, para prever as saídas de treino (pred_train) e teste (pred_test). Figura 9. Predição para Treino e Teste.
  • 19.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ RESULTADOS 19  Comparação Entre Amostras de Treino e teste :  Relatório de Classificação: Figura 10. Comparação de Amostras. (a) Relatório de Teste. (b) Relatório de Treino. (a) (b)
  • 20.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ RESULTADOS 20  Matriz de Confusão: expõe a frequência de classificação para cada modelo.  Levando em consideração as seguintes frequências:  Verdadeiro positivo (TP)  Falso positivo (FP)  Falso verdadeiro (TN)  Falso negativo (FN) Figura 11. Matriz de Confusão.
  • 21.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ CONCLUSÃO  Através de treinamento e teste, verificou que a Árvore de decisão foi um método adequado para o problema proposto, predizendo as saídas com uma taxa acima de 95%.  Para trabalhos futuros pretende-se realizar teste mais aprofundados para Árvore de decisão. 21
  • 22.
    UFPA CAMPUS UNIVERSITÁRIO DOTOCANTINS/CAMETÁ REFERÊNCIAS  Camilo, C. O., Silva, J. C. (2009). Mineração de Dados: Conceitos, Tarefas, Métodos e Ferramentas. Relatório Técnico. Instituto de Informática Universidade Federal de Goiás.  Pinto, K. S. et al. (2020) “Um Estudo de Caso de Internet das Coisas Utilizando o Ecossistema Dojot: Da Configuração a Utilização”, Conferência Nacional em Comunicações, Redes e Segurança da Informação, X Edição, p. 95.  Rajput, RAJPUT, Shubhangini; SINGH, Surya Prakash. Identifying Industry 4.0 IoT enablers by integrated PCA-ISM- DEMATEL approach. Management Decision, [s.l.], v. 57, n. 8, p.1784-1817, 12 set. 2019. 22
  • 23.
    UNIVERSIDADE FEDERAL DOPARÁ CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ OBRIGADA Perguntas?

Notas do Editor

  • #2 Preletora: Gleyce
  • #7 #Tópico 1: Por definição, A RNA baseia-se nos neurônios do cérebro humano. #Tópico 2: Resolve problemas complexos que envolvem o reconhecimento de padrões. Preletora: Laciene
  • #8 #Tópico 1: Por definição, A RNA baseia-se nos neurônios do cérebro humano. #Tópico 2: Resolve problemas complexos que envolvem o reconhecimento de padrões. Preletora: Laciene
  • #9 #Tópico 1: Por definição, A RNA baseia-se nos neurônios do cérebro humano. #Tópico 2: Resolve problemas complexos que envolvem o reconhecimento de padrões. Preletora: Laciene
  • #10 #Tópico 1: Por definição, A RNA baseia-se nos neurônios do cérebro humano. #Tópico 2: Resolve problemas complexos que envolvem o reconhecimento de padrões. Preletora: Laciene
  • #11 #Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação: dois multiplicado pelo número de pontos da rota mais um Preletora: Laciene
  • #12 #Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação: dois multiplicado pelo número de pontos da rota mais um Preletora: Laciene
  • #13 #Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação: dois multiplicado pelo número de pontos da rota mais um Preletora: Laciene
  • #14 #Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação: dois multiplicado pelo número de pontos da rota mais um Preletora: Laciene
  • #15 #Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação: dois multiplicado pelo número de pontos da rota mais um Preletora: Laciene
  • #16 #Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação: dois multiplicado pelo número de pontos da rota mais um Preletora: Laciene
  • #17 #Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação: dois multiplicado pelo número de pontos da rota mais um Preletora: Laciene
  • #18 #Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação: dois multiplicado pelo número de pontos da rota mais um Preletora: Laciene
  • #19 #Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação: dois multiplicado pelo número de pontos da rota mais um Preletora: Laciene
  • #20 #Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação: dois multiplicado pelo número de pontos da rota mais um Preletora: Laciene
  • #21 #Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação: dois multiplicado pelo número de pontos da rota mais um Preletora: Laciene
  • #22 Preletora: Gleyce
  • #23 Preletora: Gleyce