Este documento descreve um estudo que usa árvores de decisão para prever dados de sensores IoT. Os objetivos foram desenvolver soluções de aprendizado de máquina para analisar padrões nos dados ambientais coletados por sensores no campus universitário e prever as condições com mais de 95% de precisão. Os resultados mostraram que as árvores de decisão foram eficazes para classificar os dados com base em luminosidade, temperatura e umidade.
1. UNIVERSIDADE FEDERAL DO PARÁ
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
Daiara Barbosa Furtado
Gleyciane Barroso de Freitas
Jéssica Luzia Gonçalves Martins
Leandra Darlian Miranda da Silva
Laciene Alves Melo
Algoritmo de Árvore de Decisão para Prever
uma Base de Dados de Monitoramento Iot
2. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
AGENDA
1.
2. Objetivos: Geral e Específico
3. Metodologia
4.
5.
Introdução
Resultados
4.
Considerações Finais
5.
3. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
INTRODUÇÃO
Analise de uma base de dados oriunda de
sensores que coletam as condições do
ambiente.
Os sensores são monitorados por serviços de
internet das coisas (IoT).
4. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
OBJETIVOS
Geral :
Procurar soluções baseadas em IA, por meio do
algoritmo de Árvore de Decisão para uma
análise exata em relação a classificação.
4
5. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
OBJETIVOS
Específicos :
Fazer o levantamento de uma base de dados
através de sensores de monitoramento do
ambiente IoT.
Desenvolver e implementar soluções baseadas em
aprendizagem de máquina (Árvore de Decisão) a
fim de verificar padrões.
Possibilitar com a IoT o compartilhamento de
informações do mundo real para o virtual.
Analisar os resultados obtidos do processo.
5
6. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
6
Figura 1. Conjectura do Primeiro Cenário de Medição.
Cenário de Aplicação:
Foram selecionados os prédios e as áreas verdes
do Campus da UFPA, para monitorar os dados
ambientais em áreas de concreto e arborizadas.
7. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
7
Figura 2. Arquitetura de Software Implementada.
Arquitetura do Sistema – Protótipo.
8. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
8
Google Colaboratory:
Permite a escrita de código Python usando o
navegador.
Compartilhamento fácil, Acesso Gratuito a GPUs,
e não há necessidade de configurar a
ferramenta.
9. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
9
Aquisição de Dados:
A coleta dos dados deu-se através de um IoT
Agent.
Os dados coletados pelos sensores foram
armazenados no banco de dados interno da
Dojot.
10. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
Pré-processamentos de Dados:
Exploração de dados: para tratar a base de dados
exportada utilizou-se o método de exploração.
10
Figura 3. Exploração de Dados.
11. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
Pré-processamentos de Dados:
Eliminação Manual de Atributos:
11
Figura 4. Conjunto de atributos eliminados. (a) Execução da função drop. (b) Dados após a
Avaliação. (c) Contagem de Registros Vazios.
(a)
(b)
(c)
12. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
Pré-processamentos de Dados:
Classificação dos Dados:
12
Figura 5. Classificação dos Dados.
13. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
Pré-processamentos de Dados:
Treinamento e Teste Utilizando Árvore de
Decisão:
13
Figura 6. Separação das Amostras de Treino e Teste.
14. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
Pré-processamentos de Dados:
Construção da árvore de decisão:
14
𝐼𝐻 = − 𝑃 ⅈ ∕ 𝑡 𝑙𝑜𝑔2 𝑃 ⅈ ∕ 𝑡
𝐶
𝑙=1
Métrica de Entropia (IH): Usada para descobrir o
Split-point da árvore de decisão, determinando a
aleatoriedade (impureza) de uma variável.
15. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
METODOLOGIA
Pré-processamentos de Dados:
Treinamento e Teste Utilizando Árvore de
Decisão:
15
Figura 7. Parâmetros de Definição da Árvore.
16. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
RESULTADOS
16
Plotagem da Árvore de Decisão:
Processo de treinamento: aplicou-se o algoritmo de
IA para árvore de decisão de variável categórica
com aprendizagem supervisionada.
Critério de segregação: luminosidade, temperatura
e umidade.
17. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
RESULTADOS
Plotagem da Árvore de Decisão:
17
Figura 8. Árvore de Decisão de Variável Categórica.
18. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
RESULTADOS
18
Comparação Entre Amostras de Treino e Teste :
Função predict do python: foi aplicada no
modelo de dados, para prever as saídas de
treino (pred_train) e teste (pred_test).
Figura 9. Predição para Treino e Teste.
19. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
RESULTADOS
19
Comparação Entre Amostras de Treino e teste :
Relatório de Classificação:
Figura 10. Comparação de Amostras. (a) Relatório de Teste. (b) Relatório de Treino.
(a)
(b)
20. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
RESULTADOS
20
Matriz de Confusão: expõe a frequência de classificação
para cada modelo.
Levando em consideração as seguintes frequências:
Verdadeiro positivo (TP)
Falso positivo (FP)
Falso verdadeiro (TN)
Falso negativo (FN)
Figura 11. Matriz de Confusão.
21. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
CONCLUSÃO
Através de treinamento e teste, verificou que a
Árvore de decisão foi um método adequado para o
problema proposto, predizendo as saídas com uma
taxa acima de 95%.
Para trabalhos futuros pretende-se realizar teste
mais aprofundados para Árvore de decisão.
21
22. UFPA
CAMPUS UNIVERSITÁRIO DO TOCANTINS/CAMETÁ
REFERÊNCIAS
Camilo, C. O., Silva, J. C. (2009). Mineração de Dados:
Conceitos, Tarefas, Métodos e Ferramentas. Relatório
Técnico. Instituto de Informática Universidade Federal de
Goiás.
Pinto, K. S. et al. (2020) “Um Estudo de Caso de Internet das
Coisas Utilizando o Ecossistema Dojot: Da Configuração a
Utilização”, Conferência Nacional em Comunicações, Redes e
Segurança da Informação, X Edição, p. 95.
Rajput, RAJPUT, Shubhangini; SINGH, Surya Prakash.
Identifying Industry 4.0 IoT enablers by integrated PCA-ISM-
DEMATEL approach. Management Decision, [s.l.], v. 57, n. 8,
p.1784-1817, 12 set. 2019.
22
#Tópico 1: Por definição, A RNA baseia-se nos neurônios do cérebro humano.
#Tópico 2: Resolve problemas complexos que envolvem o reconhecimento de padrões.
Preletora: Laciene
#Tópico 1: Por definição, A RNA baseia-se nos neurônios do cérebro humano.
#Tópico 2: Resolve problemas complexos que envolvem o reconhecimento de padrões.
Preletora: Laciene
#Tópico 1: Por definição, A RNA baseia-se nos neurônios do cérebro humano.
#Tópico 2: Resolve problemas complexos que envolvem o reconhecimento de padrões.
Preletora: Laciene
#Tópico 1: Por definição, A RNA baseia-se nos neurônios do cérebro humano.
#Tópico 2: Resolve problemas complexos que envolvem o reconhecimento de padrões.
Preletora: Laciene
#Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação:
dois multiplicado pelo número de pontos da rota mais um
Preletora: Laciene
#Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação:
dois multiplicado pelo número de pontos da rota mais um
Preletora: Laciene
#Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação:
dois multiplicado pelo número de pontos da rota mais um
Preletora: Laciene
#Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação:
dois multiplicado pelo número de pontos da rota mais um
Preletora: Laciene
#Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação:
dois multiplicado pelo número de pontos da rota mais um
Preletora: Laciene
#Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação:
dois multiplicado pelo número de pontos da rota mais um
Preletora: Laciene
#Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação:
dois multiplicado pelo número de pontos da rota mais um
Preletora: Laciene
#Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação:
dois multiplicado pelo número de pontos da rota mais um
Preletora: Laciene
#Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação:
dois multiplicado pelo número de pontos da rota mais um
Preletora: Laciene
#Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação:
dois multiplicado pelo número de pontos da rota mais um
Preletora: Laciene
#Tópico 1: Neste trabalho o número de neurônios da camada de entrada da RNA é dado pela equação:
dois multiplicado pelo número de pontos da rota mais um
Preletora: Laciene