2. Árvores de Decisão no FreeBSD
com R/RStudio
Mauro Risonho de Paula
Assumpção
2º Meetup do SW Artificial Intelligence com
AI Brasil
3. WHOIS
●
Sou profissional PCD (Tenho Autísmo/Asperger descoberto em 2016) e trabalho
com equipe VOLTRON-ENGSEC do PagSeguro.
●
Tento levar meu sobrenome a sério!
●
Atuo na área de Cybersecurity.
●
Estudo DS/AI/Machine Learning como formas de agregar, mais conhecimento e
automatização à Cybersecurity.
1) Não sou Cientista, Engenheiro de dados.
2) Não sou Machine Learning Eng e/ou similares
Não atuo na área de forma dedicada neste segmento nestas 2 citações acima.
https://www.linkedin.com/in/firebitsbr/
4. Minha tragetória com AI/Machine
Learning
Vulcanoio.org
https://www.kaggle.com/kerneler/
starter-open-source-cluster-iots-for-
d40bc73c-c
10. Deep Learning, Machine Learning
●
SUPERVISED LEARNING
Algoritmos de treinamento usando dados rotulados de entrada /saída.
●
UNSUPERVISED LEARNING
Algoritmos de treinamento sem dados rotulados. Ele tenta descobrir padrões ocultos por conta própria.
●
REINFORCEMENT LEARNING
Algoritmos tomam ações para maximizar a recompensa cumulativa.
●
Machine learning Process:
Processo de aprendizado de máquina: (1) seleção do modelo para treinamento, (2) execução manual da
extração de características.
●
Deep Learning Process:
Processo de Aprendizagem Profunda: (1) Selecione a arquitetura da rede, (2) os recursos são extraídos
automaticamente alimentando os dados de treinamento (como imagens) junto com a classe alvo (rótulo).
17. Por que a avaliação é importante?
●
Para saber quando você conseguiu
●
Para saber o quanto você conseguiu
●
Para saber decidir quando parar
●
Para saber decidir quando atualizar o
modelo
18. Perguntas básicas para avaliação
●
Quando avaliar?
●
Qual métrica usar?
●
Em quais dados?
19. Anaconda (1/2)
Não há versão para *BSD e nem pretendem desenvolver…
mas temos packages equivalentes no portsnap
pkg install
20. Anaconda (2/2)
Não há versão para *BSD e nem pretendem desenvolver…
mas temos packages equivalentes no portsnap
pkg install
21. Execução do Rstudio (1/2)
https://www.freshports.org/devel/RStudio/
pkg-message:
======================================================================
You installed RStudio: Integrated development environment (IDE) for R.
Please note that RStudio requires /proc to be mounted.
The usual way to do this is to add this line to /etc/fstab:
proc /proc procfs rw 0 0
and then run this command as root:
# mount /proc
25. Correspondência de dados de
entrada em algoritmos(1/2)
São muitos
algoritmos a serem
explicados.
A palestra irá focar
apenas no
algoritmo
“Decision Trees”
por questões de
tempo.
Modelo Tarefa de aprendizagem
Supervised Learning Algorithms
Nearest Neighbor Classification
Naive Bayes Classification
Decision Trees Classification
Classification Rule Learners Classification
Linear Regression Numeric prediction
Regression Trees Numeric prediction
Model Trees Numeric prediction
Neural Networks Dual use
Support Vector Machines Dual use
26. Correspondência de dados de
entrada em algoritmos(2/2)
Model Tarefa de aprendizagem
Unsupervised Learning Algorithms
Association Rules Pattern detection
k-means clustering Clustering
Meta-Learning Algorithms
Bagging Dual use
Boosting Dual use
Random Forests Dual use
27. Árvores de Decisão(Decision Trees 1/2)
Root
Decision
Node 2
Decision
Node 1
Decision
Node 3
NoYes NoYesNoYes
29. Alguns usos de Árvores de
Decisão(Decision Trees)
Com isso em mente, alguns usos potenciais incluem:
Modelos de pontuação de crédito nos quais os critérios que
fazem com que um candidato seja rejeitado precisam ser
claramente documentados e livres de viés
Estudos de marketing do comportamento do cliente, como
satisfação ou rotatividade, que serão compartilhados com
agências de gestão ou de publicidade
Diagnóstico de condições médicas com base em medições
laboratoriais, sintomas ou taxa de progressão da doença
30.
31. Implementação Decision Tree C5.0
Algoritmo de Decision Tree - C5.0 usa entropia
A entropia (S) é uma grandeza termodinâmica que
mede a desordem de um sistema e a
espontaneidade dos processos físicos.
A queda d’água em uma cachoeira é um processo
natural e espontâneo, no qual a entropia aumenta
A grandeza termodinâmica denominada entropia,
simbolizada pela letra S, está relacionada ao grau
de organização de um sistema.
Quanto maior a desordem do sistema, maior a
entropia.