Introduction to Data Science in IoT Projects.

Introdução à aplicações de
Data Science em projetos de IoT.

Agenda
• O que é Internet das Coisas.
• O que é Machine Learning (ML).
• Tipos de algoritmos de ML.
• Casos de Estudo ML para IoT
– Saúde.
– Meio-ambiente.
– Segurança do trabalhador.

O que é Internet das Coisas (IoT)

Definição
• A Internet das Coisas (IoT) é a rede de
dispositivos físicos, veículos, eletrodomésticos
e outros itens incorporados à eletrônica,
software, sensores, atuadores e
conectividade, que permite que esses objetos
se conectem e troquem dados. (wikipedia)

Componentes IoT
Sensores
e
Atuadores
Conectividade
Pessoas e
Processos

Big Data 4 V’s
Image: Wentworth Institute of technology

O que é Data Science
• É um campo interdisciplinar de métodos,
processos, algoritmos e sistemas científicos
para extrair conhecimento ou insights de
dados em várias formas, estruturadas ou não,
semelhantes à mineração de dados. (wikipedia)

D I K U W
Data Information Knowledge Understanding Wisdom
PAST FUTURE
Raw What How to Why When
Numbers Description Experience Cause & Effect Prediction
Letters Context Tested Proven What’s best
Symbols Relationship Instruction Known Unkowns Unkown Unkowns
Known Knows
Models
Signals Reports Programs
Adaptado do Piramide DIKW

Origem do Machine Learning
• 1950 - Alan Turing criou o
“Teste de Turing” para
determinar se um computador
possui inteligência real. Para
passar no teste, um
computador deve ser capaz de
enganar um humano,
acreditando que também é
humano.
Bernard Marr (2016)

• 1952 - Arthur Samuel escreveu
o primeiro programa de
aprendizado de computador. O
programa foi o jogo de damas.
Bernard Marr (2016)

• 1957 - Frank Rosenblatt
designed the first neural
network for computers (the
perceptron), which simulate
the thought processes of the
human brain.
Bernard Marr (2016)

• 1967 - O algoritmo de
“nearest neighbor” foi
escrito, permitindo que os
computadores comecem a
usar um reconhecimento de
padrões muito básico.
Bernard Marr (2016)

• 1979 - Os estudantes da
Universidade de Stanford
inventam o “Stanford Cart”,
que pode navegar por
obstáculos em uma sala por
conta própria.
Bernard Marr (2016)

• 1981 — Gerald Dejong introduz o
conceito de Explanation-Based
Learning (EBL), em que um
computador analisa dados de
treinamento e cria uma regra
geral que pode ser seguida
descartando dados sem
importância.
Bernard Marr (2016)

• 1985 - Terry Sejnowski
inventa o NetTalk, que
aprende a pronunciar as
palavras da mesma forma que
um bebê.
Bernard Marr (2016)

• Anos 90 - O trabalho sobre ML de
uma abordagem orientada pelo
conhecimento para uma abordagem
baseada em dados.
• Os cientistas começam a criar
programas para computadores para
analisar grandes quantidades de
dados e tirar conclusões - ou
"aprender" - a partir dos resultados.
Bernard Marr (2016)

• 1997 - O Deep Blue da IBM
bate o campeão mundial no
xadrez.
Bernard Marr (2016)

• 2006 - Geoffrey Hinton utiliza
o termo ”Deep Learning" para
explicar novos algoritmos que
permitem aos computadores
"ver" e distinguir objetos e
textos em imagens e vídeos.
Bernard Marr (2016)

• 2010 — O Microsoft Kinect pode
rastrear 20 características
humanas 30 x/s, permitindo que
as pessoas interajam com o
computador por meio de
movimentos e gestos.
Bernard Marr (2016)

• 2011 - O Watson da IBM supera
seus concorrentes humanos no
‘Jeopardy’.
• O Google Brain é desenvolvido e
sua Deep Neural Network pode
aprender a descobrir e categorizar
objetos da mesma forma que um
gato.
Bernard Marr (2016)

• 2012 - O ‘X Lab’ da Google
desenvolve um algoritmo de
Machine Learning capaz de
navegar de forma autônoma em
vídeos do YouTube para
identificar os vídeos que
contêm gatos.
Bernard Marr (2016)

• 2014 - O Facebook desenvolve
o DeepFace, um algoritmo de
software que é capaz de
reconhecer ou verificar
indivíduos em fotos no
mesmo nível que os humanos.
Bernard Marr (2016)

• 2015 - A Amazon lança sua própria
plataforma de aprendizado de
máquina.
• A Microsoft cria o Distributed
Machine Learning Toolkit, que
permite a distribuição eficiente de
problemas de aprendizado de
máquina em vários computadores.
Bernard Marr (2016)

• 2015 - Mais de 3 mil
pesquisadores de IA e Robótica,
apoiados por Stephen Hawking,
Elon Musk e Steve Wozniak
(entre outros), assinam uma
carta aberta alertando sobre o
perigo de armas autônomas que
selecionam e engajam alvos sem
intervenção humana.
Bernard Marr (2016)

• 2016 - O algoritmo de AI da Google
bate um jogador profissional no
jogo de tabuleiro chinês Go,
considerado o jogo de tabuleiro
mais complexo do mundo e muitas
vezes mais difícil que o xadrez. O
algoritmo AlphaGo, desenvolvido
pelo Google DeepMind, conseguiu
vencer cinco dos cinco jogos da
competição Go.
Bernard Marr (2016)

• 2017 - O algoritimo de ML da
Google é preciso em 89% do
tempo na detecção do câncer
de mama. Isso é 15% mais
eficaz que os patologistas,
com 74%.
Statwolf.com

O que é Inteligência Artificial (IA)
IA
“Simulação de qualquer
tarefa intelectual.” IA

IA Sub-set
IA Sub-set
• Search and Planning (Chess)
• Reasoning and Knowledge representation
(Watson)
• Perception (Sensing)
• Ability to move and manipulate objects
(robotics)
• Natural language processing (Google)
• Machine Learning
NLP
IA
ML
S&P
M&M
R&K
P

O que é Machine Learning
Machine Learning
O aprendizado de máquina é um campo da ciência da
computação que usa técnicas estatísticas para dar aos
sistemas de computador a capacidade de "aprender"
(ou seja, melhorar progressivamente o desempenho
em uma tarefa específica) com dados, sem ser
explicitamente programado. (Wikipedia)

O que é Machine Learning
Machine Learning
É o aprendizado computacional pela experiência
passada. (Udacity)

O que será ML
• “A breakthrough in machine learning would be worth
ten Microsofts” (Bill Gates, Chairman, Microsoft)
• “Machine learning is the next Internet”
(Tony Tether, Director, DARPA)
• Machine learning is the hot new thing”
(John Hennessy, President, Stanford)

O que será ML
• “Web rankings today are mostly a matter of machine
learning” (Prabhakar Raghavan, Dir. Research, Yahoo)
• “Machine learning is going to result in a real
revolution” (Greg Papadopoulos, CTO, Sun)
• “Machine learning is today’s discontinuity”
(Jerry Yang, Founder, Yahoo)

Entendendo ML
Forma
Tradicional de
Programação
Forma Disruptiva
Machine Learning

Machine Learning embaixo do capô
Pattern
PredictUpdate

IoT Cases
• Industria: Segurança no Trabalho.
• Saúde
– Predição de Reações adversas.
– Agrupamento de pacientes.
– Insights.
• Despoluição de águas
– Predição de parâmetros.

Problema
• Identificação de áreas perigosas para
trabalhadores.
– Potencial queda
• Trabalhadores evitam relatar acidentes e incidentes.
• Áreas de instabilidade precisam ser identificadas.
– Risco de atropelamento
• Trabalhadores trafegam em área de risco.

Resumo de Arquitetura
WEARABLE COMMUNICATION CLOUD COMPUTING

Arquitetura
WEARABLE
LoRaWAN
Modem
LoRaWAN
Gateway
LoRaWAN
NTW
Server
ROBBIOT
SERVER
LoRaWAN
APP
Server
internet
dashboard

IoT - Wearable
• Localização
– Módulo GPS
• Queda
– Acelerômetro
– Giroscópio
• Sensor UV
• Sensor de ruído

Conceito de uso do ML
• Dados de indicação de
queda
– Alerta de queda.
• Dados de indicação de
instabilidade.
– Dados de
aceleração.
• Dados de localização.
– Latitude.
– Longitude.
DADOS
K-Means
Clustering ML
• Identificação de áreas
de instabilidade.
– Insights IMU
• Identificação de
trabalhadores mais
propensos a risco.
– Permacem mais
tempo e de forma
recorrente.
RESULTADOS

Problema
• O protocolo de tratamento oncológico infantil
muda a cada 3 anos.
• Este curto período dificulta entendimento dos
efeitos colaterais medicamentosos e outras
reações.
• Pode diminuir a expectativa de vida do
paciente.

Resumo da Arquitetura
wearable
artificial intelligence
treatment insights
patient monitoring

Arquitetura
big data
artificial intelligence
patient monitoringng
wearable
O2
records
medical
treatment insights

• Dados de Sinais
vitais
• Dados de Arquivos
Médicos
DADOS
K-Means
Clustering ML
• Identificação de
grupos de crianças
através de insights
escondidos nos dados.
RESULTADOS

• Grupos definidos.
• Dados de Sinais
vitais.
• Dados de Arquivos
Médicos.
DADOS
SVM
Linear Regression ML
• Predição de alteração
térmica.
• Alerta para retorno do
paciente ao hospital.
RESULTADOS

Problema
• Entender o processo de despoluição em
corpos hídricos.
• Diminuição de custo de medição com
eliminação de sensores.

Arquitetura
SENSORES
LoRaWAN
Modem
LoRaWAN
Gateway
LoRaWAN
NTW
Server
IBM
SERVER
LoRaWAN
APP
Server
internet
dashboard
ORPCond.
Temp.
pH
DO
Turb.

• Medidas de diversos
parâmetros
– Temperatura,
Condutividade,
Turbides, pH,
Oxigênio
Dissolvido e ORP.
DADOS
Normalization
Scaling
• Ajustando range de
dados.
• Normalizando dados
(Linear, Algoritmo,
etc).
• Remoção de ouliers.
RESULTADOS

• Medidas de diversos
parâmetros
– Temperatura,
Condutividade,
Turbides, pH,
Oxigênio
Dissolvido e ORP.
•
DADOS
PCA
Dimensionality reduction
• Entendimento de
quais features estão
inter-relacionados.
• Feature reduction.
RESULTADOS

Obrigado
• Roberto Williams
• robertowilliams@robbiot.com
• (11) 9.8112-5152

Introduction to Data Science in IoT Projects.

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (13)

Semelhante a Introduction to Data Science in IoT Projects.

Semelhante a Introduction to Data Science in IoT Projects. (20)

Mais de Roberto Williams Batista

Mais de Roberto Williams Batista (8)

Introduction to Data Science in IoT Projects.

Notas do Editor