Palestra de Fernando Torquato sobre Análise de Dados e Inteligência Artificial apresentada no COMJOVEM Experience 2023 realizada no SETCESP em 27/09/2023.
2. Análise de Dados + Inteligência Artificial
= Ambiente de Ciência de Dados
Machine Learning
IoT
Business Analytics
BigData
Problem
Data Analysis
Data Science
Data Scientist
3. Fundamental para alguns segmentos:
• Bancos de Investimentos
• Análise de Crédito
• Seguros e Fraudes
• Medicina
“Resolver Problemas de Negócios”
Análise de Dados + Inteligência Artificial
= Ambiente de Ciência de Dados
5. Ciência de Dados:
É a arte de estudar e entender um ambiente de variáveis
e comportamentos, utilizando dados, focando na descoberta
das relações causais, para resolver problemas de negócios,
gerando previsões para tomadas de decisões.
Ciência da
Computaçã
o
Matemática e
Estatística
Conheciment
o do Negócio
10. Cientista de Dados:
É o responsável por projetar, implementar e validar modelos
preditivos e algoritmos para obter insights e prever resultados
futuros. Eles trabalham com dados estruturados e não
estruturados para criar modelos de aprendizado de máquina
e análise estatística.
• Analisa dados
• Descobre Insights
• Faz previsões
11. Cientista de Dados:
Curiosidade – Diferença entre Ciência e Engenharia
Descoberta
(Conhecimento Científico)
Invenção
(Novas Tecnologias)
Inovação
(Econômica e Comercial)
P&D (Pesquisa e Desenvolvimento)
13. IoT (internet das coisas):
É um conceito que se refere a um sistema de dispositivos
físicos (coisas), equipados com sensores, software e
conectividade às redes ou internet, que permitem a coleta,
análise e troca de dados entre si e com outros sistemas, sem
a necessidade de intervenção humana. É a grande fonte de
“matéria-prima” (dados) para Data Science.
• Coleta de dados • Conectividade
16. BigData:
BigData refere-se a conjuntos de dados que são tão grandes
e complexos que se tornam difíceis de serem processados
por ferramentas tradicionais (Excel e similares) de
processamento de dados. É a “matéria-prima” para
Data Science.
19. Análise de Dados:
Análise de dados é o processo de examinar, interpretar e
extrair insights valiosos a partir de conjuntos de dados para
obter informações acionáveis e tomar decisões informadas.
• Coletar dados
• Processar informações
• Analisar as estatísticas
• Entender as causas
• Contar uma história
21. Machine Learning:
Aprendizado de Máquina é a arte de ensinar uma máquina a
aprender a construir um modelo matemático que explica o
comportamento e a influência dos dados, e suas dezenas de
variáveis, em relação a um problema de negócio, para efetuar
previsões.
• Python
• R
22. Machine Learning:
Algoritmos:
• Regressão Linear
• Regressão Logística
• Árvores de Decisão
• Random Forest
• KNN
• Gradient Boosting
• Naive Bayes
• SVM
• K-Means
• Redes Neurais
Algoritmo + Dados
Históricos
Treinamento
Modelo +
Dados Novos
Previsões
23. Machine Learning:
Exemplo – Venda de Imóveis
Dados históricos:
• Casa – 1 dormitório – R$ 100.000
• Casa – 2 dormitórios – R$ 150.000
• Casa – 3 dormitórios – R$ 200.000
24. Machine Learning:
Exemplo – Venda de Imóveis
Dados históricos:
• Casa – 1 dormitório – R$ 100.000
• Casa – 2 dormitórios – R$ 150.000
• Casa – 3 dormitórios – R$ 200.000
Novos Dados:
• Casa – 4 dormitórios – R$ ???
25. Machine Learning:
Exemplo – Venda de Imóveis
Dados históricos:
• Casa – 1 dormitório – R$ 100.000
• Casa – 2 dormitórios – R$ 150.000
• Casa – 3 dormitórios – R$ 200.000
Novos Dados:
• Casa – 4 dormitórios – R$ 250.000
27. Análise de Negócios:
É o fim de todo o processo. A ideia principal do ambiente de
ciência de dados é resolver problemas de negócios, prevendo
e resolvendo antes dos custos e perdas acontecerem.
• Previsão de Economia de Diesel
• Roteirização Mais Eficiente
• Prevenção de Manutenção de Veículos
• Prevenção de Rotatividade de Funcionários
• Retenção de Clientes (Prevenção de Churn)
31. Implantação:
• Cultura de dados disseminada. Top Down.
• Capacitação e treinamento em inteligência analítica.
• IoT, armazenamentos de dados e ferramentas de análise.
• Padronização de input de dados e cadastros.
• Políticas de governança e segurança dos dados.
• Monitoramento, Correção, Evolução e Celebração.