SlideShare uma empresa Scribd logo
1 de 26
1 / 26
BusinessBusiness
AnalyticsAnalytics::
ProcessosProcessos
Prof. Daniela Brauner
Escola de Administração – UFRGS
daniela.brauner@ufrgs.br
danibrauner@gmail.com
Práticas em Business Analytics
......
2 / 26
......
3 / 26
Sumário
●
O que é Data Science?
●
Problemas e fatores de sucesso em projetos de
Business Analytics
●
Processos
– Data Analytics Lifecycle
●
Formação do time
......
4 / 26
Ciência da
Computação
Conhecimento
do domínio
Definição: Data Science
●
É a área que reune tudo relacionado ao
tratamento, preparação e análise de dados.
●
É um guarda-chuva
de técnicas usadas
para extrair insights
e informações
dos dados.
Matemática
Estatística
Banco
de
Dados
Aprendizado
de
Máquina
Data
Science......
5 / 26
FONTE: http://digitally.cognizant.com/data-science-the-new-monetization-model-for-analytics-industry-3/
Data Science x BI
......
6 / 26
“Somente 27% dos projetos de Big Data Analytics tem sucesso”
Fonte: CapGemeni – Big Data Survey 2014
Data Science não acontece do nada…Data Science não acontece do nada…
......
7 / 26
Alguns problemas em projetos
Dados dispersos em silos de diferentes áreas
Falta de um caso de uso de negócios claro
Ineficiência na coordenação dos times
envolvidos na análise de dados da organização
Dependência de sistemas legados para gestão
e processamento de dados
Falta de modelos de governança para analytics
Falta de patrocinador da alta gerência
Falta de habilidade em analytics e big data
Falta de clareza nas ferramentas e tecnologias
Custo das ferramentas e infraestruturas para analytics
Preocupação com segurança e privacidade de dados
Resistência a mudança na organização
......
8 / 26
Alguns fatores de sucesso
✔ Roadmap
estratégico
(proposta de valor)
✔ Seleção de caso
de uso
✔ Métricas de
sucesso (Key
Performance
Indicators - KPIs)
https://www.capgemini.com/wp-content/uploads/sites/30/2015/01/Cracking-the-data-conundrum-infographic.pdf
Projeto Equipe
......
9 / 26
Alguns fatores de sucesso
✔ Roadmap
estratégico
(proposta de valor)
✔ Seleção de caso
de uso
✔ Métricas de
sucesso (Key
Performance
Indicators - KPIs)
https://www.capgemini.com/wp-content/uploads/sites/30/2015/01/Cracking-the-data-conundrum-infographic.pdf
Projeto Equipe
PROCESSO
......
10 / 26
......
11 / 26
Processos para Data Science
●
KDD
●
CRISP-DM
●
SEMMA
●
Data Analytics Lifecycle
......
12 / 26
Knowledge Discovery in Databases (KDD)
●
Mais antiga (1996)
●
Foco na transformação de dados em informação
FONTE: FAYYAD, Usama; PIATETSKY-SHAPIRO, Gregory; SMYTH, Padhraic. From data mining to knowledge discovery: An overview. In: Advances in
Knowledge Discovery and Data Mining, AAAI Press/The MIT Press, England, 1996, p.1-34.
......
13 / 26
Cross Industry Standard Process
for Data Mining (CRISP-DM)
●
Existe desde 1996;
●
Oficializado por um consórcio
financiado pela comissão
européia em 2000, com Daimler
Chrysler (then Daimler-Benz),
SPSS (then ISL) , NCR;
(Veteranos em Data Mining)
●
Mais de 200 organizacões
contribuíram no processo.
FONTE: Chapman et al., 2000. https://www.the-modeling-agency.com/crisp-dm.pdf
......
14 / 26
Sample, Explore, Modify, Model e
Assess  (SEMMA)
●
Criada pela SAS
em 2008;
●
Processo que guia
um passo a passo
do software SAS
Enterprise Miner;
Fonte: http://faculty.smu.edu/tfomby/eco5385_eco6380/data/SPSS/SAS%20_%20SEMMA.pdf
https://paulovasconcellos.com.br/crisp-dm-semma-e-kdd-conheça-as-melhores-técnicas-para-exploração-de-dados-560d294547d2
......
15 / 26
Data Analytics Lifecycle
●
Proposto pela EMC (2015)
●
Framework que reune
melhores práticas dos
modelos existentes:
método científico, CRISP-
DM, DELTA, Applied
information economics
approach e MadSkills.
FONTE: EMC Education (2015). Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data (1 ed.). Hoboken, New Jersey: Wiley.
......
16 / 26
Data Analytics Lifecycle
Fase 1: Descoberta
●
Entender o negócio;
●
Mapear recursos: pessoas, tecnologia, dados, tempo e
prazos;
– Identificar potenciais fontes de dados;
●
Entender o problema a ser resolvido com analytics;
Pensar no problema como um desafio de analytics;
●
Identificar stakeholders e seus interesses no projeto;
●
Definir critérios de sucesso e riscos;
●
Desenvolver hipóteses iniciais a serem testadas com
dados;
......
17 / 26
Data Analytics Lifecycle
Fase 1: Descoberta
●
Sugestões de recursos que podem ser usados nesta fase:
– Plano de negócios (ou BM Canvas): conhecimento do negócio,
proposta de valor e pontos chave de geração e uso de dados etc;
– Mapa estratégico: objetivos organizacionais, processos chave
etc;
– Processos organizacionais e organograma: identificar áreas
geradoras, mantenedoras e consumidoras de dados e potenciais
consumidores do resultado do analytics;
– Entrevistas: sponsor do projeto, stakeholders e especialistas no
domínio para identificar requisitos, riscos e critérios de sucesso;
– Entre outros.
......
18 / 26
Data Analytics Lifecycle
Fase 2: Preparação dos Dados
●
Explorar os dados:
– Identificar bases de dados internas e externas;
– Entender os dados e formatação;
– Identificar ruídos e problemas (gaps, erros etc);
●
Usar uma sandbox para mexer nos dados sem interferir
nos dados de produção;
●
Executar ETL: Extract, Transform and Load;
– Limpeza, normalização e transformações;
– Recarregar os dados de volta;
......
19 / 26
●
Sugestões de recursos que
podem ser usados nesta fase:
– Inventário de dados: para
identificar potenciais fontes
de dados;
– Dicionário de dados:
organização dos metadados
das bases de dados a serem
utilizadas com descrição dos
campos e tipos de dados;
– Entre outros.
Data Analytics Lifecycle
Fase 2: Preparação dos Dados
Ex: inventário
Ex: dicionário
......
20 / 26
Data Analytics Lifecycle
Fase 3: Planejamento do Modelo
●
Identificar candidatos de modelos;
●
Avaliar as bases de dados e os objetivos do projeto, para
identificar potenciais técnicas de analytics que possam
ser aplicadas: classificação, clustering, associação etc;
– uma técnica ou um conjunto delas (encadeadas);
– ferramentas;
●
Garantir que o(s) modelo(s) escolhido(s) viabilize o
alcance dos objetivos de negócio e valide as hipóteses;
......
21 / 26
Data Analytics Lifecycle
Fase 3: Planejamento do Modelo
●
Com base nos dados e nos objetivos, identificar o tipo de análise mais adequada:
– Descritiva: é visualizar os dados de forma mais dinâmica,
entendendo como se organizam e qual seu comportamento no presente;
●
Ex: quais doenças ocorrem, quais perfis de pacientes etc.
– Diagnóstica: compreender de maneira causal (Quem, Quando, Como, Onde e
Por que) todas as suas possibilidades;
●
Ex: onde no país estão ocorrendo menos vendas de plano de saúde, em quais conveniados, e
por que;
– Preditiva: “prever” o futuro, usa mineração de dados, dados estatísticos e
dados históricos para conhecer as futuras tendências;
●
Ex: os gestores dos planos de saúde podem traçar padrões de comportamento de
determinados pacientes, a partir de dados históricos e prever futuras doenças em outros
pacientes;
– Prescritiva: enquanto a análise preditiva identifica tendências futuras, a
prescritiva também traça as possíveis consequências de cada ação;
●
Ex: analisar possíveis impactos de ações sobre um grupo de risco, analisando qual a melhor
opção de gestão para eles.
......
22 / 26
Data Analytics Lifecycle
Fase 4: Construção do Modelo
●
Buscar/construir/desenvolver o modelo;
●
Validar o modelo:
– Conjunto de treinamento x conjunto de teste;
– Técnica de validação:
●
Ex: Validação cruzada (K-Fold)
– Métrica de sucesso;
●
Ferramentas: R, Weka, SPSS Modeler, Matlab, Python etc.
●
Perguntas a responder:
......
23 / 26
Data Analytics Lifecycle
Fase 5: Comunicar Resultados
●
Tenha uma história para contar (storytelling),
encadeando os achados;
●
Comunicar os resultados positivos e até mesmo os fracassos;
●
Verificar se os resultados são estatisticamente relevantes;
●
Mapear o valor / impacto dos resultados para o negócio;
●
Faça recomendações de lições aprendidas/melhores
práticas;
– Insights para futuras análises;
– Planos futuros de uso, evolução do modelo/análise;
......
24 / 26
Data Analytics Lifecycle
Fase 6: Operacionalizar
●
Planeje um piloto do projeto, num experimento controlado, antes de
abrir para a empresa como um todo;
●
Já utilize as infraestruturas definitivas para testar a velocidade e
robustez de processamento;
......
25 / 26
Formação do Time
......
26 / 26
Bibliografia
EMC Education (2015)
Data Science and Big Data
Analytics: Discovering, Analyzing,
Visualizing and Presenting Data 
(1 ed.). Hoboken, New Jersey: Wiley.
......

Mais conteúdo relacionado

Mais procurados

Fluxograma de processo Professor Danilo Pires
Fluxograma de processo  Professor Danilo PiresFluxograma de processo  Professor Danilo Pires
Fluxograma de processo Professor Danilo PiresDanilo Pires
 
Concepção de um Product Backlog Efetivo
Concepção de um Product Backlog EfetivoConcepção de um Product Backlog Efetivo
Concepção de um Product Backlog EfetivoFábio Aguiar
 
Tutorial Planning Poker Para Times Remotos
Tutorial Planning Poker Para Times RemotosTutorial Planning Poker Para Times Remotos
Tutorial Planning Poker Para Times RemotosRildo (@rildosan) Santos
 
Validação e Testes de software
Validação e Testes de softwareValidação e Testes de software
Validação e Testes de softwareRondinelli Mesquita
 
Produção cap1 aula 1
Produção cap1   aula 1Produção cap1   aula 1
Produção cap1 aula 1Diego José
 
Administração da produção slack 3ªed parte 1
Administração da produção   slack 3ªed parte 1Administração da produção   slack 3ªed parte 1
Administração da produção slack 3ªed parte 1Stéphani Ferreira
 
Métodos Ágeis e Scrum - Introdução
Métodos Ágeis e Scrum - IntroduçãoMétodos Ágeis e Scrum - Introdução
Métodos Ágeis e Scrum - IntroduçãoYuri Morais
 
Aula1 - Gerenciamento de Projetos
Aula1 - Gerenciamento de ProjetosAula1 - Gerenciamento de Projetos
Aula1 - Gerenciamento de ProjetosMairaM
 
Modelo de Negócio do PMO
Modelo de Negócio do PMOModelo de Negócio do PMO
Modelo de Negócio do PMOProject Builder
 
Indicadores de desempenho
Indicadores de desempenhoIndicadores de desempenho
Indicadores de desempenhomauroconde
 
Design thinking - Aula 1 MFN 2014 UFRJ/FIRJAN - Bizzie
Design thinking - Aula 1 MFN 2014 UFRJ/FIRJAN - BizzieDesign thinking - Aula 1 MFN 2014 UFRJ/FIRJAN - Bizzie
Design thinking - Aula 1 MFN 2014 UFRJ/FIRJAN - BizzieRafaella Cavalca
 
Diagramas de Fluxo de Dados
Diagramas de Fluxo de DadosDiagramas de Fluxo de Dados
Diagramas de Fluxo de DadosJanynne Gomes
 
Python - Programação funcional
Python - Programação funcionalPython - Programação funcional
Python - Programação funcionalfabiocerqueira
 
Metodologia ágil das Desenvolvimento Adaptativo Software
Metodologia ágil das   Desenvolvimento Adaptativo SoftwareMetodologia ágil das   Desenvolvimento Adaptativo Software
Metodologia ágil das Desenvolvimento Adaptativo SoftwareMarilainny Martins da Silva
 
Treinamento de Scrum
Treinamento de ScrumTreinamento de Scrum
Treinamento de ScrumLuiz Duarte
 

Mais procurados (20)

Gerenciamento de tempo em projetos
Gerenciamento de tempo em projetosGerenciamento de tempo em projetos
Gerenciamento de tempo em projetos
 
Aula - Metodologias Ágeis
Aula - Metodologias ÁgeisAula - Metodologias Ágeis
Aula - Metodologias Ágeis
 
Fluxograma de processo Professor Danilo Pires
Fluxograma de processo  Professor Danilo PiresFluxograma de processo  Professor Danilo Pires
Fluxograma de processo Professor Danilo Pires
 
Concepção de um Product Backlog Efetivo
Concepção de um Product Backlog EfetivoConcepção de um Product Backlog Efetivo
Concepção de um Product Backlog Efetivo
 
Tutorial Planning Poker Para Times Remotos
Tutorial Planning Poker Para Times RemotosTutorial Planning Poker Para Times Remotos
Tutorial Planning Poker Para Times Remotos
 
Validação e Testes de software
Validação e Testes de softwareValidação e Testes de software
Validação e Testes de software
 
Produção cap1 aula 1
Produção cap1   aula 1Produção cap1   aula 1
Produção cap1 aula 1
 
Administração da produção slack 3ªed parte 1
Administração da produção   slack 3ªed parte 1Administração da produção   slack 3ªed parte 1
Administração da produção slack 3ªed parte 1
 
Métodos Ágeis e Scrum - Introdução
Métodos Ágeis e Scrum - IntroduçãoMétodos Ágeis e Scrum - Introdução
Métodos Ágeis e Scrum - Introdução
 
Aula1 - Gerenciamento de Projetos
Aula1 - Gerenciamento de ProjetosAula1 - Gerenciamento de Projetos
Aula1 - Gerenciamento de Projetos
 
Arranjos Físico
 Arranjos Físico Arranjos Físico
Arranjos Físico
 
Modelo de Negócio do PMO
Modelo de Negócio do PMOModelo de Negócio do PMO
Modelo de Negócio do PMO
 
Indicadores de desempenho
Indicadores de desempenhoIndicadores de desempenho
Indicadores de desempenho
 
Design thinking - Aula 1 MFN 2014 UFRJ/FIRJAN - Bizzie
Design thinking - Aula 1 MFN 2014 UFRJ/FIRJAN - BizzieDesign thinking - Aula 1 MFN 2014 UFRJ/FIRJAN - Bizzie
Design thinking - Aula 1 MFN 2014 UFRJ/FIRJAN - Bizzie
 
Diagramas de Fluxo de Dados
Diagramas de Fluxo de DadosDiagramas de Fluxo de Dados
Diagramas de Fluxo de Dados
 
Gestão de Projetos
Gestão de ProjetosGestão de Projetos
Gestão de Projetos
 
Python - Programação funcional
Python - Programação funcionalPython - Programação funcional
Python - Programação funcional
 
Metodologia ágil das Desenvolvimento Adaptativo Software
Metodologia ágil das   Desenvolvimento Adaptativo SoftwareMetodologia ágil das   Desenvolvimento Adaptativo Software
Metodologia ágil das Desenvolvimento Adaptativo Software
 
Gestão de projetos fev2011 - ppt2003
Gestão de projetos   fev2011 - ppt2003Gestão de projetos   fev2011 - ppt2003
Gestão de projetos fev2011 - ppt2003
 
Treinamento de Scrum
Treinamento de ScrumTreinamento de Scrum
Treinamento de Scrum
 

Semelhante a Business Analytics - Data Science Processes

Data Science - Big Data - Data Driven
Data Science - Big Data - Data DrivenData Science - Big Data - Data Driven
Data Science - Big Data - Data DrivenDaniela Brauner
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesMarlesson Santana
 
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...Dalton Martins
 
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Marcos Vinicius Fidelis
 
Artigo ferramentas mineracao_-_melhor_escolha
Artigo ferramentas mineracao_-_melhor_escolhaArtigo ferramentas mineracao_-_melhor_escolha
Artigo ferramentas mineracao_-_melhor_escolhaWosley Arruda
 
Gerenciamento Estratégico de Sistemas
Gerenciamento Estratégico de SistemasGerenciamento Estratégico de Sistemas
Gerenciamento Estratégico de SistemasJosé Passos
 
Introducão à Ciência de Dados
Introducão à Ciência de DadosIntroducão à Ciência de Dados
Introducão à Ciência de DadosJoão Pedro Albino
 
Data mining: Auxiliando as empresas na tomada de decisão
Data mining: Auxiliando as empresas na tomada de decisãoData mining: Auxiliando as empresas na tomada de decisão
Data mining: Auxiliando as empresas na tomada de decisãoAntonioEE256
 
Usando weka-na-pratica
Usando weka-na-praticaUsando weka-na-pratica
Usando weka-na-praticaawtb1200
 
Aula 02 giovanni --dcbd
Aula 02   giovanni --dcbdAula 02   giovanni --dcbd
Aula 02 giovanni --dcbdgtiprotec
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowareMarcos Vinicius Fidelis
 
Flisol 2016 fidelis - Curitiba - PR - Brazil
Flisol 2016   fidelis - Curitiba - PR - BrazilFlisol 2016   fidelis - Curitiba - PR - Brazil
Flisol 2016 fidelis - Curitiba - PR - BrazilMarcos Vinicius Fidelis
 
Machine Learning Canvas: Da coleta de dados à geração de valor
Machine Learning Canvas: Da coleta de dados à geração de valorMachine Learning Canvas: Da coleta de dados à geração de valor
Machine Learning Canvas: Da coleta de dados à geração de valorAlexandre Ray
 

Semelhante a Business Analytics - Data Science Processes (20)

Data Science - Big Data - Data Driven
Data Science - Big Data - Data DrivenData Science - Big Data - Data Driven
Data Science - Big Data - Data Driven
 
Pentaho Weka latinoware
Pentaho Weka latinowarePentaho Weka latinoware
Pentaho Weka latinoware
 
Mineração
MineraçãoMineração
Mineração
 
jjjjjjjjjjjjjjj
jjjjjjjjjjjjjjjjjjjjjjjjjjjjjj
jjjjjjjjjjjjjjj
 
Ciência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisõesCiência de Dados: a revolução na tomada de decisões
Ciência de Dados: a revolução na tomada de decisões
 
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
 
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014
 
Data mining
Data miningData mining
Data mining
 
Artigo ferramentas mineracao_-_melhor_escolha
Artigo ferramentas mineracao_-_melhor_escolhaArtigo ferramentas mineracao_-_melhor_escolha
Artigo ferramentas mineracao_-_melhor_escolha
 
Gerenciamento Estratégico de Sistemas
Gerenciamento Estratégico de SistemasGerenciamento Estratégico de Sistemas
Gerenciamento Estratégico de Sistemas
 
Introducão à Ciência de Dados
Introducão à Ciência de DadosIntroducão à Ciência de Dados
Introducão à Ciência de Dados
 
Dutra (2)
Dutra (2)Dutra (2)
Dutra (2)
 
Data mining: Auxiliando as empresas na tomada de decisão
Data mining: Auxiliando as empresas na tomada de decisãoData mining: Auxiliando as empresas na tomada de decisão
Data mining: Auxiliando as empresas na tomada de decisão
 
Usando weka-na-pratica
Usando weka-na-praticaUsando weka-na-pratica
Usando weka-na-pratica
 
Aula 02 giovanni --dcbd
Aula 02   giovanni --dcbdAula 02   giovanni --dcbd
Aula 02 giovanni --dcbd
 
Data Science For Dummies From a Dummy
Data Science For Dummies From a DummyData Science For Dummies From a Dummy
Data Science For Dummies From a Dummy
 
Palestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinowarePalestra garimpando com pentaho data mining latinoware
Palestra garimpando com pentaho data mining latinoware
 
Flisol 2016 fidelis - Curitiba - PR - Brazil
Flisol 2016   fidelis - Curitiba - PR - BrazilFlisol 2016   fidelis - Curitiba - PR - Brazil
Flisol 2016 fidelis - Curitiba - PR - Brazil
 
Machine Learning Canvas: Da coleta de dados à geração de valor
Machine Learning Canvas: Da coleta de dados à geração de valorMachine Learning Canvas: Da coleta de dados à geração de valor
Machine Learning Canvas: Da coleta de dados à geração de valor
 
Data mining
Data miningData mining
Data mining
 

Mais de Daniela Brauner

Data Science e Inteligência de dados - Inteligencia artificial e machine lear...
Data Science e Inteligência de dados - Inteligencia artificial e machine lear...Data Science e Inteligência de dados - Inteligencia artificial e machine lear...
Data Science e Inteligência de dados - Inteligencia artificial e machine lear...Daniela Brauner
 
Validando a proposta de valor com MVP
Validando a proposta de valor com MVPValidando a proposta de valor com MVP
Validando a proposta de valor com MVPDaniela Brauner
 
Aula 02 evolução historica sistemas de informação - db
Aula 02   evolução historica sistemas de informação - dbAula 02   evolução historica sistemas de informação - db
Aula 02 evolução historica sistemas de informação - dbDaniela Brauner
 
Aula 02 introducao adm da produção - db
Aula 02   introducao adm da produção - dbAula 02   introducao adm da produção - db
Aula 02 introducao adm da produção - dbDaniela Brauner
 
Aula 04 introducao processos de transformação - db
Aula 04   introducao processos de transformação - dbAula 04   introducao processos de transformação - db
Aula 04 introducao processos de transformação - dbDaniela Brauner
 
Aula 07 evolução histórica da função produção - db
Aula 07   evolução histórica da função produção - dbAula 07   evolução histórica da função produção - db
Aula 07 evolução histórica da função produção - dbDaniela Brauner
 
Aula05 - Metodologias Ágeis
Aula05 - Metodologias ÁgeisAula05 - Metodologias Ágeis
Aula05 - Metodologias ÁgeisDaniela Brauner
 
Aula04 - EAP e Cronograma
Aula04 - EAP e CronogramaAula04 - EAP e Cronograma
Aula04 - EAP e CronogramaDaniela Brauner
 
Aula03 - Termo de Abertura de Projeto
Aula03 - Termo de Abertura de ProjetoAula03 - Termo de Abertura de Projeto
Aula03 - Termo de Abertura de ProjetoDaniela Brauner
 
NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...
NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...
NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...Daniela Brauner
 
Proposta de doutorado - Alinhamento de esquemas baseado em instâncias
Proposta de doutorado - Alinhamento de esquemas baseado em instânciasProposta de doutorado - Alinhamento de esquemas baseado em instâncias
Proposta de doutorado - Alinhamento de esquemas baseado em instânciasDaniela Brauner
 
Web Semântica e Ontologias
Web Semântica e OntologiasWeb Semântica e Ontologias
Web Semântica e OntologiasDaniela Brauner
 
Dados científicos, Serviços nacionais de dados e Research Data Alliance
Dados científicos, Serviços nacionais de dados e Research Data AllianceDados científicos, Serviços nacionais de dados e Research Data Alliance
Dados científicos, Serviços nacionais de dados e Research Data AllianceDaniela Brauner
 
Aula - Sistemas de Informação
Aula - Sistemas de InformaçãoAula - Sistemas de Informação
Aula - Sistemas de InformaçãoDaniela Brauner
 
Aula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOK
Aula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOKAula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOK
Aula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOKDaniela Brauner
 
Aula00 - Gerência de Projetos - Como surgem os projetos nas empresas
Aula00 - Gerência de Projetos - Como surgem os projetos nas empresasAula00 - Gerência de Projetos - Como surgem os projetos nas empresas
Aula00 - Gerência de Projetos - Como surgem os projetos nas empresasDaniela Brauner
 
AULA02 - Gerência de Projetos - PMI
AULA02 - Gerência de Projetos - PMIAULA02 - Gerência de Projetos - PMI
AULA02 - Gerência de Projetos - PMIDaniela Brauner
 
Apresentacao ForumRNP 2015 - Daniela Brauner
Apresentacao ForumRNP 2015 - Daniela BraunerApresentacao ForumRNP 2015 - Daniela Brauner
Apresentacao ForumRNP 2015 - Daniela BraunerDaniela Brauner
 

Mais de Daniela Brauner (18)

Data Science e Inteligência de dados - Inteligencia artificial e machine lear...
Data Science e Inteligência de dados - Inteligencia artificial e machine lear...Data Science e Inteligência de dados - Inteligencia artificial e machine lear...
Data Science e Inteligência de dados - Inteligencia artificial e machine lear...
 
Validando a proposta de valor com MVP
Validando a proposta de valor com MVPValidando a proposta de valor com MVP
Validando a proposta de valor com MVP
 
Aula 02 evolução historica sistemas de informação - db
Aula 02   evolução historica sistemas de informação - dbAula 02   evolução historica sistemas de informação - db
Aula 02 evolução historica sistemas de informação - db
 
Aula 02 introducao adm da produção - db
Aula 02   introducao adm da produção - dbAula 02   introducao adm da produção - db
Aula 02 introducao adm da produção - db
 
Aula 04 introducao processos de transformação - db
Aula 04   introducao processos de transformação - dbAula 04   introducao processos de transformação - db
Aula 04 introducao processos de transformação - db
 
Aula 07 evolução histórica da função produção - db
Aula 07   evolução histórica da função produção - dbAula 07   evolução histórica da função produção - db
Aula 07 evolução histórica da função produção - db
 
Aula05 - Metodologias Ágeis
Aula05 - Metodologias ÁgeisAula05 - Metodologias Ágeis
Aula05 - Metodologias Ágeis
 
Aula04 - EAP e Cronograma
Aula04 - EAP e CronogramaAula04 - EAP e Cronograma
Aula04 - EAP e Cronograma
 
Aula03 - Termo de Abertura de Projeto
Aula03 - Termo de Abertura de ProjetoAula03 - Termo de Abertura de Projeto
Aula03 - Termo de Abertura de Projeto
 
NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...
NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...
NRENs in the Dissemination of Innovative Low Cost Global Solutions: From Univ...
 
Proposta de doutorado - Alinhamento de esquemas baseado em instâncias
Proposta de doutorado - Alinhamento de esquemas baseado em instânciasProposta de doutorado - Alinhamento de esquemas baseado em instâncias
Proposta de doutorado - Alinhamento de esquemas baseado em instâncias
 
Web Semântica e Ontologias
Web Semântica e OntologiasWeb Semântica e Ontologias
Web Semântica e Ontologias
 
Dados científicos, Serviços nacionais de dados e Research Data Alliance
Dados científicos, Serviços nacionais de dados e Research Data AllianceDados científicos, Serviços nacionais de dados e Research Data Alliance
Dados científicos, Serviços nacionais de dados e Research Data Alliance
 
Aula - Sistemas de Informação
Aula - Sistemas de InformaçãoAula - Sistemas de Informação
Aula - Sistemas de Informação
 
Aula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOK
Aula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOKAula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOK
Aula01 Gerência de Projetos - Conceitos e áreas de conhecimento do PMBOK
 
Aula00 - Gerência de Projetos - Como surgem os projetos nas empresas
Aula00 - Gerência de Projetos - Como surgem os projetos nas empresasAula00 - Gerência de Projetos - Como surgem os projetos nas empresas
Aula00 - Gerência de Projetos - Como surgem os projetos nas empresas
 
AULA02 - Gerência de Projetos - PMI
AULA02 - Gerência de Projetos - PMIAULA02 - Gerência de Projetos - PMI
AULA02 - Gerência de Projetos - PMI
 
Apresentacao ForumRNP 2015 - Daniela Brauner
Apresentacao ForumRNP 2015 - Daniela BraunerApresentacao ForumRNP 2015 - Daniela Brauner
Apresentacao ForumRNP 2015 - Daniela Brauner
 

Business Analytics - Data Science Processes

  • 1. 1 / 26 BusinessBusiness AnalyticsAnalytics:: ProcessosProcessos Prof. Daniela Brauner Escola de Administração – UFRGS daniela.brauner@ufrgs.br danibrauner@gmail.com Práticas em Business Analytics ......
  • 3. 3 / 26 Sumário ● O que é Data Science? ● Problemas e fatores de sucesso em projetos de Business Analytics ● Processos – Data Analytics Lifecycle ● Formação do time ......
  • 4. 4 / 26 Ciência da Computação Conhecimento do domínio Definição: Data Science ● É a área que reune tudo relacionado ao tratamento, preparação e análise de dados. ● É um guarda-chuva de técnicas usadas para extrair insights e informações dos dados. Matemática Estatística Banco de Dados Aprendizado de Máquina Data Science......
  • 5. 5 / 26 FONTE: http://digitally.cognizant.com/data-science-the-new-monetization-model-for-analytics-industry-3/ Data Science x BI ......
  • 6. 6 / 26 “Somente 27% dos projetos de Big Data Analytics tem sucesso” Fonte: CapGemeni – Big Data Survey 2014 Data Science não acontece do nada…Data Science não acontece do nada… ......
  • 7. 7 / 26 Alguns problemas em projetos Dados dispersos em silos de diferentes áreas Falta de um caso de uso de negócios claro Ineficiência na coordenação dos times envolvidos na análise de dados da organização Dependência de sistemas legados para gestão e processamento de dados Falta de modelos de governança para analytics Falta de patrocinador da alta gerência Falta de habilidade em analytics e big data Falta de clareza nas ferramentas e tecnologias Custo das ferramentas e infraestruturas para analytics Preocupação com segurança e privacidade de dados Resistência a mudança na organização ......
  • 8. 8 / 26 Alguns fatores de sucesso ✔ Roadmap estratégico (proposta de valor) ✔ Seleção de caso de uso ✔ Métricas de sucesso (Key Performance Indicators - KPIs) https://www.capgemini.com/wp-content/uploads/sites/30/2015/01/Cracking-the-data-conundrum-infographic.pdf Projeto Equipe ......
  • 9. 9 / 26 Alguns fatores de sucesso ✔ Roadmap estratégico (proposta de valor) ✔ Seleção de caso de uso ✔ Métricas de sucesso (Key Performance Indicators - KPIs) https://www.capgemini.com/wp-content/uploads/sites/30/2015/01/Cracking-the-data-conundrum-infographic.pdf Projeto Equipe PROCESSO ......
  • 11. 11 / 26 Processos para Data Science ● KDD ● CRISP-DM ● SEMMA ● Data Analytics Lifecycle ......
  • 12. 12 / 26 Knowledge Discovery in Databases (KDD) ● Mais antiga (1996) ● Foco na transformação de dados em informação FONTE: FAYYAD, Usama; PIATETSKY-SHAPIRO, Gregory; SMYTH, Padhraic. From data mining to knowledge discovery: An overview. In: Advances in Knowledge Discovery and Data Mining, AAAI Press/The MIT Press, England, 1996, p.1-34. ......
  • 13. 13 / 26 Cross Industry Standard Process for Data Mining (CRISP-DM) ● Existe desde 1996; ● Oficializado por um consórcio financiado pela comissão européia em 2000, com Daimler Chrysler (then Daimler-Benz), SPSS (then ISL) , NCR; (Veteranos em Data Mining) ● Mais de 200 organizacões contribuíram no processo. FONTE: Chapman et al., 2000. https://www.the-modeling-agency.com/crisp-dm.pdf ......
  • 14. 14 / 26 Sample, Explore, Modify, Model e Assess  (SEMMA) ● Criada pela SAS em 2008; ● Processo que guia um passo a passo do software SAS Enterprise Miner; Fonte: http://faculty.smu.edu/tfomby/eco5385_eco6380/data/SPSS/SAS%20_%20SEMMA.pdf https://paulovasconcellos.com.br/crisp-dm-semma-e-kdd-conheça-as-melhores-técnicas-para-exploração-de-dados-560d294547d2 ......
  • 15. 15 / 26 Data Analytics Lifecycle ● Proposto pela EMC (2015) ● Framework que reune melhores práticas dos modelos existentes: método científico, CRISP- DM, DELTA, Applied information economics approach e MadSkills. FONTE: EMC Education (2015). Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data (1 ed.). Hoboken, New Jersey: Wiley. ......
  • 16. 16 / 26 Data Analytics Lifecycle Fase 1: Descoberta ● Entender o negócio; ● Mapear recursos: pessoas, tecnologia, dados, tempo e prazos; – Identificar potenciais fontes de dados; ● Entender o problema a ser resolvido com analytics; Pensar no problema como um desafio de analytics; ● Identificar stakeholders e seus interesses no projeto; ● Definir critérios de sucesso e riscos; ● Desenvolver hipóteses iniciais a serem testadas com dados; ......
  • 17. 17 / 26 Data Analytics Lifecycle Fase 1: Descoberta ● Sugestões de recursos que podem ser usados nesta fase: – Plano de negócios (ou BM Canvas): conhecimento do negócio, proposta de valor e pontos chave de geração e uso de dados etc; – Mapa estratégico: objetivos organizacionais, processos chave etc; – Processos organizacionais e organograma: identificar áreas geradoras, mantenedoras e consumidoras de dados e potenciais consumidores do resultado do analytics; – Entrevistas: sponsor do projeto, stakeholders e especialistas no domínio para identificar requisitos, riscos e critérios de sucesso; – Entre outros. ......
  • 18. 18 / 26 Data Analytics Lifecycle Fase 2: Preparação dos Dados ● Explorar os dados: – Identificar bases de dados internas e externas; – Entender os dados e formatação; – Identificar ruídos e problemas (gaps, erros etc); ● Usar uma sandbox para mexer nos dados sem interferir nos dados de produção; ● Executar ETL: Extract, Transform and Load; – Limpeza, normalização e transformações; – Recarregar os dados de volta; ......
  • 19. 19 / 26 ● Sugestões de recursos que podem ser usados nesta fase: – Inventário de dados: para identificar potenciais fontes de dados; – Dicionário de dados: organização dos metadados das bases de dados a serem utilizadas com descrição dos campos e tipos de dados; – Entre outros. Data Analytics Lifecycle Fase 2: Preparação dos Dados Ex: inventário Ex: dicionário ......
  • 20. 20 / 26 Data Analytics Lifecycle Fase 3: Planejamento do Modelo ● Identificar candidatos de modelos; ● Avaliar as bases de dados e os objetivos do projeto, para identificar potenciais técnicas de analytics que possam ser aplicadas: classificação, clustering, associação etc; – uma técnica ou um conjunto delas (encadeadas); – ferramentas; ● Garantir que o(s) modelo(s) escolhido(s) viabilize o alcance dos objetivos de negócio e valide as hipóteses; ......
  • 21. 21 / 26 Data Analytics Lifecycle Fase 3: Planejamento do Modelo ● Com base nos dados e nos objetivos, identificar o tipo de análise mais adequada: – Descritiva: é visualizar os dados de forma mais dinâmica, entendendo como se organizam e qual seu comportamento no presente; ● Ex: quais doenças ocorrem, quais perfis de pacientes etc. – Diagnóstica: compreender de maneira causal (Quem, Quando, Como, Onde e Por que) todas as suas possibilidades; ● Ex: onde no país estão ocorrendo menos vendas de plano de saúde, em quais conveniados, e por que; – Preditiva: “prever” o futuro, usa mineração de dados, dados estatísticos e dados históricos para conhecer as futuras tendências; ● Ex: os gestores dos planos de saúde podem traçar padrões de comportamento de determinados pacientes, a partir de dados históricos e prever futuras doenças em outros pacientes; – Prescritiva: enquanto a análise preditiva identifica tendências futuras, a prescritiva também traça as possíveis consequências de cada ação; ● Ex: analisar possíveis impactos de ações sobre um grupo de risco, analisando qual a melhor opção de gestão para eles. ......
  • 22. 22 / 26 Data Analytics Lifecycle Fase 4: Construção do Modelo ● Buscar/construir/desenvolver o modelo; ● Validar o modelo: – Conjunto de treinamento x conjunto de teste; – Técnica de validação: ● Ex: Validação cruzada (K-Fold) – Métrica de sucesso; ● Ferramentas: R, Weka, SPSS Modeler, Matlab, Python etc. ● Perguntas a responder: ......
  • 23. 23 / 26 Data Analytics Lifecycle Fase 5: Comunicar Resultados ● Tenha uma história para contar (storytelling), encadeando os achados; ● Comunicar os resultados positivos e até mesmo os fracassos; ● Verificar se os resultados são estatisticamente relevantes; ● Mapear o valor / impacto dos resultados para o negócio; ● Faça recomendações de lições aprendidas/melhores práticas; – Insights para futuras análises; – Planos futuros de uso, evolução do modelo/análise; ......
  • 24. 24 / 26 Data Analytics Lifecycle Fase 6: Operacionalizar ● Planeje um piloto do projeto, num experimento controlado, antes de abrir para a empresa como um todo; ● Já utilize as infraestruturas definitivas para testar a velocidade e robustez de processamento; ......
  • 25. 25 / 26 Formação do Time ......
  • 26. 26 / 26 Bibliografia EMC Education (2015) Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data  (1 ed.). Hoboken, New Jersey: Wiley. ......