SlideShare uma empresa Scribd logo
1 de 37
Bio
● Bacharel em Ciência da
Computação - UFAM
● Mestre em Informática - UFAM
○ Ênfase em Sistemas de
Recomendação
● Pesquisa em Detecção de
Rotina
● Atuando em Data Science desde
2017 e em Machine Learning
desde 2011!
● AI Engineer na Bemol Digital <3
Uma Humaitaense em Cape
Town!
3
ATENÇÃO!
Esta apresentação não se trata de certo vs. errado ou melhor vs. pior,
são apenas visões diferentes!
A direção. 😂
4
Pipeline de Machine Learning
5
Definição do
problema
Coleta e
Entendimento de
Dados
Modelagem
Apresentação dos
Resultados
Lançar
abordagem
Pipeline de Machine Learning
6
Entendimento do
negócio
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
Na Indústria
Pipeline de Machine Learning
7
Entendimento do
negócio
Coleta e
Entendimento de
Dados
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos dados
● Mapear fluxo dos dados
● Limpar, transformar,
explorar
Na Indústria
Pipeline de Machine Learning
8
Entendimento do
negócio
Coleta e
Entendimento de
Dados
Modelagem
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos dados
● Mapear fluxo dos dados
● Limpar, transformar,
explorar
● Engenharia de atributos
● Modelo de treinamento
● Métricas de avaliação e
validação
Na Indústria
Pipeline de Machine Learning
9
Entendimento do
negócio
Coleta e
Entendimento de
Dados
Modelagem
Apresentação dos
Resultados
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos dados
● Mapear fluxo dos dados
● Limpar, transformar,
explorar
● Engenharia de atributos
● Modelo de treinamento
● Métricas de avaliação e
validação
● Como funciona o modelo?
● Perfomance em métricas
de negócio
● Sugestões de uso
Na Indústria
Pipeline de Machine Learning
10
Entendimento do
negócio
Coleta e
Entendimento de
Dados
Modelagem
Apresentação dos
Resultados
Implantação
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos dados
● Mapear fluxo dos dados
● Limpar, transformar,
explorar
● Engenharia de atributos
● Modelo de treinamento
● Métricas de avaliação e
validação
● Como funciona o modelo?
● Perfomance em métricas
de negócio
● Sugestões de uso
● API performance
● Distribuição, calibragem
● Monitoramento
Na Indústria
Pipeline de Machine Learning
11
Entendimento do
negócio
Coleta e
Entendimento de
Dados
Modelagem
Apresentação dos
Resultados
Implantação
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos dados
● Mapear fluxo dos dados
● Limpar, transformar,
explorar
● Engenharia de atributos
● Modelo de treinamento
● Métricas de avaliação e
validação
● Como funciona o modelo?
● Perfomance em métricas
de negócio
● Sugestões de uso
● API performance
● Distribuição, calibragem
● Monitoramento
Na Academia
Definição de Problema,
Hipóteses, Questões de
Pesquisa e Objetivos
● Qual problema quero
resolver que 1) ou ainda não
foi resolvido 2) ou não o foi
sob um prisma diferente?
● O que quero obter ao final
deste trabalho?
Pipeline de Machine Learning
12
Na Academia
Definição de Problema,
Hipóteses, Questões de
Pesquisa e Objetivos
● Qual problema quero
resolver que 1) ou ainda não
foi resolvido 2) ou não o foi
sob um prisma diferente?
● O que quero obter ao final
deste trabalho?
* Imagens da própria
Pipeline de Machine Learning
13
Entendimento do
negócio
Coleta e
Entendimento de
Dados
Modelagem
Apresentação dos
Resultados
Implantação
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos dados
● Mapear fluxo dos dados
● Limpar, transformar,
explorar
● Engenharia de atributos
● Modelo de treinamento
● Métricas de avaliação e
validação
● Como funciona o modelo?
● Perfomance em métricas
de negócio
● Sugestões de uso
● API performance
● Distribuição, calibragem
● Monitoramento
Na Academia
Definição de Problema,
Hipóteses, Questões de
Pesquisa e Objetivos
● Qual problema quero
resolver que 1) ou ainda não
foi resolvido 2) ou não o foi
sob um prisma diferente?
● O que quero obter ao final
deste trabalho?
Coleta e Estudo sobre
coleções de dados
● Quais datasets são usados
pelos trabalhos da literatura?
Pipeline de Machine Learning
14
Na Academia
Coleta e Estudo sobre
coleções de dados
● Quais datasets são usados
pelos trabalhos da literatura?
* Imagens da própria
Pipeline de Machine Learning
15
Entendimento do
negócio
Coleta e
Entendimento de
Dados
Modelagem
Apresentação dos
Resultados
Implantação
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos dados
● Mapear fluxo dos dados
● Limpar, transformar,
explorar
● Engenharia de atributos
● Modelo de treinamento
● Métricas de avaliação e
validação
● Como funciona o modelo?
● Perfomance em métricas
de negócio
● Sugestões de uso
● API performance
● Distribuição, calibragem
● Monitoramento
Na Academia
Definição de Problema,
Hipóteses, Questões de
Pesquisa e Objetivos
● Qual problema quero
resolver que 1) ou ainda não
foi resolvido 2) ou não o foi
sob um prisma diferente?
● O que quero obter ao final
deste trabalho?
Coleta e Estudo sobre
coleções de dados
● Quais datasets são usados
pelos trabalhos da literatura?
Implementação de
baselines e novo modelo
proposto
● Implementa modelo estado-
da-arte para comparação
com novo modelo proposto.
Pipeline de Machine Learning
16
Na Academia
Implementação de
baselines e novo modelo
proposto
● Implementa modelo estado-
da-arte para comparação
com novo modelo proposto.
Baseline estado-da-arte
no problema
Nova arquitetura proposta
Melhor que
* Imagens da própria
Pipeline de Machine Learning
17
Entendimento do
negócio
Coleta e
Entendimento de
Dados
Modelagem
Apresentação dos
Resultados
Implantação
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos dados
● Mapear fluxo dos dados
● Limpar, transformar,
explorar
● Engenharia de atributos
● Modelo de treinamento
● Métricas de avaliação e
validação
● Como funciona o modelo?
● Perfomance em métricas
de negócio
● Sugestões de uso
● API performance
● Distribuição, calibragem
● Monitoramento
Na Academia
Definição de Problema,
Hipóteses, Questões de
Pesquisa e Objetivos
● Qual problema quero
resolver que 1) ou ainda não
foi resolvido 2) ou não o foi
sob um prisma diferente?
● O que quero obter ao final
deste trabalho?
Coleta e Estudo sobre
coleções de dados
● Quais datasets são usados
pelos trabalhos da literatura?
Implementação de
baselines e novo modelo
proposto
● Implementa modelo estado-
da-arte para comparação
com novo modelo proposto.
Defesa de proposta
abordagem
● Apresenta resultados parciais
à comunidade acadêmica
especializada.
Pipeline de Machine Learning
18
Na Academia
Defesa de proposta
abordagem
● Apresenta resultados parciais
à comunidade acadêmica
especializada.
* Imagens da própria
Pipeline de Machine Learning
19
Entendimento do
negócio
Coleta e
Entendimento de
Dados
Modelagem
Apresentação dos
Resultados
Implantação
● Qual a dor?
● Por que é uma dor?
● Quais métricas de
negócio queremos
impactar?
● Mapear fonte dos dados
● Mapear fluxo dos dados
● Limpar, transformar,
explorar
● Engenharia de atributos
● Modelo de treinamento
● Métricas de avaliação e
validação
● Como funciona o modelo?
● Perfomance em métricas
de negócio
● Sugestões de uso
● API performance
● Distribuição, calibragem
● Monitoramento
Na Academia
Definição de Problema,
Hipóteses, Questões de
Pesquisa e Objetivos
● Qual problema quero
resolver que 1) ou ainda não
foi resolvido 2) ou não o foi
sob um prisma diferente?
● O que quero obter ao final
deste trabalho?
Coleta e Estudo sobre
coleções de dados
● Quais datasets são usados
pelos trabalhos da literatura?
Implementação de
baselines e novo modelo
proposto
● Implementa modelo estado-
da-arte para comparação
com novo modelo proposto.
Defesa de proposta
abordagem
● Apresenta resultados parciais
à comunidade acadêmica
especializada.
Publicação de artigos e
jornais
● Apresenta nova abordagem
proposta para revisão por
pares por pesquisadores
especialistas.
Pipeline de Machine Learning
20
Na Academia
Publicação de artigos e
jornais
● Apresenta nova abordagem
proposta para revisão por
pares por pesquisadores
especialistas.
* Imagens da própria
Importante!
Grandes empresas, i.e., Google, fazem pesquisa também, mas não é a
realidade da maioria das empresas e é sobre essa realidade que
estamos tratando aqui.
A direção.
21
E o que acontece ali
no dia-a-dia? Um
exemplo Bemol
Segmentação de Clientes
Objetivo
• Fornecer insights inteligentes para prever o comportamento de compra do consumidor e padrões
relacionados durante todo o ciclo de vida das transações comerciais.
• Ajudar na construção de um relacionamento saudável e de longo prazo com os Clientes.
23
Estágio da
jornada
Comportamento
de compra
Satisfação Interesses Nível de
engajamento
* Contém imagem de pesquisa no Google.
Segmentação de Clientes
24
Clientes
* Contém imagem de pesquisa no Google.
Segmentação de Clientes
25
Alta frequência de compras
Alto valor monetário
Compras recentes
Alto valor
monetário
Compras distantes
Baixa frequência
Baixo valor monetário
Compras recentes
Clientes
Abordagem RFM:
● Recency
● Frequency
● Monetary
* Contém imagem de pesquisa no Google.
Segmentação de Clientes
26
Alta frequência de compras
Alto valor monetário
Compras recentes
Alto valor
monetário
Compras distantes
Baixa frequência
Baixo valor monetário
Compras recentes
Clientes Método de Clustering
(não-supervisionado)
i.e., k-Means
Abordagem RFM:
● Recency
● Frequency
● Monetary
Entrada
* Contém imagem de pesquisa no Google.
Segmentação de Clientes
27
Suposição comum na academia…
(expectativa)
Distribuição Normal
* Contém imagem de pesquisa no Google.
Segmentação de Clientes
28
Suposição comum na academia…
(expectativa)
Distribuição Normal
Na indústria
(realidade)
* Contém imagem de pesquisa no Google.
Segmentação de Clientes
29
Método de Clustering
(não-supervisionado)
i.e., k-Means
* Contém imagem de pesquisa no Google.
Segmentação de Clientes
30
Método de Clustering
(não-supervisionado)
i.e., k-Means
Impossível de resolver adequadamente com k-means!
Aqui entra o conhecimento sobre o negócio!
* Contém imagem de pesquisa no Google.
31
POLÊMICA!!!
Quando a academia ignora a realidade...
32
* Imagens da própria
Quando a academia ignora a realidade...
33
Além do claro problema de racismo, outro problema é que
uma arquitetura inteira foi totalmente construída
considerando dados sub representados! Na vida real ela pode
não se sair tão bem.
Consequências
* Imagens da própria
Quando a indústria dificulta para a
academia...
34
* Imagens da própria
Quando a indústria dificulta para a
academia...
35
Consequências
● Modelos quase que impossíveis de serem reproduzidos no meio acadêmico (falando
a nível de Brasil)
○ Máquinas para treinamento são caras
● Base de dados imensas e restritas às empresas
● Etc.
* Imagens da própria
No fim, é só setarmos
corretamente as expectativas em
cada contexto.
36
E-mail: ludigoncalves.11@gmail.com
Linkedin: www.linkedin.com/in/ludimilagonçalves
Github: github.com/ludigoncalves
Obrigada galeris!!
o/ o// <o> <o/

Mais conteúdo relacionado

Semelhante a Bio e carreira de especialista em ML e DS

Mapeamento de processos
Mapeamento de processosMapeamento de processos
Mapeamento de processosFabio Baccoli
 
TDC SP 2018 - Métricas e Analytics de Produtos em Sistemas B2B
TDC SP 2018 - Métricas e Analytics de Produtos em Sistemas B2BTDC SP 2018 - Métricas e Analytics de Produtos em Sistemas B2B
TDC SP 2018 - Métricas e Analytics de Produtos em Sistemas B2BRafael Targino
 
TDC2018SP | Trilha Gestao de Produto - Como Comecar com Metricas e Analytics ...
TDC2018SP | Trilha Gestao de Produto - Como Comecar com Metricas e Analytics ...TDC2018SP | Trilha Gestao de Produto - Como Comecar com Metricas e Analytics ...
TDC2018SP | Trilha Gestao de Produto - Como Comecar com Metricas e Analytics ...tdc-globalcode
 
FERRAMENTAS DE TRABALHO.pptx
FERRAMENTAS DE TRABALHO.pptxFERRAMENTAS DE TRABALHO.pptx
FERRAMENTAS DE TRABALHO.pptxAmarildoJosMorett
 
Aguiar baklizky-modelos de-negocio_baseados_em_pf
Aguiar baklizky-modelos de-negocio_baseados_em_pfAguiar baklizky-modelos de-negocio_baseados_em_pf
Aguiar baklizky-modelos de-negocio_baseados_em_pfAgenor Barbosa
 
3ª conferência medindo software no mercado brasileiro - a experiência da ti...
3ª conferência   medindo software no mercado brasileiro - a experiência da ti...3ª conferência   medindo software no mercado brasileiro - a experiência da ti...
3ª conferência medindo software no mercado brasileiro - a experiência da ti...Agenor Barbosa
 
Gap analysis - Análise de Lacunas
Gap analysis - Análise de LacunasGap analysis - Análise de Lacunas
Gap analysis - Análise de LacunasRui Loureiro
 
Ferramentas de gestao lean primeira e segunda aulas
Ferramentas de gestao lean   primeira e segunda aulasFerramentas de gestao lean   primeira e segunda aulas
Ferramentas de gestao lean primeira e segunda aulasClaudio Bernardi Stringari
 
Impacto da modelagem de decisões no gerenciamento de projetos
Impacto da modelagem de decisões no gerenciamento de projetosImpacto da modelagem de decisões no gerenciamento de projetos
Impacto da modelagem de decisões no gerenciamento de projetosCentus Consultoria
 
Web aula 49 - Utilizando Análise de Pontos de Função em Projetos Ágeis
Web aula 49 - Utilizando Análise de Pontos de Função em Projetos ÁgeisWeb aula 49 - Utilizando Análise de Pontos de Função em Projetos Ágeis
Web aula 49 - Utilizando Análise de Pontos de Função em Projetos ÁgeisProjetos e TI
 
Workshop sobre modelos de negocio (canvas) Empreenda-2015 no Insper
Workshop sobre modelos de negocio (canvas) Empreenda-2015 no InsperWorkshop sobre modelos de negocio (canvas) Empreenda-2015 no Insper
Workshop sobre modelos de negocio (canvas) Empreenda-2015 no InsperNei Grando
 
Curso de Google anaytics Avancado
Curso de Google anaytics AvancadoCurso de Google anaytics Avancado
Curso de Google anaytics Avancadoaluni_ead
 
Concepção e desenvolvimento de projectos 6 sigma
Concepção e desenvolvimento de projectos 6 sigmaConcepção e desenvolvimento de projectos 6 sigma
Concepção e desenvolvimento de projectos 6 sigmaCarlos Neves
 
Modelagem de Sistemas de Informação
Modelagem de Sistemas de InformaçãoModelagem de Sistemas de Informação
Modelagem de Sistemas de InformaçãoHelder Lopes
 
Capacitação em Design Thinking na Gestão de Processos - ADDTECH e Enjourney
Capacitação em Design Thinking na Gestão de Processos - ADDTECH e EnjourneyCapacitação em Design Thinking na Gestão de Processos - ADDTECH e Enjourney
Capacitação em Design Thinking na Gestão de Processos - ADDTECH e Enjourney.add
 

Semelhante a Bio e carreira de especialista em ML e DS (20)

Mapeamento de processos
Mapeamento de processosMapeamento de processos
Mapeamento de processos
 
TDC SP 2018 - Métricas e Analytics de Produtos em Sistemas B2B
TDC SP 2018 - Métricas e Analytics de Produtos em Sistemas B2BTDC SP 2018 - Métricas e Analytics de Produtos em Sistemas B2B
TDC SP 2018 - Métricas e Analytics de Produtos em Sistemas B2B
 
TDC2018SP | Trilha Gestao de Produto - Como Comecar com Metricas e Analytics ...
TDC2018SP | Trilha Gestao de Produto - Como Comecar com Metricas e Analytics ...TDC2018SP | Trilha Gestao de Produto - Como Comecar com Metricas e Analytics ...
TDC2018SP | Trilha Gestao de Produto - Como Comecar com Metricas e Analytics ...
 
FERRAMENTAS DE TRABALHO.pptx
FERRAMENTAS DE TRABALHO.pptxFERRAMENTAS DE TRABALHO.pptx
FERRAMENTAS DE TRABALHO.pptx
 
Aguiar baklizky-modelos de-negocio_baseados_em_pf
Aguiar baklizky-modelos de-negocio_baseados_em_pfAguiar baklizky-modelos de-negocio_baseados_em_pf
Aguiar baklizky-modelos de-negocio_baseados_em_pf
 
3ª conferência medindo software no mercado brasileiro - a experiência da ti...
3ª conferência   medindo software no mercado brasileiro - a experiência da ti...3ª conferência   medindo software no mercado brasileiro - a experiência da ti...
3ª conferência medindo software no mercado brasileiro - a experiência da ti...
 
Gap analysis - Análise de Lacunas
Gap analysis - Análise de LacunasGap analysis - Análise de Lacunas
Gap analysis - Análise de Lacunas
 
Aula 01.pptx
Aula 01.pptxAula 01.pptx
Aula 01.pptx
 
Aula04
Aula04Aula04
Aula04
 
Ferramentas de gestao lean primeira e segunda aulas
Ferramentas de gestao lean   primeira e segunda aulasFerramentas de gestao lean   primeira e segunda aulas
Ferramentas de gestao lean primeira e segunda aulas
 
Impacto da modelagem de decisões no gerenciamento de projetos
Impacto da modelagem de decisões no gerenciamento de projetosImpacto da modelagem de decisões no gerenciamento de projetos
Impacto da modelagem de decisões no gerenciamento de projetos
 
Web aula 49 - Utilizando Análise de Pontos de Função em Projetos Ágeis
Web aula 49 - Utilizando Análise de Pontos de Função em Projetos ÁgeisWeb aula 49 - Utilizando Análise de Pontos de Função em Projetos Ágeis
Web aula 49 - Utilizando Análise de Pontos de Função em Projetos Ágeis
 
Workshop sobre modelos de negocio (canvas) Empreenda-2015 no Insper
Workshop sobre modelos de negocio (canvas) Empreenda-2015 no InsperWorkshop sobre modelos de negocio (canvas) Empreenda-2015 no Insper
Workshop sobre modelos de negocio (canvas) Empreenda-2015 no Insper
 
Aceleradora 1 Encontro
Aceleradora 1 Encontro Aceleradora 1 Encontro
Aceleradora 1 Encontro
 
Curso de Google anaytics Avancado
Curso de Google anaytics AvancadoCurso de Google anaytics Avancado
Curso de Google anaytics Avancado
 
BABOK ou CBOK
BABOK ou CBOKBABOK ou CBOK
BABOK ou CBOK
 
Concepção e desenvolvimento de projectos 6 sigma
Concepção e desenvolvimento de projectos 6 sigmaConcepção e desenvolvimento de projectos 6 sigma
Concepção e desenvolvimento de projectos 6 sigma
 
Modelagem de Sistemas de Informação
Modelagem de Sistemas de InformaçãoModelagem de Sistemas de Informação
Modelagem de Sistemas de Informação
 
Capacitação em Design Thinking na Gestão de Processos - ADDTECH e Enjourney
Capacitação em Design Thinking na Gestão de Processos - ADDTECH e EnjourneyCapacitação em Design Thinking na Gestão de Processos - ADDTECH e Enjourney
Capacitação em Design Thinking na Gestão de Processos - ADDTECH e Enjourney
 
Webanalytics uma visao_brasileira_2
Webanalytics uma visao_brasileira_2Webanalytics uma visao_brasileira_2
Webanalytics uma visao_brasileira_2
 

Bio e carreira de especialista em ML e DS

  • 1.
  • 2.
  • 3. Bio ● Bacharel em Ciência da Computação - UFAM ● Mestre em Informática - UFAM ○ Ênfase em Sistemas de Recomendação ● Pesquisa em Detecção de Rotina ● Atuando em Data Science desde 2017 e em Machine Learning desde 2011! ● AI Engineer na Bemol Digital <3 Uma Humaitaense em Cape Town! 3
  • 4. ATENÇÃO! Esta apresentação não se trata de certo vs. errado ou melhor vs. pior, são apenas visões diferentes! A direção. 😂 4
  • 5. Pipeline de Machine Learning 5 Definição do problema Coleta e Entendimento de Dados Modelagem Apresentação dos Resultados Lançar abordagem
  • 6. Pipeline de Machine Learning 6 Entendimento do negócio ● Qual a dor? ● Por que é uma dor? ● Quais métricas de negócio queremos impactar? Na Indústria
  • 7. Pipeline de Machine Learning 7 Entendimento do negócio Coleta e Entendimento de Dados ● Qual a dor? ● Por que é uma dor? ● Quais métricas de negócio queremos impactar? ● Mapear fonte dos dados ● Mapear fluxo dos dados ● Limpar, transformar, explorar Na Indústria
  • 8. Pipeline de Machine Learning 8 Entendimento do negócio Coleta e Entendimento de Dados Modelagem ● Qual a dor? ● Por que é uma dor? ● Quais métricas de negócio queremos impactar? ● Mapear fonte dos dados ● Mapear fluxo dos dados ● Limpar, transformar, explorar ● Engenharia de atributos ● Modelo de treinamento ● Métricas de avaliação e validação Na Indústria
  • 9. Pipeline de Machine Learning 9 Entendimento do negócio Coleta e Entendimento de Dados Modelagem Apresentação dos Resultados ● Qual a dor? ● Por que é uma dor? ● Quais métricas de negócio queremos impactar? ● Mapear fonte dos dados ● Mapear fluxo dos dados ● Limpar, transformar, explorar ● Engenharia de atributos ● Modelo de treinamento ● Métricas de avaliação e validação ● Como funciona o modelo? ● Perfomance em métricas de negócio ● Sugestões de uso Na Indústria
  • 10. Pipeline de Machine Learning 10 Entendimento do negócio Coleta e Entendimento de Dados Modelagem Apresentação dos Resultados Implantação ● Qual a dor? ● Por que é uma dor? ● Quais métricas de negócio queremos impactar? ● Mapear fonte dos dados ● Mapear fluxo dos dados ● Limpar, transformar, explorar ● Engenharia de atributos ● Modelo de treinamento ● Métricas de avaliação e validação ● Como funciona o modelo? ● Perfomance em métricas de negócio ● Sugestões de uso ● API performance ● Distribuição, calibragem ● Monitoramento Na Indústria
  • 11. Pipeline de Machine Learning 11 Entendimento do negócio Coleta e Entendimento de Dados Modelagem Apresentação dos Resultados Implantação ● Qual a dor? ● Por que é uma dor? ● Quais métricas de negócio queremos impactar? ● Mapear fonte dos dados ● Mapear fluxo dos dados ● Limpar, transformar, explorar ● Engenharia de atributos ● Modelo de treinamento ● Métricas de avaliação e validação ● Como funciona o modelo? ● Perfomance em métricas de negócio ● Sugestões de uso ● API performance ● Distribuição, calibragem ● Monitoramento Na Academia Definição de Problema, Hipóteses, Questões de Pesquisa e Objetivos ● Qual problema quero resolver que 1) ou ainda não foi resolvido 2) ou não o foi sob um prisma diferente? ● O que quero obter ao final deste trabalho?
  • 12. Pipeline de Machine Learning 12 Na Academia Definição de Problema, Hipóteses, Questões de Pesquisa e Objetivos ● Qual problema quero resolver que 1) ou ainda não foi resolvido 2) ou não o foi sob um prisma diferente? ● O que quero obter ao final deste trabalho? * Imagens da própria
  • 13. Pipeline de Machine Learning 13 Entendimento do negócio Coleta e Entendimento de Dados Modelagem Apresentação dos Resultados Implantação ● Qual a dor? ● Por que é uma dor? ● Quais métricas de negócio queremos impactar? ● Mapear fonte dos dados ● Mapear fluxo dos dados ● Limpar, transformar, explorar ● Engenharia de atributos ● Modelo de treinamento ● Métricas de avaliação e validação ● Como funciona o modelo? ● Perfomance em métricas de negócio ● Sugestões de uso ● API performance ● Distribuição, calibragem ● Monitoramento Na Academia Definição de Problema, Hipóteses, Questões de Pesquisa e Objetivos ● Qual problema quero resolver que 1) ou ainda não foi resolvido 2) ou não o foi sob um prisma diferente? ● O que quero obter ao final deste trabalho? Coleta e Estudo sobre coleções de dados ● Quais datasets são usados pelos trabalhos da literatura?
  • 14. Pipeline de Machine Learning 14 Na Academia Coleta e Estudo sobre coleções de dados ● Quais datasets são usados pelos trabalhos da literatura? * Imagens da própria
  • 15. Pipeline de Machine Learning 15 Entendimento do negócio Coleta e Entendimento de Dados Modelagem Apresentação dos Resultados Implantação ● Qual a dor? ● Por que é uma dor? ● Quais métricas de negócio queremos impactar? ● Mapear fonte dos dados ● Mapear fluxo dos dados ● Limpar, transformar, explorar ● Engenharia de atributos ● Modelo de treinamento ● Métricas de avaliação e validação ● Como funciona o modelo? ● Perfomance em métricas de negócio ● Sugestões de uso ● API performance ● Distribuição, calibragem ● Monitoramento Na Academia Definição de Problema, Hipóteses, Questões de Pesquisa e Objetivos ● Qual problema quero resolver que 1) ou ainda não foi resolvido 2) ou não o foi sob um prisma diferente? ● O que quero obter ao final deste trabalho? Coleta e Estudo sobre coleções de dados ● Quais datasets são usados pelos trabalhos da literatura? Implementação de baselines e novo modelo proposto ● Implementa modelo estado- da-arte para comparação com novo modelo proposto.
  • 16. Pipeline de Machine Learning 16 Na Academia Implementação de baselines e novo modelo proposto ● Implementa modelo estado- da-arte para comparação com novo modelo proposto. Baseline estado-da-arte no problema Nova arquitetura proposta Melhor que * Imagens da própria
  • 17. Pipeline de Machine Learning 17 Entendimento do negócio Coleta e Entendimento de Dados Modelagem Apresentação dos Resultados Implantação ● Qual a dor? ● Por que é uma dor? ● Quais métricas de negócio queremos impactar? ● Mapear fonte dos dados ● Mapear fluxo dos dados ● Limpar, transformar, explorar ● Engenharia de atributos ● Modelo de treinamento ● Métricas de avaliação e validação ● Como funciona o modelo? ● Perfomance em métricas de negócio ● Sugestões de uso ● API performance ● Distribuição, calibragem ● Monitoramento Na Academia Definição de Problema, Hipóteses, Questões de Pesquisa e Objetivos ● Qual problema quero resolver que 1) ou ainda não foi resolvido 2) ou não o foi sob um prisma diferente? ● O que quero obter ao final deste trabalho? Coleta e Estudo sobre coleções de dados ● Quais datasets são usados pelos trabalhos da literatura? Implementação de baselines e novo modelo proposto ● Implementa modelo estado- da-arte para comparação com novo modelo proposto. Defesa de proposta abordagem ● Apresenta resultados parciais à comunidade acadêmica especializada.
  • 18. Pipeline de Machine Learning 18 Na Academia Defesa de proposta abordagem ● Apresenta resultados parciais à comunidade acadêmica especializada. * Imagens da própria
  • 19. Pipeline de Machine Learning 19 Entendimento do negócio Coleta e Entendimento de Dados Modelagem Apresentação dos Resultados Implantação ● Qual a dor? ● Por que é uma dor? ● Quais métricas de negócio queremos impactar? ● Mapear fonte dos dados ● Mapear fluxo dos dados ● Limpar, transformar, explorar ● Engenharia de atributos ● Modelo de treinamento ● Métricas de avaliação e validação ● Como funciona o modelo? ● Perfomance em métricas de negócio ● Sugestões de uso ● API performance ● Distribuição, calibragem ● Monitoramento Na Academia Definição de Problema, Hipóteses, Questões de Pesquisa e Objetivos ● Qual problema quero resolver que 1) ou ainda não foi resolvido 2) ou não o foi sob um prisma diferente? ● O que quero obter ao final deste trabalho? Coleta e Estudo sobre coleções de dados ● Quais datasets são usados pelos trabalhos da literatura? Implementação de baselines e novo modelo proposto ● Implementa modelo estado- da-arte para comparação com novo modelo proposto. Defesa de proposta abordagem ● Apresenta resultados parciais à comunidade acadêmica especializada. Publicação de artigos e jornais ● Apresenta nova abordagem proposta para revisão por pares por pesquisadores especialistas.
  • 20. Pipeline de Machine Learning 20 Na Academia Publicação de artigos e jornais ● Apresenta nova abordagem proposta para revisão por pares por pesquisadores especialistas. * Imagens da própria
  • 21. Importante! Grandes empresas, i.e., Google, fazem pesquisa também, mas não é a realidade da maioria das empresas e é sobre essa realidade que estamos tratando aqui. A direção. 21
  • 22. E o que acontece ali no dia-a-dia? Um exemplo Bemol
  • 23. Segmentação de Clientes Objetivo • Fornecer insights inteligentes para prever o comportamento de compra do consumidor e padrões relacionados durante todo o ciclo de vida das transações comerciais. • Ajudar na construção de um relacionamento saudável e de longo prazo com os Clientes. 23 Estágio da jornada Comportamento de compra Satisfação Interesses Nível de engajamento * Contém imagem de pesquisa no Google.
  • 24. Segmentação de Clientes 24 Clientes * Contém imagem de pesquisa no Google.
  • 25. Segmentação de Clientes 25 Alta frequência de compras Alto valor monetário Compras recentes Alto valor monetário Compras distantes Baixa frequência Baixo valor monetário Compras recentes Clientes Abordagem RFM: ● Recency ● Frequency ● Monetary * Contém imagem de pesquisa no Google.
  • 26. Segmentação de Clientes 26 Alta frequência de compras Alto valor monetário Compras recentes Alto valor monetário Compras distantes Baixa frequência Baixo valor monetário Compras recentes Clientes Método de Clustering (não-supervisionado) i.e., k-Means Abordagem RFM: ● Recency ● Frequency ● Monetary Entrada * Contém imagem de pesquisa no Google.
  • 27. Segmentação de Clientes 27 Suposição comum na academia… (expectativa) Distribuição Normal * Contém imagem de pesquisa no Google.
  • 28. Segmentação de Clientes 28 Suposição comum na academia… (expectativa) Distribuição Normal Na indústria (realidade) * Contém imagem de pesquisa no Google.
  • 29. Segmentação de Clientes 29 Método de Clustering (não-supervisionado) i.e., k-Means * Contém imagem de pesquisa no Google.
  • 30. Segmentação de Clientes 30 Método de Clustering (não-supervisionado) i.e., k-Means Impossível de resolver adequadamente com k-means! Aqui entra o conhecimento sobre o negócio! * Contém imagem de pesquisa no Google.
  • 32. Quando a academia ignora a realidade... 32 * Imagens da própria
  • 33. Quando a academia ignora a realidade... 33 Além do claro problema de racismo, outro problema é que uma arquitetura inteira foi totalmente construída considerando dados sub representados! Na vida real ela pode não se sair tão bem. Consequências * Imagens da própria
  • 34. Quando a indústria dificulta para a academia... 34 * Imagens da própria
  • 35. Quando a indústria dificulta para a academia... 35 Consequências ● Modelos quase que impossíveis de serem reproduzidos no meio acadêmico (falando a nível de Brasil) ○ Máquinas para treinamento são caras ● Base de dados imensas e restritas às empresas ● Etc. * Imagens da própria
  • 36. No fim, é só setarmos corretamente as expectativas em cada contexto. 36
  • 37. E-mail: ludigoncalves.11@gmail.com Linkedin: www.linkedin.com/in/ludimilagonçalves Github: github.com/ludigoncalves Obrigada galeris!! o/ o// <o> <o/