Karina Moraes e Tiago Vinícius apresentam a plataforma Elytics, construída para fornecer análises de Big Data para o marketplace Elo7. A arquitetura de Elytics inclui ferramentas como Apache Kafka, Spark e Zeppelin para ingestão, processamento e visualização de dados, além de machine learning com Amazon ML. Elytics permite criar métricas, validar funcionalidades, auxiliar em debug e análises exploratórias para otimizar objetivos de negócio.
[GetNinjas] Business Intelligence Workshop @ Google Campus SP
Big Data Platform for E-commerce Analytics
1. Elytics
Construindo uma plataforma de Big Data
Karina Moraes
linkedin: br.linkedin.com/in/karinamoraes
Tiago Vinícius
linkedin: br.linkedin.com/in/viniremigio
8. Negócio
● Quantas buscas, carrinhos e pedidos temos
por dias?
● Quais as palavras mais buscadas pelos
usuários? Retornam resultados?
● Qual a porcentagem de usuários que
adicionam produtos ao carrinho, mas não
finalizam a compra? Por que isso acontece?
12. Negócio
● Qual a porcentagem de usuários que iniciam
uma conversa, mas não finalizam a compra?
Por que isso acontece?
● Os vendedores estão respondendo em
tempo adequado?
● Como monitoramos mais facilmente e
rapidamente uma fraude?
● Como criar visualizações que auxiliem na
tomada de decisão em relação à evolução
dos produtos
15. … sounds like Big Data...
Volume
Velocidade
Veracidade Variedade
Valor
… Houston, we have a Big Problem!
16. Elytics: Plataforma de Big Data Analytics
● Objetivos
○ Criar e visualizar métricas
○ Validar novas funcionalidades
○ Auxiliar em troubleshooting
○ Análises exploratórias utilizando os dados
○ Aplicação de técnicas que auxiliem na
otimização de objetivos de negócio
17. Elytics: Visão geral
Ingestão
de dados
Processamento Armazenamento
Visualização Machine Learning
Big Data
Big Data Analytics / Data Science
Análise e ModelagemInferência
45. O que é?
● Aplicações
○ Recomendação de produtos
○ Prevenção a fraudes
○ Segmentação de clientes
○ Ranking em resultados de busca
Conjunto
de dados
? Resposta
Objetivo
Atendido!
Sim!
Não :(
Satisfatória?
47. Seller Score
É possível criar um score que permita identificar
quais são os melhores vendedores do Elo7?
Variáveis de cada observação (X): métricas de desempenho do vendedor
Variável resposta (y ∈ [0,1]): probabilidade do vendedor estar entre os melhores
y = f(X)
Como encontrar a função aproximada (modelo) f ?
48. Regressão logística
Conjunto de
vendedores com
score calculado
[(X1
,y1
),...,(Xn
,yn
))]
Algoritmo de
regressão logística
Modelo
gerado!
Avaliar
qualidade do
modelo
Modelo preditivo: algoritmo estima
parâmetros B0
e B1
para a função
logística
(Função logística)
Vendedor não
avaliado
(Xn+1
,?)
y =
Vendedor
avaliado!
(Xn+1
,yn+1
)
51. Aplicações do Seller Score
● Aumentar ranking dos melhores vendedores
na busca;
● Permitir contratação de posições de destaque;
● Priorizar atendimento;
● Prevenção de fraudes.
55. Lições aprendidas
● Source of truth: S3 e/ou HDFS;
● Evitar serviços não-gerenciados;
● Optar por streaming de dados traz grandes
responsabilidades;
● Visualizar métricas é de extrema importância.
56. Próximos passos
● Evoluir a plataforma;
● Migrar o máximo de serviços para AWS;
● Disponibilizar mais dashboards de visualização;
● Ampliar projetos de Big Data Analytics.