ou como aprendi a viver sem cache
FROM DEV TO DATA ENGINEER
ENGENHEIRO DE
DADOS NA
GLOBO.COM
@renan_oliveira
entre 2006 e 2012
HÁ MUITO TEMPO
ou como aprendi a viver sem cache
E AGORA, JOSÉ?
3bilhõesde eventos diários
E V E N T O S
2milhõesde conexões simultâneas
70milhõesde usuários únicos por mês
100mil novos conteúdos por mês
event tracker by globo.com
Para esses novos problemas os velhos truques não serviam
D A T A S C I E N C E S K I L L S
STUDY HARD
ESTATÍSTICA
PUBLICAÇÕES
MACHINE LEARNING
INFRAESTRUTURA
100milrecomendações por minuto
15msde tempo de resposta(p50)
+20algoritmosdiferentes
Scalaparacomo principal linguagem
Multi-DB (HBase + Solr + Parquet)
R E C O M E N D A Ç Ã O
+1000testes AB
E X P E R I M E N T A Ç Ã O
5msde tempo de resposta (p50)
DataCulture
Visuaise deAlgoritmos
Scala- VM de < 2GB
o que tá nascendo por aí?!
NOVOS HORIZONTES
OBRIGADO!
@renan_oliveira
www.renanoliveira.net
http://slideshare.net/renangpa

Dev para Engenheiro de Dados (From Dev to Data Engineer)