Perfil do usuário
em realtime
Big Data + Web Semântica
@renan_oliveira
Como aprendemos
os interesses dos
usuários dado a
sua navegação
Big Data na globo.com
• 3 bilhões de eventos diários
• 50 milhões de usuários únicos por mês
• Isso é só o começo
Frentes de ação
• Recomendação
• Analytics
• Conhecimento sobre o usuário
Frentes de ação
• Recomendação
• Analytics
• Conhecimento sobre o usuário
@cirocavani @timotta
WIP
Spreading Activation
*Quando usuário leu alguma matéria sobre seu time
teste off-line com 3.5M de usuários da base
82% deacerto
95% deacertonas3
primeirasposições
Qual o seu time?
processor
api
userId: 123
123: [(“uriNeymar”, 123456)]
123: [(“uriNeymar”, 123456)]
api
{
":Neymar":{
"class":"atleta",
"graph":"esportes",
"step1":[
":Barcelona"
],
"step2":[
":Espanha"
]
}
}
:Neymar rdfs:type :Atleta;
:atua_pelo :Barcelona.
:Barcelona :localizacao :Espanha.
+Big Data
• 2 bilhões de eventos salvos em 3 meses
• 500 regiões no HBase
• 30 mil requests/min no Excelsior API
• +120GB em memória no redis e guava
• P75 de 1ms em média no Excelsior API
+Web Semântica
• + 300 classes na ontologia
• + 6 milhões de instâncias
• + 55 milhões de triplas
• 99% das matérias anotadas atualmente
• Banco de triplas (grafos e inferência)
Métricas
teste com 500M de impressões
+48.1%
+48.4% comspreading
activation
deconversão
Resultado do teste A/B
Obrigado
renanoliveira.net

Excelsior - Perfil usando Big Data e Web Semântica