Experimentation
Anti-Patterns
Comparação temporal
Comparação temporal
Nova
funcionalidade
Comparação temporal
http://www.tylervigen.com/spurious-correlations
Comparação temporal
Comparação temporal da alavancagem
Comparação temporal da alavancagem
50%⬆
60%⬆
Comparação temporal da alavancagem
Comparação temporal da alavancagem
Comparação temporal da alavancagem
60%⬆
40%⬇
Longo ciclo de desenvolvimento
Longo ciclo de desenvolvimento
$ A/B
Sucesso!
Ufa
:(
Longo ciclo de desenvolvimento
https://ai.stanford.edu/~ronnyk/ExPThinkWeek2009Public.pdf
1/3
Longo ciclo de desenvolvimento
75%
O experimento que vira funcionalidade
O experimento que vira funcionalidade
Mínimo
necessário
para validar
hipótese
Experimento
foi um
sucesso
Produção
O experimento que vira funcionalidade
O experimento que vira funcionalidade
Mínimo
necessário
para validar
hipótese
Experimento
foi um
sucesso
Produção
Implementar
corretamente
Métrica incorreta
Métrica incorreta
$
Métrica incorreta
ℹ
Métrica não acionável
Métrica não acionável
Churn
Lifetime
Value
Ads
Revenue
- Muito tempo para
comparar
- Muitas influências
externas
- Dificilmente separável
em A/B
Métrica não acionável
Churn
Lifetime
Value
Ads
Revenue
Média de
tempo
Frequência
Assertiveness
Alvo populacional errado
Alvo populacional errado
Acidental
Moderado
Heavy
Desconsiderar mudança populacional
Desconsiderar mudança populacional
Acidental Heavy
Inicio do
teste A/B
Fim do
teste A/B
Desconsiderar mudança populacional
Resultado do AB para heavys: Número de heavys:
A segmentação infinita
A segmentação infinita
Amostra de usuários do
experimento
A segmentação infinita
Moderados
A segmentação infinita
Nas quarta-feiras
A segmentação infinita
Em uma faixa de
horário
A segmentação temporal
A segmentação temporal
Observações não independentes
Observações não independentes
Por
impressão
Por
usuárioX
Observações não independentes
http://ewulczyn.github.io/ab_testing_and_independence/
https://medium.com/convoy-tech/cracking-correlated-
observations-in-a-b-tests-with-mixed-effect-models-
80a63027444e
Experimentation Anti-Patterns
- Comparação temporal
- Comparação temporal da alavancagem
- Longo ciclo de desenvolvimento
- O experimento que vira funcionalidade
- Métrica incorreta
- Métrica não acionável
- Alvo populacional errado
- Segmentação infinita
- Segmentação temporal
- Observações não independentes
Desculpa
@timotta

Experimentation anti patterns

Notas do Editor

  • #3 Explicar aqui que comparar o crescimento ou decréscimo dos diversos KPIs é importante, mas não necessariamente indica se uma determinada feature causou essa melhora ou não e o mais importante é a forma como você comunica isso