GAN School - Elo7 Workshops

Sellers
30 thousand
active sellers
Buyers
9 million
active buyers
2

Since maternity, Elo7 has been involved in the
growth of many babies and children
3

1 out of 4 brides organize their
wedding with Elo7
4

What it is like to be a data scientist at Elo7?
Cinthia Tanaka, PhD
Applied Math
Data Scientist @ Elo7
Samara Alves, MSc.
Statistics
Junior A. Koch, PhD
Mathematical Physics
Renato Cordeiro
Computer Science
ML Engineer @ Elo7
Igor Bonadio, PhD
Computer Science
Lead Data Scientist @ Elo7
Research
+
Product
development
Autonomy
TeamworkStudy groups
Creativity
5

About me
Graduação em
física
2003-2007
Mestrado e
Doutorado
(técnicas
experimentais)
2008-2014
Professor de
Física e Cálculo
(programação e
matemática)
2013-2017
Pós-doutorado
(matemática
teórica ++)
2018
Decisão de
trilhar Ciência
de dados
2018
Elo7
(problemas
práticos,
colaboração e
pesquisa)
2019

Modelos Geradores
Team Hightower
PhD. Junior A. Koch
8Elo7.dev Workshops - GAN School 1: 10/12/2019

O que é um modelo gerador?
Machine learning tradicional:
temos os dados e queremos
uma função ou regra que
categoriza os dados.
Abordagem de geradores:
estamos preocupados em
aprender a distribuição dos
dados de cada umas das
classes presentes.

O que é um modelo gerador? Exemplo

Preço dos produtos Preço do frete
Idade dos compradores Tempo mensal no site
Distribuição dos dados

Dados originais
Amostragem de novos dados
Distribuição dos dados

Modelos Geradores são difíceis
Pipeline de aprendizado comum no estudo de
machine learning:
1. Basics
1. Supervised,unsupervised,reinforcement
2. Bias-variance trade-off
3. Overﬁtting, underﬁtting
2. Gradient descent:
3. Linear discriminant analysis (LDA)
4. Principal Component Analysis(PCA)
5. Learning Vector Quantization (LVQ)
6. Regularization methods
7. Kernel smoothing methods
8. Ensemble learning
9. Ordinary least squares
10. ...
17
Por que (na minha opinião)?
1. Exige mais modelagem
2. É difícil criar uma biblioteca
standard
3. Cada aplicação apresenta suas
próprias peculiaridades

Associação e causa
18
(X,y) y’ min erro
f Loss
y’ = 2x1
+1x2
-3x3
Podemos dizer que SE aumentarmos x1
e x2
então y’
vai aumentar também?
Lei zero de inferência causal:
Associação e causa são
diferentes.
Em ML tradicional apenas
aprendemos uma função que
de adequa aos dados e isso
não quer dizer que podemos
inferir que as features
escolhidas são a causa da
variável de saída.

Como fazer inferência causal?
19
(X,y) y’ min erro
f Loss
p(y,x1
,x2
,x3
)
Precisamos conhecer muito
bem o problema para
escolher boas features e
então aprender distribuições
condicionais para o grafo
causal escolhido.
Nota: podemos fazer tudo
isso e perceber que não foi
suficiente.
p(y,x1
,x2
,x3
) = p(y|x1
,x2
,x3
)p(x1
,x2
,x3
)
X2
X1
Y X3
Exemplo de gráfico causal:
Wasserman, Larry. All of statistics: a concise course in statistical
inference. Springer Science & Business Media, 2013.

Dependência entre características dos dados
20
Kocaoglu, Murat, et al. "Causalgan: Learning causal implicit
generative models with adversarial training." arXiv preprint
arXiv:1709.02023 (2017).

Variational Autoencoder
21
min Kingma, Diederik P., and Max
Welling. "Auto-encoding variational
bayes." arXiv preprint
arXiv:1312.6114 (2013).

Variational Autoencoder
22
Zi
Xi

GANs e Treino Adversarial
Team Hightower
PhD. Junior A. Koch

Aplicações: CycleGAN
25
Zhu, Jun-Yan, et al. "Unpaired image-to-image translation using
cycle-consistent adversarial networks." Proceedings of the IEEE
international conference on computer vision. 2017.

Aplicações: SRGAN
26
Ledig, Christian, et al. "Photo-realistic single image super-resolution
using a generative adversarial network." Proceedings of the IEEE
conference on computer vision and pattern recognition. 2017.

Aplicações: InfoGAN
27
Chen, Xi, et al. "Infogan: Interpretable
representation learning by information maximizing
generative adversarial nets." Advances in neural
information processing systems. 2016.

Generative Adversarial Networks

The GANfather - Ian Goodfellow, 2014
Yoshua Bengio
Goodfellow, Ian, Yoshua Bengio, and Aaron
Courville. Deep learning. MIT press, 2016.

Let`s play a game
Falsificador - GeradorInvestigador - Discriminador

35
D G
Dado real: X
Ruído: z
Dado falso: X'
Etapa 1: dados reais
D(X) = P(X) real
Adversarial Training

36
D G
Dado real: X Dado falso: X'
D(X') = P(X') real 1-D(X') = P(X') falso
Etapa 2: dados falsos
Ruído: z

37
D G
max D(X), min D(X')
Etapa 3: treino do discriminador
Ruído: z

38
D G
Etapa 4: treino do gerador
min D(X), max D(X')
Ruído: z

https://cs.stanford.edu/people/karpathy/gan/
Dados falsosDados reais
Erro
Evolução do treino

Loss - MinMax Game
41
D: tenta maximizar a
probabilidade de X ser
real e G(z) ser falso
G: tenta minimizar a
probabilidade de X real
e G(z) ser falso

O primeiro desaﬁo: instabilidade
JD
- JG
= 0
42

Loss - Non Saturating GAN (NSGAN)
43
D: tenta maximizar a
probabilidade de X ser
real e G(z) ser falso
G: tenta maximizar a
probabilidade de G(z)
ser real

Conditional GAN
Team Hightower
PhD. Junior A. Koch

CGAN
47
D G
Etapa 1: dados reais
D(X) = P(X) real
y y
Ruído: z

48
D G
D(X',y) = P(X'|y) real 1-D(X',y) = P(X'|y) falso
Etapa 2: dados falsos
Dado real: X Dado falso: X'y y
yRuído: z

49
D G
max D(X|y), min D(X'|y)
Etapa 3: treino do discriminador
yRuído: z

50
D G
Etapa 4: treino do gerador
max D(X'|y)
yRuído: z

Vantagens do CGAN
52
Mode
collapse
Maior
controle

GAN School - Elo7 Workshops

Recomendados

Recomendados

Mais conteúdo relacionado

Destaque

Destaque (20)

GAN School - Elo7 Workshops