8. Função de custo
𝑳 =
𝟏
𝒎
𝒊=𝟏
𝒎
𝑫 𝝈 𝑾𝒙(𝒊)
+ 𝒃 , 𝒚(𝒊)
Todo o conteúdo básico para entender redes neurais
8
Conteúdo básico para entender redes neurais
9. Estrutura de uma regressão logística
𝑳 =
𝟏
𝒎
𝒊=𝟏
𝒎
𝑫 𝝈 𝑾𝒙(𝒊)
+ 𝒃 , 𝒚(𝒊)
Todo o conteúdo básico para entender redes neurais
9
2,0
1,0
0,1
𝒚
0,7
0,2
0,1
1,0
0,0
0,0
𝒚
𝑫 𝒚, 𝒚𝑾𝒙 + 𝒃
2,0
1,0
0,1
𝒙 𝒔𝒄𝒐𝒓𝒆
𝝈 𝑾𝒙 + 𝒃
Conteúdo básico para entender redes neurais
10. Método do Gradiente (Gradient Descent)
Todo o conteúdo básico para entender redes neurais
10
Figura 1. Método do gradiente (Coursera).
𝑳 𝒘 𝟏, 𝒘 𝟐
𝒘 𝟏
𝒘 𝟐
Conteúdo básico para entender redes neurais
11. Método do Gradiente (Gradient Descent)
Todo o conteúdo básico para entender redes neurais
11
Figura 2. Função convexa (Coursera).
𝑳𝒘𝟏,𝒘𝟐
𝒘 𝟏 𝒘 𝟐
Conteúdo básico para entender redes neurais
12. Método do Gradiente (Gradient Descent)
Todo o conteúdo básico para entender redes neurais
12
Figura 3. Método do gradiente (Udacity).
𝑳 𝒘 𝟏, 𝒘 𝟐
𝒘 𝟏
𝒘 𝟐
−𝜶∆𝑳 𝒘 𝟏, 𝒘 𝟐
dezenas de iterações
utiliza todos os dados
a cada iteração
Conteúdo básico para entender redes neurais
13. Método do Gradiente Estocástico (S. G. D.)
Todo o conteúdo básico para entender redes neurais
13
Figura 4. Método do gradiente estocástico (Udacity).
𝑳 𝒘 𝟏, 𝒘 𝟐
𝒘 𝟏
𝒘 𝟐
−𝜶∆𝑳 𝒘 𝟏, 𝒘 𝟐
dezenas de iterações
utiliza todos os dados
a cada iteração
de centenas a milhares utiliza uma pequena
amostra aleatória dos dados
Conteúdo básico para entender redes neurais
14. Método do Gradiente Estocástico (S. G. D.)
Todo o conteúdo básico para entender redes neurais
14
Figura 5. Otimizações do método do gradiente estocástico (Udacity).
𝑳 𝒘 𝟏, 𝒘 𝟐
𝒘 𝟏
𝒘 𝟐
−𝜶𝑴 𝒘 𝟏, 𝒘 𝟐
𝑴 ← 𝟎, 𝟗𝑴 + ∆𝑳
Conteúdo básico para entender redes neurais
16. Redes Neurais
Todo o conteúdo básico para entender redes neurais
16
Figura 6. Redes Neurais (Udacity).
h
𝒙 𝒚
𝒚𝒙 𝑾 𝒃
𝑾(𝟏)
𝑾(𝟐)𝒃(𝟏) 𝒃(𝟐)
Conteúdo básico para entender redes neurais
17. Redes Neurais
Todo o conteúdo básico para entender redes neurais
17
Figura 7. Largura e profundidade de uma Rede Neural (Udacity).
larga profunda
(wide) (deep)
vs.
𝒚𝒙
𝒚𝒙
Conteúdo básico para entender redes neurais
18. Redes Neurais
Todo o conteúdo básico para entender redes neurais
18
Figura 8. Mimetização do processo de aprendizagem humana (Udacity).
𝒚𝒙
Conteúdo básico para entender redes neurais
21. Inicialização
Todo o conteúdo básico para entender redes neurais
21
Figura 10. Normalização da entrada (Udacity).
mal condicionado bem condicionado
Variâncias
equivalentes
Médias
iguais a zero
Conteúdo básico para entender redes neurais
22. Inicialização
𝑳 =
𝟏
𝒎
𝒊=𝟏
𝒎
𝑫 𝝈 𝑾𝒙(𝒊)
+ 𝒃 , 𝒚(𝒊)
Todo o conteúdo básico para entender redes neurais
22
𝒙𝒋
(𝒊)
=
𝒙𝒋
(𝒊)
− 𝝁(𝒊)
𝝈(𝒊)
Conteúdo básico para entender redes neurais
∅
23. Todo o conteúdo básico para entender redes neurais
23
Otimizações – Regularização L2
𝑳′
= 𝑳 + 𝜷
𝟏
𝟐
𝑾 𝟐
𝟐
novo custo
custo
𝑾 𝟐
𝟐
= 𝑾 𝑻
𝑾
𝑾
Conteúdo básico para entender redes neurais
26. Referências
Machine Learning –
https://www.coursera.org/learn/machine-learning
Deep Learning –
https://br.udacity.com/course/deep-learning--ud730/
NLP with Deep Learning –
http://web.stanford.edu/class/cs224n/syllabus.html
TensorFlow
https://www.tensorflow.org/
GitHub – Pedro Lelis
https://github.com/PedroLelis/udacity-deep-learning
Todo o conteúdo básico para entender redes neurais
26
Conteúdo básico para entender redes neurais