Ryo Iwaki
21
Seguidores
Personal Information
Organização/Local de trabalho
Mino-shi
Marcadores
強化学習
reinforcement lrearning
policy gradient
natural policy gradient
natural gradient
自然方策勾配
方策勾配
自然勾配
ゆるふわ
方策勾配法
reinforcement learning
bellman equation
nips読み会・関西
Ver mais
- Apresentações
- Documentos
- Infográficos