hiroki yamaoka

1 Seguidor

15 SlideShares 1 Seguidor 1 Seguindo

15 SlideShares 1 Seguidor 1 Seguindo

強化学習 prml 機械学習 reinforcement learning actor critic sarsa q学習決定理論 dqn ガウス過程 emアルゴリズム reinforce 方策勾配ベルマン残差関数近似スパースサンプリング r-max モデルベース exponential family 指数型分布族 off policy モンテカルロ td学習 on policy 方策オン方策オフ方策オン方策オフ off policy on policy アドバンテージ関数 q-learning ベルマン方程式ベルマン作用素ベルマン作用素ベルマン方程式 planning モデルフリー探索と活用のトレードオフプランニング machine learning

Ver mais

Atividades
Sobre

PRML2.4 指数型分布族

Há 4 anos • 1392 Visualizações

RL_chapter1_to_chapter4

Há 3 anos • 303 Visualizações

強化学習1章

Há 3 anos • 366 Visualizações

強化学習2章

Há 3 anos • 432 Visualizações

強化学習3章

Há 3 anos • 242 Visualizações

強化学習4章

Há 3 anos • 208 Visualizações

強化学習5章

Há 3 anos • 170 Visualizações

強化学習6章

Há 3 anos • 209 Visualizações

PRML5.5

Há 3 anos • 57 Visualizações

PRML4.3

Há 3 anos • 40 Visualizações

PRML9.3

Há 3 anos • 19 Visualizações

PRML6.4

Há 3 anos • 111 Visualizações

DQN

Há 3 anos • 36 Visualizações

PRML1.3

Há 3 anos • 37 Visualizações

PRML1.5

Há 3 anos • 130 Visualizações

深層生成モデルに基づく音声合成技術

NU_I_TODALAB • Há 1 ano

最適輸送の解き方

joisino • Há 2 anos

SSII2021 [TS2] 深層強化学習〜強化学習の基礎から応用まで〜

SSII • Há 2 anos

音声の声質を変換する技術とその応用

NU_I_TODALAB • Há 6 anos

計算論的学習理論入門 -PAC学習とかVC次元とか-

sleepy_yoshi • Há 10 anos

Recent Advances on Transfer Learning and Related Topics Ver.2

Kota Matsui • Há 4 anos

階層ベイズと自由エネルギー

Hiroshi Shimizu • Há 6 anos

関数データ解析の概要とその方法

Hidetoshi Matsui • Há 3 anos

古典的ゲームAIを用いたAlphaGo解説

suckgeun lee • Há 6 anos

方策勾配型強化学習の基礎と応用

Ryo Iwaki • Há 6 anos

NIPS2015読み会: Ladder Networks

Eiichi Matsumoto • Há 8 anos

勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)

RyuichiKanoh • Há 3 anos

SSII2020SS: グラフデータでも深層学習〜 Graph Neural Networks 入門〜

SSII • Há 3 anos

[DL輪読会]Graph Convolutional Policy Network for Goal-Directed Molecular Graph Generation (NIPS2018)

Deep Learning JP • Há 5 anos

深層学習の数理

Taiji Suzuki • Há 4 anos

最適化超入門

Takami Sato • Há 9 anos

グラフデータ分析入門編

順也山口 • Há 4 anos

Reinforcement Learning @ NeurIPS2018

佑甲野 • Há 5 anos

強化学習 prml 機械学習 reinforcement learning actor critic sarsa q学習決定理論 dqn ガウス過程 emアルゴリズム reinforce 方策勾配ベルマン残差関数近似スパースサンプリング r-max モデルベース exponential family 指数型分布族 off policy モンテカルロ td学習 on policy 方策オン方策オフ方策オン方策オフ off policy on policy アドバンテージ関数 q-learning ベルマン方程式ベルマン作用素ベルマン作用素ベルマン方程式 planning モデルフリー探索と活用のトレードオフプランニング machine learning

Ver mais