Marcadores
強化学習
prml
機械学習
reinforcement learning
actor critic
sarsa
q学習
決定理論
dqn
ガウス過程
emアルゴリズム
reinforce
方策勾配
ベルマン残差
関数近似
スパースサンプリング
r-max
モデルベース
exponential family
指数型分布族
off policy
モンテカルロ
td学習
on policy
方策オン
方策オフ
方策オン
方策オフ
off policy
on policy
アドバンテージ関数
q-learning
ベルマン方程式
ベルマン作用素
ベルマン作用素
ベルマン方程式
planning
モデルフリー
探索と活用のトレードオフ
プランニング
machine learning
Ver mais
Apresentações
(15)Gostaram
(18)深層生成モデルに基づく音声合成技術
NU_I_TODALAB
•
Há 1 ano
最適輸送の解き方
joisino
•
Há 2 anos
SSII2021 [TS2] 深層強化学習 〜 強化学習の基礎から応用まで 〜
SSII
•
Há 2 anos
音声の声質を変換する技術とその応用
NU_I_TODALAB
•
Há 6 anos
計算論的学習理論入門 -PAC学習とかVC次元とか-
sleepy_yoshi
•
Há 10 anos
Recent Advances on Transfer Learning and Related Topics Ver.2
Kota Matsui
•
Há 4 anos
階層ベイズと自由エネルギー
Hiroshi Shimizu
•
Há 6 anos
関数データ解析の概要とその方法
Hidetoshi Matsui
•
Há 3 anos
古典的ゲームAIを用いたAlphaGo解説
suckgeun lee
•
Há 6 anos
方策勾配型強化学習の基礎と応用
Ryo Iwaki
•
Há 6 anos
NIPS2015読み会: Ladder Networks
Eiichi Matsumoto
•
Há 8 anos
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
RyuichiKanoh
•
Há 3 anos
SSII2020SS: グラフデータでも深層学習 〜 Graph Neural Networks 入門 〜
SSII
•
Há 3 anos
[DL輪読会]Graph Convolutional Policy Network for Goal-Directed Molecular Graph Generation (NIPS2018)
Deep Learning JP
•
Há 5 anos
深層学習の数理
Taiji Suzuki
•
Há 4 anos
最適化超入門
Takami Sato
•
Há 9 anos
グラフデータ分析 入門編
順也 山口
•
Há 4 anos
Reinforcement Learning @ NeurIPS2018
佑 甲野
•
Há 5 anos
Marcadores
強化学習
prml
機械学習
reinforcement learning
actor critic
sarsa
q学習
決定理論
dqn
ガウス過程
emアルゴリズム
reinforce
方策勾配
ベルマン残差
関数近似
スパースサンプリング
r-max
モデルベース
exponential family
指数型分布族
off policy
モンテカルロ
td学習
on policy
方策オン
方策オフ
方策オン
方策オフ
off policy
on policy
アドバンテージ関数
q-learning
ベルマン方程式
ベルマン作用素
ベルマン作用素
ベルマン方程式
planning
モデルフリー
探索と活用のトレードオフ
プランニング
machine learning
Ver mais