Deep RL Bootcampの内容をまとめて
https://sites.google.com/view/deep-rl-bootcamp/lectures
それが終わったら、強化学習アーキテクチャ勉強会で紹介されている論文を読んでみる (無理ゲーかも)
https://rlarch.connpass.com/
SUN | MON | TUE | WED | THU | FRI | SAT |
---|---|---|---|---|---|---|
1 ksyundo | 2 ksyundo | |||||
3 ksyundo | 4 ksyundo | 5 ksyundo | 6 ksyundo | 7 ksyundo | 8 ksyundo | 9 ksyundo |
10 ksyundo | 11 ksyundo | 12 ksyundo | 13 ksyundo | 14 ksyundo | 15 ksyundo | 16 ksyundo |
17 ksyundo | 18 ksyundo | 19 ksyundo | 20 ksyundo | 21 ksyundo | 22 ksyundo | 23 ksyundo |
24 ksyundo | 25 ksyundo |
- 12/1MDPとベルマン方程式強化学習についてまとめる(1) MDPとベルマン方程式 | ROBO LOG
- 12/2反復による価値の推定強化学習についてまとめる(2) 反復による価値の推定 | ROBO LOG
- 12/3方策勾配強化学習についてまとめる(3) 方策勾配 | ROBO LOG
- 12/4Actor-Critic強化学習についてまとめる(4) 方策勾配に基づくアルゴリズム、Actor-Critic | ROBO LOG
- 12/5自然勾配とTRPO,PPO強化学習についてまとめる(5) 自然方策勾配法とTRPO, PPO | ROBO LOG
- 12/6モデルベース強化学習強化学習についてまとめる(6) モデルベース強化学習 | ROBO LOG
- 12/7DQN, DDQNと実装強化学習についてまとめる(7) DQNとDDQN | ROBO LOG
- 12/8OpenAI gymOpen AI Gym & MuJoCo を使う | ROBO LOG
- 12/9DeepMimic論文 DeepMimic: Example-Guided Deep Reinforcement Learning of Physics-Based Character Skills | ROBO LOG
- 12/10Neural Episodic Control論文 Neural Episodic Control | ROBO LOG
- 12/11SVG/DPG/DDPGpathwise derivative method: Stocastic Value Gradient(SVG), (Deep) Deterministic Policy Gradient(DPG/DDPG)
- 12/12DDP/iLQR/SLQDifferential Dynamic Programming(DDP)/iterative LQR(iLQR)/Sequential LQR(SLQ)
- 12/13RND論文 Exploration by Random Network Distillation
- 12/14Learning Complex Dexterous Manipulation With Deep Reinforcement Learning and Demonstrations論文 Learning Complex Dexterous Manipulation With Deep Reinforcement Learning and Demonstrations
- 12/15
- 12/16
- 12/17
- 12/18
- 12/19
- 12/20
- 12/21
- 12/22
- 12/23
- 12/24
- 12/25