AI量化知识树

Deep Mind × UCL 2021强化学习系列课程

由qxiao创建，最终由small_q更新于2024-05-20 02:09 被浏览 1481 用户

文档

【近似动态规划】Deep Mind× UCL 2021年强化学习课程第10讲【策略梯度和Actor-Critic训练】Deep Mind× UCL 2021年强化学习课程第9讲【函数近似】Deep Mind× UCL 2021年强化学习课程第7讲【无模型控制】Deep Mind× UCL 2021年强化学习课程第6讲【动态规划算法的理论基础】Deep Mind× UCL 2021年强化学习课程第4讲【规划和使用模型】Deep Mind× UCL 2021年强化学习课程第8讲【深度强化学习#1】Deep Mind× UCL 2021年强化学习课程第12讲【深度强化学习#2】Deep Mind× UCL 2021年强化学习课程第13讲【强化学习简介】Deep Mind× UCL 2021年强化学习课程第1讲【多步骤和关闭策略】Deep Mind× UCL 2021年强化学习课程第11讲

{link}