logo
首页
编写策略
数据平台
策略社区
我的策略
宽客学院
知识库
免费注册
登录
AI量化知识树
Deep Mind × UCL 2021强化学习系列课程
由qxiao创建,最终由small_q
更新于2024-05-20 02:09
被浏览 1453 用户
文档
【探索与控制】Deep Mind× UCL 2021年强化学习课程第2讲
【无模型预测】Deep Mind× UCL 2021年强化学习课程第5讲
【MDPs和动态规划】Deep Mind× UCL 2021年强化学习课程第3讲
【多步骤和关闭策略】Deep Mind× UCL 2021年强化学习课程第11讲
【强化学习简介】Deep Mind× UCL 2021年强化学习课程第1讲
【深度强化学习#2】Deep Mind× UCL 2021年强化学习课程第13讲
【深度强化学习#1】Deep Mind× UCL 2021年强化学习课程第12讲
【规划和使用模型】Deep Mind× UCL 2021年强化学习课程第8讲
【动态规划算法的理论基础】Deep Mind× UCL 2021年强化学习课程第4讲
【无模型控制】Deep Mind× UCL 2021年强化学习课程第6讲
【函数近似】Deep Mind× UCL 2021年强化学习课程第7讲
【策略梯度和Actor-Critic训练】Deep Mind× UCL 2021年强化学习课程第9讲
【近似动态规划】Deep Mind× UCL 2021年强化学习课程第10讲
{link}