【规划和使用模型】Deep Mind× UCL 2021年强化学习课程第8讲
由qxiao创建,最终由qxiao 被浏览 113 用户
第8讲:规划与模型 研究工程师Matteo Hessel解释了如何学习和使用模型,包括像Dyna和蒙特卡罗树搜索(MCTS)这样的算法。
https://www.youtube.com/watch?v=FKl8kM4finE
/wiki/static/upload/aa/aaf62e89-41af-4f1d-9c57-2553faee5265.pdf
\
由qxiao创建,最终由qxiao 被浏览 113 用户
第8讲:规划与模型 研究工程师Matteo Hessel解释了如何学习和使用模型,包括像Dyna和蒙特卡罗树搜索(MCTS)这样的算法。
https://www.youtube.com/watch?v=FKl8kM4finE
/wiki/static/upload/aa/aaf62e89-41af-4f1d-9c57-2553faee5265.pdf
\