【规划和使用模型】Deep Mind× UCL 2021年强化学习课程第8讲 由qxiao创建,最终由qxiao更新于2024-05-20 02:09 被浏览 113 用户第8讲:规划与模型 研究工程师Matteo Hessel解释了如何学习和使用模型,包括像Dyna和蒙特卡罗树搜索(MCTS)这样的算法。 https://www.youtube.com/watch?v=FKl8kM4finE /wiki/static/upload/aa/aaf62e89-41af-4f1d-9c57-2553faee5265.pdf \