【深度强化学习#1】Deep Mind× UCL 2021年强化学习课程第12讲
由qxiao创建,最终由qxiao 被浏览 246 用户
第12讲:深度强化学习#1 研究工程师Matteo Hessel讨论了深度RL的实际考虑和算法,包括如何使用自区分(即Jax)实现这些。
https://www.youtube.com/watch?v=cVzvNZOBaJ4
/wiki/static/upload/4f/4f1a9d24-39d7-4f68-8a30-989d65e8c453.pdf
\