【探索与控制】Deep Mind× UCL 2021年强化学习课程第2讲 由qxiao创建,最终由qxiao更新于2024-05-20 02:09 被浏览 395 用户研究科学家Hado van Hasselt探讨了为什么学习主体同时平衡探索和利用已获得的知识很重要。 /wiki/static/upload/98/988872ab-a494-42d8-99e4-e3533441abb7.mp4 /wiki/static/upload/c7/c784142a-98ad-4391-9a5e-43121191c76a.pdf \