【探索与控制】Deep Mind× UCL 2021年强化学习课程第2讲
由qxiao创建,最终由qxiao 被浏览 395 用户
研究科学家Hado van Hasselt探讨了为什么学习主体同时平衡探索和利用已获得的知识很重要。
/wiki/static/upload/98/988872ab-a494-42d8-99e4-e3533441abb7.mp4
/wiki/static/upload/c7/c784142a-98ad-4391-9a5e-43121191c76a.pdf
\
由qxiao创建,最终由qxiao 被浏览 395 用户
研究科学家Hado van Hasselt探讨了为什么学习主体同时平衡探索和利用已获得的知识很重要。
/wiki/static/upload/98/988872ab-a494-42d8-99e4-e3533441abb7.mp4
/wiki/static/upload/c7/c784142a-98ad-4391-9a5e-43121191c76a.pdf
\