量化百科

重磅干货-Richard S. Sutton-2018年强化学习教程免费下载

由ypyu创建,最终由ypyu 被浏览 27 用户

Richard S. Sutton是加拿大的一名计算机科学家,目前是阿尔伯塔大学计算机科学教授和iCORE主席。Sutton被认为是现代强化学习的奠基人之一,主要有以下几个显著的贡献,包括时间差分学习、策略梯度法、在Dyna架构, 由其主笔撰写的书:《Reinforcement Learning: An Introduction》,一直被视为强化学习领域的圣经。

该书自2014年以来一直在不停的修订和完善,今年Sutton又分享了他最新版本的强化学习入门的最新版本,内容比去年的版本丰富了很多,页数增加到548页,非常值得阅读学习。附全书下载链接:

链接: https://pan.baidu.com/s/10uPubO7Pw_IpVdcEpR97FA

密码: 5wmt

\