连续时间均方差投资组合选择：强化学习框架

由qxiao创建，最终由qxiao更新于2022-11-20 03:34 被浏览 83 用户

Continuous Time Mean Variance Portfolio Selection: A Reinforcement Learning Framework

作者：Haoran Wang, Xunyu Zhou

出处：Mathematical Finance, 2020-10

摘要：作者通过强化学习研究了连续时间均值方差投资组合的选择。其问题是要在研究与实用之间实现最佳平衡，并将其表述为一个熵调节的，宽松的随机控制过程。作者证明了该问题的最优反馈策略高斯必要性，且具有时变的方差，同时还证明了一种策略改进定理，在此基础上设计出可实现的强化学习算法。在仿真和实证研究中，该算法及其变体优于传统算法和基于深度神经网络的算法。

/wiki/static/upload/72/72ed24d3-b2dc-434c-b4d8-f19180097ca4.pdf