策略分享

连续时间均方差投资组合选择:强化学习框架

由qxiao创建,最终由qxiao 被浏览 78 用户

Continuous Time Mean Variance Portfolio Selection: A Reinforcement Learning Framework

作者:Haoran Wang, Xunyu Zhou

出处:Mathematical Finance, 2020-10

摘要:作者通过强化学习研究了连续时间均值方差投资组合的选择。其问题是要在研究与实用之间实现最佳平衡,并将其表述为一个熵调节的,宽松的随机控制过程。作者证明了该问题的最优反馈策略高斯必要性,且具有时变的方差,同时还证明了一种策略改进定理,在此基础上设计出可实现的强化学习算法。在仿真和实证研究中,该算法及其变体优于传统算法和基于深度神经网络的算法。

/wiki/static/upload/72/72ed24d3-b2dc-434c-b4d8-f19180097ca4.pdf

\

{link}