策略分享

《华泰金工深度学习量化研究》alphanet GNN和GAN——Deep Alpha 海内外最佳实践探索研讨会

由qxiao创建,最终由qxiao 被浏览 240 用户

{w:100}

1、华泰人工智能系列研究:四年五主题四十七篇研究

首先非常感谢BigQuant的邀请,这里我替换了一下标题,主办方给的题目是《国内投资机构深度学习量化实践》,我这里改成了《华泰金工深度学习量化研究》,因为我个人很难代表整个国内的投资机构,国内的买方和卖方,公募和私募研究差异还是挺大的。 总体来讲,买方机构会更务实,目标明确。卖方研究有特殊之处,市场对我们的期待是探索前沿内容,帮大家踩坑,所以需要我们仰望星空。但同时又不能太飘,也需要脚踏实地。双重标准之下,研究面临的挑战很大。 过去4年多时间里,在首席林晓明总的带领以及多位同事的通力合作下,华泰金工团队在人工智能领域也有了一定研究成果。我们从2017年6月到现在,一共发布47篇人工智能深度研究,涵盖5个主题:模型测试主题、因子挖掘主题、对抗过拟合主题、真假序列和生成对抗网络主题。 前两个主题属于进攻式的研究,alpha模型最重要的环节是因子和模型,刚好对应我们的前两大主题模型测试以及因子挖掘,目标就是尽可能拟合收益获取alpha。但是对于人工智能模型来说,优点是拟合能力强,缺点是拟合能力太强,以至于把数据中的噪音也学习进去了,所以我们也需要做防御式的研究。一方面找技术对抗过拟合;另一方面,过拟合最重要的原因是数据量不够,中国市场能获取到的数据相对比较有限,所以我们就思考能不能用深度学习技术生成更多数据,参与到模型训练中提升鲁棒性,所以又有了我们另外一个系列,叫做真假序列和生成对抗网络。 最后一个主题叫做其他,我们希望模型不光预测能力强,还可以用来帮助我们去理解市场。前者让我们在市场中存活下来,后者让我们在市场中长期存活下来。像我们做的因果推断、无监督学习这些研究,都可以帮助我们更好地理解市场运行的规律。

完整视频观看地址:https://webcast.roadshowchina.cn/cmeet/NlZBZVhZRGZ6Q1NSRjdrbmJqQjZUQT09

2、选股因子挖掘神经网络:AlphaNet


{w:100}{w:100}接下来我们介绍一些具体研究。今天想分享的第一部分研究是选股因子挖掘网络AlphaNet,这是我们同事李子钰老师做的非常漂亮的工作。多因子选股通常可以分成三步,因子生成、多因子合成和组合优化。 传统的多因子选股框架里,在因子生成这一步,一般基于基本面或者量价的逻辑提取常规因子,然后用线性回归方法做因子合成。如果我们想把人工智能技术用在因子选股策略,第一个方案就是在因子合成这步,把线性回归替换成更复杂的非线性模型,比如XGBoost这样的决策树集成模型,就有了我们第一代人工智能选股模型:传统因子+XGBoost。 因子生成这一步能不能用人工智能技术?我们用遗传规划技术自动生成海量选股因子,再送到随机森林或者 XGBoost模型中做因子合成,就有了我们第二代人工智能选股模型。 前两代模型并没有真正用到我们今天的主题——深度学习。我们在去年开发了第三代人工智能选股模型AlphaNet。AlphaNet的特点是把因子生成和因子合成放到同一个神经网络里面,实现了端到端的收益预测。当然这并不是我们研究的终点,最后一步组合优化我们目前并没有用到人工智能技术,接下来如果能够对于强化学习有进一步了解,或许可以把这三步都融合起来,用深度强化学习实现真正端到端的投资决策。 最近十年深度学习技术飞速发展的核心推动力量之一就是卷积神经网络的提出。卷积神经网络在图像识别以及语音识别上已经有了非常成功的应用。卷积的作用是提取相邻数据中的固定模式。对于图像,相邻的像素是有意义的,他们可能组成有规律的局部图像,语音也是如此,但是对于因子数据,卷积并没有那么合适。比如图上展示的因子数据,如果用一个2×2的卷积核提取邻域线索,我们能提取到的是 open和high之间的模式,high和low之间的模式,low和close之间的模式,它能提取的信息和因子排布顺序有关系。但是问题在于凭什么我们只能去计算open和high之间的规律?为什么open和close,open和vwap之间就不能提取规律?显然在这里用卷积网络并不那么合适。我们就想能不能用另外的网络结构代替卷积。

{w:100}{w:100}所以我们提出了AlphaNet网络结构,它最大的特点是没有用传统的卷积运算,而是使用了自定义的、更适合用在因子构建的运算。比如其中的一种自定义运算叫ts_correlation,它的作用是对任意两个输入因子,计算过去D天的相关系数,由于对任意股票对进行了遍历,避免了因子顺序的排布造成的影响,可以充分挖掘因子之间的规律。 再比如还有一个相对简单的自定义运算叫ts_stddev,它的作用是对单个因子过去一段时间的数据计算标准差。我们总共提出6个特征提取的运算符,对过去30天的15个原始因子进行上述的特征提取,最后送到LSTM网络里面预测股票收益。 AlphaNet和传统的遗传规划有什么区别?遗传规划就好比物种进化,基因突变通常是没有方向性的,遵循的是自然选择法则,也就是说因子在下一轮迭代里会变得更好还是更差并不确定,我们会把因子的筛选去交给时间,这就导致了它的效率其实并不高。而深度学习是很功利的,他的目标就是希望最后的预测误差尽可能小,所有参数都会围绕最终的目标去优化。所以把因子挖掘的工作交给AlphaNet,效率会比遗传规划更高。 我们基于AlphaNet网络构建了一个500增强的选股策略,从2011年到现在相对于基准指数,超额收益大约20%,信息比率超过3,是一个不错的选股策略。如果各位投资人朋友对AlphaNet策略感兴趣,欢迎联系华泰金工团队。


图神经网络如何挖掘股票间关系信息?

图神经网络最大的优势是什么?

怎样去评估任意两个股票间的影响,或者说连接强度?

怎么去确定注意力机制参数?

第二个问题是怎么把邻居的因子加到自己身上来?GAT图注意力网络如何实现隐式建图结合距离加权?

图注意力网络模型相比于传统机器学习模型的优势在哪?

GAT模型如何解决2019-2020年模型失效问题?

生成对抗网络GAN如何应用于量化?

GAN如何生成上证指数?生成1000个平行世界?

与Bootstrap和GARCH模型比,在自相关性、厚尾分布、波动率聚集、盈亏不对称、杠杆效应、粗细波动率相关方面有何特点?如何证明(7、28)这组参数比(5、20)好而不是过拟合?

为什么发现用假模型集成得到的模型,表现会比在真数据训练得到的模型要更好?

…………

更完整内容请前往会员专区

==报告说明:====本文章为由宽邦科技及华泰行知联合举办的《Deep Alpha 海内外最佳实践探索研讨会》议程2 何康博士演讲的文字实录删减版本,了解更详细的情况,欢迎开通会员,并联络小Q[bigq100]进入会员专属,查看完整版.==

==完整视频观看地址:https://webcast.roadshowchina.cn/cmeet/NlZBZVhZRGZ6Q1NSRjdrbmJqQjZUQT09==


{w:100}{w:100} {w:100}{w:100}完整视频观看地址:https://webcast.roadshowchina.cn/cmeet/NlZBZVhZRGZ6Q1NSRjdrbmJqQjZUQT09

\