【量化研报分享】华泰证券-华泰人工智能系列之三十四:再探 AlphaNet,结构和特征优化-20200824


(adhaha111) #1

摘要

本文从网络结构和特征优化的角度改进 AlphaNet,回测表现更好 :
华泰金工前期报告《AlphaNet:因子挖掘神经网络》(2020.6.14)提出了AlphaNet-v1 模型,能以端到端的方式有效提取股票原始量价数据中的因子。然而 AlphaNet-v1 在 2019 年下半年之后表现欠佳,针对该问题,我们分别从神经网络结构和特征的角度进行改进,构建了 AlphaNet-v2 和AlphaNet-v3 两个升级模型,并在多个股票池内测试。结果显示,在全 A股和中证 800 成分股中 AlphaNet-v2 表现优于 AlphaNet-v1,在中证 500成分股中 AlphaNet-v3 表现小幅优于 AlphaNet-v2。另外,本文总结对比了“遗传规划+随机森林”模型和 AlphaNet 的优缺点。

本文介绍了两个改进模型:AlphaNet-v2 和 AlphaNet-v3 的改进思路 :
相比 AlphaNet-v1,AlphaNet-v2 改进了以下几点:(1)考虑到比率类特征的有效性,扩充了 6 个比率类特征;(2)将池化层和全连接层替换为 LSTM层,从而更好地学习特征的时序信息;(3)训练集和验证集划分从 1:1 变成 4:1,验证集更关注近期样本的表现。相比 AlphaNet-v2,AlphaNet-v3改进了以下几点:(1)扩充特征提取层,特征提取层 1 和特征提取层 2 中的运算函数具有不同的回看区间(10 和 5);(2)将 LSTM 层替换为 GRU,减少模型参数。

在全 A 股和中证 800 成分股中,AlphaNet-v2 表现优于 AlphaNet-v1 :
设定回测期为 20110131~20200731,调仓周期为 10 个交易日。在全 A股中,AlphaNet-v2 相比 AlphaNet-v1 的 RankIC 均值从 9.72%提升至10.76%,ICIR 从 1.00 提升至 1.15。构建相对于中证 500 的行业、市值中性的全 A 选股策略,年化超额收益率从 17.17%提升至 19.09%,信息比率从 2.73 提升至 3.13。在中证 800 成分股中,AlphaNet-v2 相比AlphaNet-v1 的 RankIC 均值从 8.37%提升至 8.63%,ICIR 从 0.73 提升至0.75。构建相对于中证 800 的行业、市值中性的选股策略,年化超额收益率从 6.19%提升至 7.84%,信息比率从 1.65 提升至 2.00。

在中证 500 成分股中,AlphaNet-v3 表现小幅优于 AlphaNet-v2 :
设定回测期为 20110131~20200731,调仓周期为 10 个交易日。在中证500 成分股中,AlphaNet-v3 相比 AlphaNet-v2 的 RankIC 均值从 9.05%提升至 9.70%,ICIR 从 0.89 提升至 1.00。构建相对于中证 500 的行业、市值中性的选股策略,年化超额收益率从 9.40%提升至 9.75%,信息比率从2.19 提升至 2.30。

本文总结对比了 AlphaNet 和“遗传规划+随机森林”模型的优缺点:
AlphaNet 和“遗传规划+随机森林”模型都是基于量价数据的人工智能选股模型,本文对比了二者的优缺点。AlphaNet 的优点是:端到端学习使得因子挖掘和因子合成使用同一目标函数进行优化,且无需维护因子池,从而无需做大量的单因子测试、因子相关性分析、因子中性化等工作。另外,只需按情况对网络结构做一定调整,就可针对任意的股票池、预测周期、数据频率构建预测模型,省时省力。AlphaNet 的缺点是:模型可解释性较低,目前可嵌入神经网络的特征提取层还比较有限,没有覆盖遗传规划中全部因子计算函数。“遗传规划+随机森林”模型的优缺点则正好相反。