DeepAlpha短周期因子系列研究之：StockRanker在量化选股中的应用

由xiaoshao创建，最终由xiaoshao更新于2023-06-07 08:37 被浏览 760 用户

引言

在BigQuant平台(www.bigquant.com)上线的第一天，我们从互联网搜索引擎领域借鉴了PageRank算法引入到金融市场，提出了StockRanker算法，5年时间悄然过去，时间证明了StockRanker算法在金融量化选股领域的有效性。今天，我们对DeepAlpha-StockRanker进行简单介绍。

什么是DeepAlpha

Alpha在金融市场有特定含义，表示跑赢市场的超越收益，Deep借用深度学习（Deep Learning）“深度”一词，因此DeepAlpha指通过人工智能深度学习的技术挖掘超越市场的ALPHA收益的技术路线，示意如下:

{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100} 从上图看出，在因子数据的基础上，通过深度学习模型，我们可以快速开发出AI量化选股策略。这里的深度学习模型包括一些基本的深度网络，比如全连接深度网络(DNN)、卷积神经网络(CNN)、长短期记忆网络(LSTM)、对抗生成网络(GAN)、ResNet、TabNet等，同时我们也会引入NLP领域近年来炙手可热的算法，比如BERT、Transformer算法、GPT、XLNet算法，不仅如此，在其他领域我们还会引入图神经网络和深度强化学习等算法。

除了深度学习算法，使用机器学习算法来获取非线性收益的方式也是DeepAlpha研究内容，因此本文对StockRanker算法进行测评。

第一部分：StockRanker基本原理以及StockRanker的在股市使用的可行性说明

StockRanker有如下特点：

选股：股票市场和图像识别、机器翻译等机器学习场景有很大不同。StockRanker充分考虑股票市场的特殊性，可以同时对全市场3000只股票的数据进行学习，并预测出股票排序
排序学习 (Learning to Rank)：排序学习是一种广泛使用的监督学习方法 (Supervised Learning)，比如推荐系统的候选产品、用户排序，搜索引擎的文档排序，机器翻译中的候选结果排序等等。StockRanker 开创性的将排序学习和选股结合，并取得显著的效果 (具体见即将发布的benchmark报告)。
梯度提升树 (GBDT)：有多种算法可以用来完成排序学习任务，比如SVM、逻辑回归、概率模型等等。StockRanker使用了GBDT，GBDT是一种集成学习算法，在行业里使用广泛。

StockRanker的领先效果还得益于优秀的工程实现，我们在学习速度、学习能力和泛化性等方面，都做了大量的优化，并且提供了参数配置，让用户可以进一步根据需要调优。

第二部分：因子生成

交易型阿尔法体系

DeepAlpha属于交易型阿尔法研究体系。传统阿尔法体系的收益来源，往往集中于财务数据的挖掘、分析师一致预期数据的挖掘，而只有一小部分是中低频价量特征的数据。而在 A 股，市场交易行为具有很强的随机性，机构投资者的交易效率较之成熟市场亦不十分有效，加之 T+0、融券卖空等交易机制的缺乏，导致在短周期由于交易行为所产生的定价非有效十分常见。只要是投资者交易产生的价格序列，就一定不是随机序列，而这一特征在 A 股更为明显。

交易型阿尔法体系关注的特征主要是价格和成交量。对价量特征进行因子化处理的最大优势在于，避免了利用单一模式在时间序列上进行买点和卖点的选择，因为这牵涉到开平仓参数的敏感性问题等，会带来很大的不确定性和参数过拟合的问题。交易型阿尔法体系精髓在于，以当前市场的运行特征，寻找价格运行的规律。如果说传统阿尔法体系更加重视因子背后的价值投资逻辑，那么交易型阿尔法体系则更加重视交易行为背后的规律显著性，从某种意义上而言，这恰恰是最为直白朴素的投资逻辑。

再深度的神经网络也无法从无效的信息中掘金，因此在构建DNN模型之前，我们需要构建有效的市场因子，让模型能学习到市场的有效信息。

在因子生成上，我们参考了《华泰人工智能系列三十二——AlphaNet：因子挖掘神经网络》中的因子选择和构建的方式，然后再此基础上，提出了一套新的因子生成表达式。AlphaNet依照基本的价量因子构建特征“图片”，并在其上构建类似CNN的结构来识别并组合价量因子，例如使用相关系数、标准差、时序最大、时序最小、时序求和、加权平均等统计聚合方法。

基础数据

和《华泰人工智能系列三十二——AlphaNet：因子挖掘神经网络》基本一致，为了保证研究的客观性，我们没有给出富有ALPHA信息的因子，而是直接从量价行情基础数据中去构建因子。因此，我们使用了开盘价、最高价、最低价、收盘价、换手率、当日收益率、成交量这7个基础数据。只用这些基础数据，更多也是希望验证深度学习算法的预测能力。

生成表达式

在我们的DNN模型中，我们使用了时序求平均(mean)、时序求最大(ts_max)、时序求最小(ts_min)、时序标准差(std)、时序排序(ts_rank)、时序加权平均(decay_linear)、时序相关性(correlation)这6个表达式，和上述研报相比，我们并没有使用计算协方差(ts_cov)和计算Z得分(ts_zcore)这两个表达式，原因是协方差与时序相关性(correlation)基本一致，Z得分本质属于时序归一化，与时序排序(ts_rank)比较相关，这两个表达式无法产生更多具备预测信息含量的衍生因子，因此我们将其舍弃。

表达式	含义	说明
mean	时序平均	共生成7个衍生因子，例如mean(close_0, 5)
ts_max	时序求最大	共生成7个衍生因子，例如ts_max(close_0, 5)
ts_min	时序求最小	共生成7个衍生因子，例如ts_min(close_0, 5)
std	时序标准差	共生成7个衍生因子，例如std(close_0, 5)
ts_rank	时序排序	共生成7个衍生因子，例如ts_rank(close_0, 5)
decay_linear	时序加权平均	共生成7个衍生因子，例如decay_linear(close_0, 5)
correlation	时序相关性	生成21个个衍生因子，例如correlation(close_0, volume_0, 5)
	向前偏移	7*5=35个，例如close_4
衍生因子数		共计98个（7*6+21+35）

在生成好98个因子后，我们未对因子进行标准化处理。因为树模型可不要求数据标准化。

第三部分：构建StockRanker基准模型

开发流程

如下是一个AI策略主要流程的示意图：

AI策略开发流程图{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}

相对于传统策略开发的复杂流程和调参等大量重复工作，AI策略开发更简单，将我们的脑力从重复工作上解放出来，专注在更有创造性的地方。

BigQuant 对AI策略开发做了抽象，设计了如下开发流程 (以 StockRanker 算法为例，也可以使用其他算法)：

目标：首先定义机器学习目标并标注数据。很多机器学习场景，需要人来做数据标注，例如标注图片里的是猫或者狗。对于股票，我们关注的风险和收益是可以明确定义并自动计算出来的。所以，我们一般使用未来N天的收益或者收益风险比作为标注分数。本文使用未来给定天数的收益作为标注
数据：我们需要训练数据集来训练模型，已经评估数据集来评估效果。在模型参数研究中，我们一般还需要一个测试集用来观察调参效果
特征(因子)：特征是量化研究的核心之一，在AI策略上，特征直接影响了模型的学习效果。这也是本文的目的之一，通过AI找出在A股有效的因子，并最大化的挖掘出他们的效果
算法模型：本文使用StockRanker算法，使用 M.stock_ranker_train 来训练模型，使用 M.stock_ranker_predict 来做出预测
回测：使用回测引擎来根据预测做股票交易，并得到策略收益报告和风险分析，并以此来评估策略的最终效果

基准模型参数

训练集时间：2010年1月1日到2017年12月31日

测试集时间：2018年1月1日到2022年4月20日

预测目标：未来5日收益率

模型：StockRanker

学习算法：排序

叶节点数量: 30

每叶节点最小样本数：1000

树的数量: 20

学习率: 0.1

特征值离散化数量: 1023

特征使用率：1

回测：

股票池：所有A股
交易成本：买入万分之3、卖出千分之1.3，不足5元按5元收取
买入规则：每天买入全市场所有股票中排序靠前的50只股票
卖出规则：每天卖出持仓股票中排序靠后的股票
资金管理：每个交易日进行交易，每个交易日等资金配置
股票权重：股票权重与股票排序结果成正比
回测中的模拟成交剔除停牌、涨跌停等异常情况

基准模型测试结果如下：

{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100} 总体来看，18年1月1日到2022那年4月20日，总共收益22.75%，年化收益5.08%，虽然超越了基准收益率0.99%，但夏普比率为0.2并不高。

效果不是特别好的原因很多，比如训练集划分、模型参数、数据清洗处理、模型长期未更新等，因此给予了研究员更多的优化方向。

第四部分：模型稳定性测试

我们对叶节点数量、每叶节点最小样本数、树的数量、学习率四个模型超参数进行测试，验证模型对此参数稳定性。结果见下表，可横向左右拖动。

模型	总收益	年化收益率	最大回撤	夏普比率	收益波动率
Baseline模型（叶节点数量: 30每叶节点最小样本数：1000树的数量: 20学习率: 0.1）	22.75%	5.08%	24.08%	1.06	21.16%
叶节点数量对照组	number_of_leaves	https://bigquant.com/experimentshare/fcad8f4e29ad4fd5b29f3aece6ea7ddc
叶节点数量：10	-14.64%	-3.75%	39.4%	-0.22	20.68%
叶节点数量：20	30.22%	6.59%	24.24%	0.27	20.51%
叶节点数量：40	8.49%	1.99%	27.39%	0.07	22.12%
叶节点数量：50	15.97%	3.64%	25.3%	0.14	21.41%
每叶节点最小样本数对照组	minimum_docs_per_leaf	https://bigquant.com/experimentshare/2088e5909447410ca648173b547887ff
每叶节点最小样本数 500	-18.27%	-4.76%	39.13%	-0.33	18.64%
每叶节点最小样本数 800	12.29%	2.84%	29.17%	0.1	21.7%
每叶节点最小样本数 1200	4.89%	1.16%	27.51%	0.02	20.86%
每叶节点最小样本数1500	3.77%	0.9%	27.34%	0	19.75%
树的数量对照组	number_of_trees	https://bigquant.com/experimentshare/e48bec32113447839d439451820ab79b
树的数量:10	45.43%	9.47%	25.98%	0.38	22.72%
数的数量:20	30.14%	6.57%	27.1%	0.27	21.97%
数的数量:40	12.58%	2.9%	26.72%	0.1	20.86%
数的数量:50	10.36%	2.41%	27.55%	0.08	21.02
学习率对照组	learning_rate	https://bigquant.com/experimentshare/d5bc98bf794d4f70a61c293e39cbbab6
学习率：0.05	17.05%	3.88%	26.31%	0.15	22.53%
学习率：0.15	0.68%	0.16%	32.92%	-0.02	21.66%
学习率：0.2	8.22%	1.93%	25.93%	0.05	20.42%
学习率：0.25	16.2%	3.69%	29.15%	0.14	21.99%
交易成本对照组
双边费用 buy_cost=0.0003, sell_cost=0.0013
双边费用 buy_cost=0.0008, sell_cost=0.0018	8.31%	1.95%	28.23%	0.06	21.03%
双边费用 buy_cost=0.001, sell_cost=0.002	0.16%	0.04%	30.93%	-0.03	20.89%
双边费用 buy_cost=0.001, sell_cost=0.003	-20.39%	-5.36	41.52%	-0.31	20.63
双边费用 buy_cost=0.002, sell_cost=0.002	-14.77%	-3.79%	38.4%	-0.22	20.79%
双边费用 buy_cost=0.002, sell_cost=0.004	-40.91%	-11.94%	49.62%	-0.66	20.57%

稳定性测试可以看出目前基准模型默认的参数是表现不错的一组，这得益于我们17、18年在大量的数据上进行过参数测试，选出了模型效果不错的一组参数。

第五部分：滚动训练回测

滚动训练机制

金融市场每个时间阶段具有不同的风格特征，找到任何时间都能战胜市场的模型不太现实，比如17年出现过“漂亮50与要命3000”，18年有白马股回调，20年的大盘成长，因此我们需要不断地更新模型更新策略，以适应不断变化的市场。在该DNN模型当中，我们采用了滚动训练的方式来更新迭代模型，以模拟真实的市场交易和模型训练。我们选择使用前3年的数据进行训练，后一年的数据进行测试，以滚动训练的方式测试我们的DNN模型。滚动训练机制介绍如图所示：

{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}

上图是滚动训练的一个简介，看出随着时间的流逝，我们会定期用最新的数据重新训练一个新的模型。

滚动训练回测结果

{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100}{w:100} 可以看出，这是一个具有正收益系统的量化策略，收益曲线整体长期向上。对AI量化感兴趣的研究员可以在此基础上进行调优。

滚动训练年度统计

从年度数据统计来看，有大约65%的年份超过了基准。

回测时间	收益率	年化收益率	基准收益率	夏普率	收益波动率	最大回撤	是否超越基准
2009年1月5日-2009年12月31日	348.07%	370.66%	96.71%	5.29	29.66%	14.98%	是
2010年1月4日-2010年12月31日	70.92%	74.75%	-12.51%	2.17	25.9%	21.64%	是
2011年1月4日-2011年12月30日	-6.11%	-6.3%	25.01%	-0.27	24.43%	23.57%
2012年1月4日-2012年12月31日	27.67%	28.83%	7.55%	0.94	28.05%	20.43%	是
2013年1月4日-2013年12月31日	88.83%	96.02%	-7.65%	2.82	23.82%	13.5%	是
2014年1月2日-2014年12月31日	113.29%	117.96%	51.66%	3.23	24.19%	14.57%	是
2015年1月5日-2015年12月31日	2.76%	2.85%	5.58%	0.21	41.88%	45.92%
2016年1月4日-2016年12月30日	45.95%	47.77%	-11.28%	1.33	30.78%	16.26%	是
2017年1月3日-2017年12月29日	-8.51%	-8.78%	21.78%	-0.33	26.23%	22.16%
2018年1月2日-2018年12月28日	4.51%	4.68%	-25.31	0.21	31.64%	27.1%	是
2019年1月2日-2019年12月31日	40.53%	42.1%	36.07%	1.45	24.27%	17.14%	是
2020年1月2日-2020年12月31日	-1.91%	-1.98%	27.21%	-0.17	18.59%	18.91%
2021年1月4日-2021年12月31日	20.85%	21.7%	-5.2%	1.11	16.24%	12.33%	是
2022年1月4日-2022年04月20日	-17.52%	-51.03%	-15.67%	-2.81	25.32%	21.22%

研究总结

StockRanker具备选股能力

该算法能挖掘出交易型收益来源，在大量数据上看到了一定的选股效果。

手续费对策略影响很大

在手续费参数的测试中，我们发现因为该策略换手率较高，因此手续费直接影响到策略收益率，建议用户可设置较高的手续费，例如单边千2来二次验证策略的有效性和收益能力。

模型不能静态不变

基准模型因为只训练了一次就长期没有更新，因此夏普比率并不高，我们看到当模型滚动训练，每一年用最新的数据进行一次更新，策略效果更好。

超参搜索很有必要

我们不鼓励像炼丹师那样去寻找全局最佳参数，但是也不支持直接固定的一组参数，不同的市场下模型的平原参数会动态变化，因此建议不能缺失超参数搜索这一步骤。