DeepAlpha-DNN对高频双股轮仓策略的应用分析

由liuhooly创建，最终由liuhooly更新于2022-06-27 02:56 被浏览 273 用户

作者：liuhooly

前言

首先感谢平台给了和众位大神一起学习和实践DNN的机会，我应该是这次里面经验比较浅的，因为一直以来使用的都是

StockRanker，因此本文的使用体验上会有一定的两种学习方法的对比理解。不一定准确，大家参考即可。

策略构建

标注

因为是高频轮仓，所以主要是用的第二日收盘价与第一日开盘价的比值来做收益标注（shift(close, -2) / shift(open, -1)-1），同时，将所有股票按照100个区间进行标注区分。其实再过往经验中，该方法不一定是最好的，因为有出现过使用第3日或第5日收盘价反而表现更好，但是这点为什么无法解释清楚。

训练时间

训练时间上我选择了是20年1月1日到22年1月1日，选择该训练时间的原因有两个：

1、根据不完全观测，大部分的策略在20年前有效的，20年后都失效了，可以认为随着市场竞争加剧，针对量化交易的手段变多，简单的策略越来越无法取得正收益。因此如果训练模型和大多数模型一样，使用过去较长的时间，可能会趋同于大部分策略，这样也有可能被反向狙击。

2、大家都知道滚动训练是一种比较有效的方法，滚动训练一般是按照2~3年的周期进行滚动，认为选择近2年，相当于手动滚动。也可以按照半年或者1个季度进行人工滚动。

数据过滤

数据过滤方面，我常用的有两个，股票池和条件过滤。

股票池一定是会剔除ST、停牌、创业板之类的。偶尔会区别的是大盘股或中证500，喜欢中证500是因为大部分时候中证500是所有股票池综合表现最好的，好中选好么。

条件过滤通常会使用的有两个，一种是今日跌，明日买入，一种是只买入有市盈率的（或企业净收入为正）。原因纯粹个人偏好，不一定准确。在本次实验中，发现这2个条件都不怎么好，特别是过滤了之后来喂数据，无论如何调整，换因子，都无法取得好的收益，所以后来就放弃了。最终本次实验剩下的都是没有条件过滤的。这带来一个思考，DNN是否应该彻底摒弃一些人为条件，而完全信赖它呢？