`

AlphaCY 系统优化系列报告 (一)──引入多时间维度特征对市场短期状态分类优化

创建于 更新于

摘要

本报告基于深度学习优化了股票市场短期状态分类模型,通过引入日、周、60分钟多时间维度价量特征及改进卷积网络结构,显著提升个股状态预测准确度至60%以上。利用NT和GAF两种时间序列转换方法,揭示模型内部卷积核对短期价量特征的捕捉能力。基于预测的市场状态构建简单择时策略,回测结果显示在沪深300、宁德时代、债券及可转债等多资产上均实现超额收益,证明方法有效性和广泛应用潜力[page::0][page::5][page::7][page::11][page::14][page::17]。

速读内容


多时间维度价量特征引入与转换方法 [page::5][page::6]


  • 引入日线、周线、60分钟线三种时间尺度的OHLCV数据,扩充特征维度。

- 使用Gramian Angular Field (GAF) 和 Naïve Transformation (NT) 两种技术将1D时间序列转换为二维图像供CNN处理。
  • 通过实例展示NT和GAF转换的不同特征图像,助力模型识别复杂价量微结构。


优化卷积神经网络结构与内部参数分析 [page::7][page::8][page::9]



  • 改进卷积网络加深深度,采用多核尺寸探索不同价量特征信息。

- 卷积核参数分析显示有用信号主要集中于最近3个时间点,尤其是成交量与开盘、最高、最低价的结合。
  • GAF特征图更关注序列内部时间依赖,NT特征图捕捉跨变量的微结构关系。


模型准确度提升及季度表现对比 [page::11][page::12]




  • 在750只股票样本上训练测试,改进模型准确率显著提升,验证集准确率均超60%。

- NT-CNN在各种市场状态下表现更加稳定,GAF-CNN在不同季度表现波动较大。
  • 模型在样本外数据测试集上仍可保持接近58%的较好准确度。


个股市场状态预测结果与股价波动对比 [page::12][page::13]


  • 通过颜色标注不同预测状态,清晰反映股价的涨跌趋势变化。

- 市场状态作为强化学习策略的有效输入,辅助决策制定。

简单市场状态择时量化策略及回测 [page::13][page::14][page::15][page::16][page::17]


| 标的 | 夏普比率 | 累积收益 | 交易次数 | 平均持仓天数 |
|---------|---------|---------|---------|------------|
| 沪深300 | 3.60 | 88.23% | 17 | 7.41 |
| 宁德时代 | 2.96 | 510.03% | 12 | 11.25 |
| 中债指数 | 3.42 | 6.19% | 6 | 31.20 |
| 万孚转债 | 3.14 | 51.08% | 12 | 7.92 |
  • 基于状态0(持续下跌)、7(持续上涨)制定买卖规则,简单而有效。

- 策略在沪深300指数回避大幅下跌行情,取得约94%的超额收益。
  • 宁德时代因股价本身强势,策略创造超额收益464%。

- 债券指数波动平滑,策略表现稳健但盈利空间有限。
  • 可转债市场表现极佳,策略有效避开多波段下跌,显著超越标的收益。


结论与展望 [page::17]

  • 引入多时间维度价量特征和卷积网络改进明显提升短期市场状态预测能力。

- 模型深层内参揭示了价格与成交量的微结构关系,具有较强解释力。
  • 简单的状态预测择时策略已在多种资产类别展现出强大的应用价值。

- 未来将继续优化网络结构,提高状态识别准确率,完善强化学习投资决策体系。

深度阅读

元数据与概览


  • 报告标题:《AlphaCY 系统优化系列报告(一)──引入多时间维度特征对市场短期状态分类优化》

- 作者:邱冠华(执业证书编号:公S1司23研05究20类0模10板003)
  • 发布机构:浙商证券研究所

- 发布日期:2022年7月9日
  • 研究主题:利用深度学习技术,通过引入多时间维度的价量特征,优化A股市场个股短期市场状态的分类模型,从而提高市场状态预测的准确率,并验证其在投资择时策略中的应用效果。


核心论点与主要信息
  • 报告基于前期1.0版本模型,进行了特征扩展(增加不同频率的数据)和模型结构(卷积神经网络深度和核大小)优化,形成2.0版本,使市场状态预测准确度提升约10%。

- 采用高频(60分钟线)和低频(周线)数据结合日线数据进行多时间维度特征提取,增强模型对市场变化的反应能力和适应性。
  • 引入两种特征转换技术:Gramian Angular Field (GAF)和Naïve Transformation (NT),使一维价量序列转换成二维图像,便于用卷积神经网络处理。

- 训练的卷积核参数分析揭示了价量特征内在联系,反映了市场微结构的有用信息。
  • 经过验证,优化后的模型在个股短期市场状态预测准确度显著提升,并在多类型资产上构建的择时策略展现良好回测表现。

- 报告强调该系统在未来将为进一步结合强化学习投资决策提供坚实基础,展现广阔应用前景。[page::0,3,4,5]

---

逐节深度解读



1. 研究背景


  • 深度强化学习方法已成功应用于A股67个行业赛道的轮动跟踪,超额收益明显。

- 本文继承相同的系统模型,转向对个股的短期市场状态进行建模与预测,并利用多时间维度价量数据优化该模型。
  • 对比了三种机器学习模型:GAF-CNN、NT-CNN、LSTM-RNN。结果显示,前两者擅长提取蜡烛图价量特征,预测精度优于LSTM-RNN。

- GAF方法分别转换5个时间序列(OHLCV),提供丰富信息;NT方法将OHLCV序列整合为一张图,提供更多特征间的关联信息。
  • 本文以上期表现最佳的GAF-CNN作为基准模型(Baseline),在此基础上进行特征工程和网络结构优化。[page::3]


1.2 预测个股市场短期状态


  • 定义市场状态由未来1日、5日、10日的涨跌状态确定,组合成一个三元组[S1, S5, S10],映射为8种不同市场状态(表1)。

- 状态0代表三期均跌,状态7代表三期均涨,其他状态表示不同组合。
  • 该分类为后续强化学习投资策略的输入变量。[page::3]


---

2. 优化市场状态分类模型



2.1 特征转换方法:GAF与NT


  • GAF:通过归一化和极坐标变换,将1维时间序列转换为2维图像矩阵,表示序列两两时刻角度的余弦值,保留时间依赖结构。

- 5个OHLCV序列分别做GAF转换后叠加,形成(2D×5)维度输入。
  • NT:将5个OHLCV时间序列统一看作一个整体,将10个时间点的OHLCV数据铺成一个10×5的二维图像,整合多维信息。

- 形成方便卷积神经网络消化的二维输入特征图。[page::4]

2.2 扩充不同时间维度数据特征


  • 引入60分钟线(高频)和周线(低频)数据特征,补足单一日线数据的不足。

- 采样时,以交易日d为基准,选取[d-9,d]的日线10时间步数据;同时选择以当天15:00点为终点的过去10个60min时间步,以及周线分隔的10个历史周时间步。
  • 三个时间段均进行GAF或NT转换,分别得到三组2D卷积特征。

- 通过这种多频征集,模型能够同时捕获不同时间维度行情变化,更灵敏且鲁棒。
  • 图1示意了不同时间尺度样本特征的采样整合过程,图2~7展示了样例股票000498.SZ在三种时间尺度下K线和转换特征图。










[page::5,6,7]

2.3 优化卷积网络结构


  • 引入深层卷积网络结构,对多时间维度特征的三个输入(60min、日线、周线)分别应用对应独立相同结构CNN。

- 三组预测结果通过全连接层融合输出最终的状态分类概率。
  • 卷积核尺寸从大到小依次减小(5×5,4×4,3×3),增强对多尺度特征的捕捉。

- 图8展示了整体网络结构示意图。


  • 分析训练完成的卷积核参数发现:

- 第一层卷积核侧重最近3个时间步的价量特征,尤其关注前一时刻的收盘价与成交量的结合,以及开盘价与前期最高最低价的组合微结构。
- 第二层卷积核仍体现时间序列的近期特征聚焦。
- 第三层卷积层的权重分布较为均匀,无明显时间聚焦。
  • 图9-14分别为NT-CNN和GAF-CNN不同卷积层卷积核权重热力图及采样示意,揭示不同时间序列及价量指标组合对分类贡献的细节。


NT-CNN第一层卷积核参数示例重点突出:




GAF-CNN卷积核关注的是单一时间序列自身内部不同时刻的相互关系,缺乏明显时间分布的聚焦:




[page::7,8,9,10,11]

---

3. 模型测试表现对比



3.1 个股市场状态预测准确度


  • 以750只股票样本池为对象,用2021年各季度数据训练验证,比较Baseline模型(初始结构)、改进NT-CNN和改进GAF-CNN三者预测准确率。

- 改进模型训练准确率达63%-65%,验证集约62%,测试集56%-58%,均明显高于Baseline模型50%-55%。
  • 图15、表2呈现了具体准确率对比,改进模型提升近10个百分点。

- 两种特征提取方法表现相近,NT-CNN呈现更平稳稳定的准确度,GAF-CNN准确率受季度行情变化影响较大,2021下半年出现波动略逊色。
  • NT-CNN 2021年各季度预测准确率保持在50%-70%之间波动,GAF-CNN各季度有更明显波动,Q2、Q4表现相对弱。






[page::12]

3.2 个股市场状态预测结果的股价波动提示效果


  • 利用优化后的最优模型,将当日预测的市场状态以不同颜色点显示在个股收盘价时间序列上。

- 以000498.SZ为实例,图18演示预测状态色彩点与价格走势的对应关系,涨跌初期状态变动及时,直观体现价格趋势转折信号。
  • 该直观效果为后续强化学习投资策略提供了可靠的信号基础。

- 报告指出当前模型仍有较大提升空间,后续将进一步优化网络结构增强对价量及信息相关性的捕捉能力。



[page::13]

---

4. 市场状态预测应用案例



4.1 基于市场状态的择时策略设计


  • 构造简易择时策略:

- 状态7(未来1、5、10天均上涨)且当前无持仓时买入;
- 状态0(未来1、5、10天均下跌)且当前持仓时卖出;
- 其他状态不做动作;
  • 无加仓、无做空策略,更偏向防守性择时。

- 结合前述状态颜色释义,深蓝代表状态7,深红为状态0,买卖点明晰。

4.2 策略应用于多资产回测分析


  • 选取四种代表性资产:

- 沪深300指数(399300.SZ)
- 个股:宁德时代(300750.SZ)
- 债券指数:中债-新综合财富总值(CBA00101.SZ)
- 可转债:万孚转债(123064.SZ)
  • 表3报告各策略表现的夏普比率、累计收益、交易次数及平均持仓天数:


| 资产类型 | 夏普比率 | 累积收益 | 交易次数 | 平均持仓天数 |
|-----------|-------|--------|------|--------|
| 沪深300 | 3.60 | 88.23% | 17 | 7.41 |
| 宁德时代 | 2.96 | 510.03%| 12 | 11.25 |
| 中债总财富指数 | 3.42 | 6.19% | 6 | 31.20 |
| 万孚转债 | 3.14 | 51.08% | 12 | 7.92 |

[page::14]
  • 沪深300(图19)

- 2021市场整体走跌,策略准确判别低迷期空仓,避免重大亏损,实现约94%的超额收益。
- 夏普比率3.60,显示风险调整后收益良好。
- 策略期间存在浮亏,但整体收益显著。

沪深300状态预测与策略回测
沪深300择时持仓状态与价格走势
沪深300策略累积净值曲线
  • 宁德时代(图20)

- 策略同样在股价调跌期准确空仓,避免大幅亏损。
- 2021年该股表现亮眼,策略实现强劲超额收益464%。
- 交易节奏适中,策略持仓期相对更长。

宁德时代市场状态及累计净值
宁德时代择时持仓与走势
宁德时代策略净值增长
  • 中债新综合财富总值(图21)

- 该债券指数行情平稳连续,策略回测收益略优于指数本身(约6%累积收益)。
- 策略交易较少,持仓长期,有效跟踪低波动资产行情。

债券指数持仓状态与价格走势
债券指数策略持仓及走势
债券指数策略累计净值
  • 万孚转债(图22)

- 标的呈震荡行情,但策略能有效捕捉涨跌波段,进行买卖切换。
- 年化收益为负价差的标的,通过择时策略实现了正向累积收益88%。
- 适合以波段交易为主的震荡市场。

万孚转债市场状态及策略

[page::15,16,17]

---

估值分析



本报告主要聚焦于市场状态分类模型的设计、优化及应用回测,未涉及具体企业价值或财务指标的估值分析。其核心为基于深度学习的市场状态分类与择时策略回测,所有收益数据均从策略效果汇总体现,没有估值模型和市盈率类估值分析内容。

---

风险因素评估


  • 报告最后明确风险提示指出:

- AI模型构建策略基于历史数据统计归纳,模型虽力求自适应市场规律,但仍存在失效可能。
- 预测基于数据,不能保证准确无误,投资者需要谨慎使用。
- 不构成任何投资建议,仅供参考。
  • 法律声明部分保证信息尽力可靠,但不保证完整性与时效性,免责条款明确本报告不承担投资风险责任。

- 潜在风险包括但不限于模型过拟合、数据噪声、市场非线性突变及未来市场环境与历史数据差异。
  • 报告未给出具体概率评估或缓解策略,仅提出谨慎态度与理性应用理念。


[page::19]

---

批判性视角与细微差别


  • 模型提升准确率在60%-65%左右,仍有近40%样本预测未能覆盖,表示现实市场复杂且预测难度较大,机器学习表征还不够完美。

- GAF与NT各有优势,NT表现更稳健但相对信息表达较为简单,GAF信息更丰富但受市场波动影响较大,模型选择具有一定权衡。
  • 报告仅构建了简单择时规则(买入状态7,卖出状态0),并未考虑中间复杂状态和调仓比例等,策略较为基础,实际操作中可能受滑点、成本等多因素影响。

- 回测中交易次数有限,尤其债券指数较少交易,不能充分体现极端市场下的策略鲁棒性。
  • 未明确考虑模型在极端、突发事件(如黑天鹅)时的应对能力。

- 卷积核参数的训练结果虽揭示部分价量特征结构,但其解释仍较为初步,缺少对各特征重要性及因果关系的深度量化。
  • 报告断言多周期数据提高模型稳定性和反应速度,合乎逻辑但未披露具体各时间尺度贡献的数值对比细节。

- 整体来看,报告展现出的研究工作扎实、数据充分,但投资应用仍需谨慎,持续优化和补充验证是未来方向。

---

图表深度解读


  • 图1(样本特征采样原理):展示了如何以交易日为时间轴基准,从日线、60分钟线、周线各自截取10时间步样本数据叠加形成多时间维度特征。该图示明确界定了多频率数据的时间匹配方式,是多周期特征体系搭建的基石。[page::5]
  • 图2~7(000498.SZ三种时间频度的K线及NT/GAF转换):分别从日线、周线、60min线三个频率展示了K线图(左侧)及其NT/GAF转换后形成的二维灰度图(右侧),多图像侧面印证提出的转换方法能够有效将一维价量信息映射到CNN可接受的二维图像结构,为后续自动特征提取铺路。[page::6,7]
  • 图8(模型网络结构图):说明三个频率转换后的特征图分别通过相同深度3层卷积层处理后,再汇聚到两层全连接层输出8类市场状态概率。该结构合理利用多渠道特征并行学习后融合提供了完整、多维度的状态捕捉方案。[page::7]
  • 图9-14(卷积核参数训练结果)

- NT-CNN第一层卷积核参数图表现出对近期价量数据(尤其t和t-1时刻OHLCV组合)的强关注,见通道4通道叶片示意(图10)。
- 后续两层卷积核权重更为分散,关注整体图像局部结构。
- GAF-CNN卷积核分布反映出时间序列内部的长短期时刻间相互关系,缺少明显的短期时间聚焦,说明GAF特征侧重历史信息整体关联。
- 这体现出两类特征转换方法在特征表达和网络学习重点上的显著差异。
- 该深度分析为理解模型预测依据提供了机器“视觉”认知视角。[page::8-11]
  • 图15、表2(模型准确度对比):显著显示NT-CNN和GAF-CNN相较于Baseline提升10%左右的预测准确率,验证了多时间维度特征及网络深度优化效果,测试集达57-58%的准确率表明模型具备一定实用价值。[page::12]
  • 图16-17(各季度准确率):展示NT-CNN表现稳定,而GAF-CNN存在季度之间波动,提示特征选择和模型鲁棒性需进一步优化,市场环境变化对模型影响明显。[page::12]
  • 图18(市场状态预测结果可视化):通过彩色点将八类市场状态映射在价格曲线上,体现价格涨跌转折点对应不同市场状态的聚合,直观表现模型对市场微结构的识别动态。[page::13]
  • 图19-22(资产回测结果)

- 分资产展示市场状态点与价格走势关系,策略持仓信号标识(绿色影线)以及策略净值曲线对比指数原始走势。
- 各资产策略均显示有效避开显著跌势,特别是沪深300和宁德时代表现超越基准指标。
- 可转债资产体现策略在震荡市场中的波段择时能力。
- 渐进升值的累计净值曲线和合理的夏普比率佐证了策略的风险调整收益优势。[page::14-17]

---

结论性综合



浙商证券研究所发布的《AlphaCY 系统优化系列报告(一)》通过引入多时间维度的价量特征(包括高频60分钟线和低频周线),结合两种主流特征转换方法(GAF与NT),并深化卷积神经网络结构设计,大幅提升了A股市场个股短期市场状态预测的准确度。基于750只股票的2021年历史数据测试,改进模型较原Baseline版本预测准确率提升约10个百分点,达57%-65%以上,展现出良好的泛化能力和稳定性。

训练完成的卷积核权重参数揭示了模型对价量微结构的敏感聚焦,尤其重视近时刻的开盘价、最高价、最低价及成交量的结合,体现了深度学习对市场中短期价格走势内在规律的捕捉能力。GAF和NT两者模型各有优势,NT表现更为稳定,GAF信息丰富但受行情波动影响较大。

模型预测的短期市场状态不仅准确预示股票价格的变动趋势,还通过简单基于状态的择时策略获得了显著的实用价值。回测覆盖沪深300指数、蓝筹股宁德时代、债券指数及可转债等资产类别,均表现出超额收益和优秀的风险调整表现,尤其在2021年指数整体下跌及个股震荡行情中,策略通过及时做空避免亏损,实现了高达88%-510%的累积收益和3.1以上的夏普比率,充分验证了arket状态分类预测的实际投资应用潜力。

报告强调,后续仍有空间通过更复杂的网络结构优化及强化学习技术进一步提升模型稳定性和预测准确率。风险提示中明确指出模型基于历史数据归纳,存在失效可能,投资需谨慎。

总体而言,该研究成果为结合深度学习与多时间尺度价量数据的市场状态识别提供了全新的视角和方法基础,并且通过实际资产的成功回测,推动了量化策略在中国A股市场的理论与应用进步,具有较强学术价值和投资实践指导意义。[page::0-19]

---

参考文献



报告引用了Wang & Oates(2015)提出的GAF方法以及相关利用时间序列成像进行分类的研究,结合Chen & Tsai(2020)的深度卷积烛台学习器方法,构筑了本研究的技术框架。

---

总体结构说明



本报告采用严谨的章节结构,涵盖研究背景、模型设计、数据特征转换、深度神经网络结构优化、模型性能测试、市场应用策略及多资产回测,辅以详实图表和卷积核参数分析,数据充分,论证严密,呈现了现代金融工程与机器学习方法结合应用的综合范例。

报告