基于可见性图嵌入的沪深 300 深度学习增强策略
创建于 更新于
摘要
本报告提出基于可见性图的结构向量法,将沪深300股票日频量价时序转化为复杂网络,通过两阶段注意力循环神经网络(DA-RNN)和跨资产注意力网络(CAAN)预测股票上涨概率。该深度学习模型在选股和择时中表现突出:日频选股因子平均IC0.16,中性化后0.1,日度调仓多头组合年化超额收益95.6%,增强组合年化超额收益46.7%。通过个股信号合成沪深300股指仓位择时策略年化超额收益13.3%,预测准确率64%。多组图结构嵌入特征有效刻画股票潜在属性并实现股票分群,模型预测准确率验证集内达68%。风险提示包含模型基于历史数据可能失效及深度学习策略可解释性较弱等问题 [page::0][page::3][page::7][page::13][page::16][page::21].
速读内容
可见性图及复杂网络构建原理 [page::2-3]


- 可见性图通过时间序列中各点“可见性”关系,将价格序列映射为复杂网络结构,包含波动率及趋势信息。
- 可见性图对应的邻接矩阵反映节点间连线关系,最短路径等结构特征构建选股因子,日度IC约0.03。
- 复杂网络中节点权重采用CI指数衡量节点及其邻域的重要性。 [page::2-5]
结构向量法(struc2vec)无监督嵌入节点特征 [page::4-6]

- struc2vec通过计算节点的局部结构相似度构建多层加权图,进行多层随机游走采样。
- 利用skip-gram模型将随机游走的节点序列转换为嵌入向量,保证结构相似的节点向量接近。
- 该方法相比传统手工特征更高效准确,可应用大规模图。 [page::4-6]
动态神经网络预测框架 DA-RNN和跨资产注意力网络CAAN [page::7-10]



- DA-RNN采用双阶段注意力机制,编码器通过输入注意力选择重要嵌入特征,解码器结合时间注意力机制动态提取隐状态。
- CAAN利用资产间因子表征的相似度建立跨资产权重,通过多头注意力机制加强不同股票间的相关性建模。
- 两模块结合实现对股票涨跌概率的较高精确预测。 [page::7-10]
图结构隐状态聚类体现股票潜在属性与多维风格差异 [page::10-11]

- 采用k-means对沪深300股票图结构隐状态聚类,划分为10类,数量均匀分布。
- 聚类结果对应不同风格因子偏离(如beta、动量、市值、价值)及多种行业分布,体现隐特征区分力。
- 行业分布在证券、医药、银行等明显,周期性行业区分性相对弱。 [page::10-11]
模型训练参数及准确率表现 [page::12-13]


- 利用2010-2018年沪深300日频量价数据训练,采用8:2划分训练验证集,模型训练约一周。
- 验证集准确率稳定于68%,精确率超过70%,表现优良,支持模型可靠性。 [page::12-13]
struc_learning 因子优异的日频选股表现 [page::13-15]


- 个股涨跌概率作为因子,日度IC均值0.16,ICIR1.2,十组分层收益单调递减,表明稳健择股能力。
- 行业市值中性化后IC降至0.1,ICIR1.13,选股效果保留但有所削弱。
- 多头组合年化超额收益95.6%,信息比率8.0,但组合容量较低(约千万元量级)。 [page::13-15]
增强组合与择时策略表现 [page::16-18]





- 增加持股数构建沪深300增强组合,持股约137只,容量显著提升至约25亿元,年化超额收益46.7%,信息比率5.87。
- 个股信号综合生成股指涨跌概率,构建沪深300仓位择时策略,年化超额收益13.3%,信息比率1.47,预测准确率64%。
- 激进仓位择时策略收益可更高至年化29.3%,夏普比率2.41,但波动增加。 [page::16-19]
多空策略尝试及阈值调节分析 [page::19-20]

- 采用多组阈值分段多空交易,随着阈值区间缩小,模型预测胜率可提升至近75%,不过收益和夏普比率有所下降。
- 阈值[0.45, 0.55]区间多空策略取得最优夏普比率6.31,年化收益112.8%。[page::19-20]
研究总结与风险提示 [page::21-22]
- 利用可见性图结构嵌入及基于DA-RNN和CAAN的深度学习架构,模型精准预测沪深300股票日度上涨概率。
- 模型验证准确率约68%,选股因子日度IC0.16,带来显著的年化超额收益和良好风险收益比。
- 可见性图捕捉时序结构,结构向量法刻画股票潜在属性,结合跨资产注意力机制进行多层次建模。
- 风险包括历史数据依赖导致未来失效以及深度学习策略解释性较弱,策略窗口适合日频,长期及周频效果下降。[page::21][page::22]
深度阅读
金融研究报告详尽分析报告
题目:《基于可见性图嵌入的沪深 300 深度学习增强策略》
作者及机构:叶尔乐,民生证券研究院
日期:2023 年 10 月 13 日
主题:利用可见性图转化的时间序列复杂网络结构特征,通过深度学习方法提升沪深300成分股日频预测的选股及择时能力。
---
一、元数据与概览
本报告核心旨在探讨一种创新方法——将时间序列的量价数据通过“可见性图”转化为复杂网络结构,再借助结构向量法(struc2vec)抽取图结构嵌入特征,将此嵌入特征与传统量价数据融合输入双阶段循环神经网络(DA-RNN)及跨资产注意力网络(CAAN)进行个股涨跌概率预测,最后结合预测概率构建选股及择时策略。报告体现了基于图结构嵌入的神经网络模型在沪深300日频股票预测上的有效性,验证了模型的高准确率及高信息比率,选股和择时能力均显著,且能够结合个股信号合成指数择时信号。
主要结论包括:
- 模型预测的下一个交易日股票上涨概率验证集准确率达68%,精确率70%;
- 构建的日度调仓多头组合实现年化超额收益95.6%,信息比率8.0,尽管策略容量有限;
- 通过增加持股数量扩展组合容量(平均持股137只),沪深300增强组合年化超额收益仍达46.7%,信息比率5.87;
- 基于个股涨跌概率合成的沪深300指数仓位择时策略年化超额收益13.3%,信息比率1.47,涨跌预测准确率64%;
报告在最后亦提出风险提示,指出量化模型基于历史数据存在潜在失效风险。[page::0][page::21][page::22]
---
二、逐节深度解读
1. 可见性图的构造及图结构嵌入
1.1 可见性图
本节首先定义了“可见性图”(Visibility Graph)的构造逻辑。针对时间序列 \( P=(p1, ..., pn) \),两个时间点 \((ti, pi)\) 和 \((tj, pj)\) 之间存在“可见性边”当且仅当满足对所有介于中间点 \( tk \):
\[
pk < pi + \frac{tk - ti}{tj - ti}(pj - pi)
\]
即中间任何点的高度均低于 \( i,j \) 两点连线上的高度,从而从柱状图的“视角”解释时间序列的局部与全局波动结构。最终以图 \( G=(V,E) \) 形式映射时间序列,表示为邻接矩阵 \(\Gamma\),连接点为1,无连接点为0。
图1和图2分别以直观柱状图示意和实际沪深300某股2019年20个交易日收盘价实际构造可见性图,给出矩阵化的红白二维表示。报告指出:这一方法早由Lacasa等2008年提出,以来被广泛用于时间序列的分类与复杂网络分析中,其图结构继承了价格序列中的趋势及波动信息。
利用最简单图结构特征“平均最短路径长度”能够刻画U型或倒U型价格走势中波动率差异,报告验证了在全A股可见性图结构特征因子的日度信息系数(IC)均值约0.03,说明这一图结构特征具备弱有效选股能力。
图3展示此因子自2016年以来累计IC逐渐积累,日IC波动明显。
本节为后续结构向量法提取更复杂潜在因子奠定理论基础。[page::2][page::3]
1.2 复杂网络节点权重与结构向量法
本节引入网络节点权重问题,指出节点在复杂网络中信息价值不等,采用Morone和Makse2015年提出的“集体影响算法”(CI)计算节点权重,定义为中心节点跳步半径为2邻域节点的度数调整加权总和。
以某只股票过去20天量价指标为例(图4),展示节点权重的计算示意。
随后介绍结构向量法(struc2vec),这是一种由Ribeiro等2017年提出的无监督图嵌入算法。算法目标是根据节点的结构相似性生成节点嵌入向量,实现即使节点距离遥远也能反映结构身份。方法通过多层含权图构建节点结构相似度,借助多层随机游走产生上下文序列,使用skip-gram模型学习向量表达。
图5直观展示结构向量法计算流程。
强调结构向量法与CI权重算法功能不同,前者抽取隐藏结构特征,后者衡量单节点信息权重。二者生成的信息将一同输入后续模型。
本节明确了技术路线:数据通过可见性图转为复杂网络后,用CI算法提取节点权重,用struc2vec构造节点嵌入,为神经网络建模提供结构信息。[page::4][page::5][page::6]
---
2. 模型结构与开箱分析
2.1 基于图结构嵌入的深度神经网络
本节部署整体模型框架(图6):针对单只股票单日6个价量维度过去20个交易日数据,分别构建20×20可见图,计算20个节点CI权重和节点嵌入(32维向量),后者作为潜在属性嵌入。
预测模块包含双阶段注意力循环神经网络(DA-RNN)与跨资产注意力网络(CAAN)。DA-RNN两阶段设计可编码嵌入信息与原始量价变量,进而计算因子表示;多价量指标隐藏层合并后进入CAAN网络,CAAN以股票之间的因子向量相似度为关注目标,建立股票间相互作用。最终通过线性全连接层及sigmoid输出股票下一个交易日上涨概率。
图6详细框图显示模型层级及数据流。
该设计融合了单股结构信息和资产间相关性,提供较丰富的预测因子表示。[page::7]
2.2 DA-RNN网络详解
介绍DA-RNN双阶段机制(图7),第一阶段的编码器对输入特征(嵌入变量等)遍历时间步,利用输入注意力机制动态赋权重要特征;第二阶段的解码器依赖时间注意力机制,赋予不同时刻隐状态不同权重,提炼最终输出表示。
具体数学公式解析了单步特征权重计算及decoder上下文向量生成过程。DA-RNN优势在于有效动态捕捉特征和时间轴上的重点信息,避免简单特征拼接的缺陷。
证实模型能够充分利用嵌入图结构信息与时间序列信息融合建模。[page::8]
2.3 CAAN网络详解
CAAN作为股票间的跨资产注意力网络,重点描述股票因子表示向量的查询(Q)、键(K)、值(V)映射,并以内积计算注意力权重,进一步对资产价值向量进行加权聚合,最后通过全连接层及sigmoid转化为上涨概率。
图8展示CAAN结构示意图,强调股票间因子表示的相似度是注意力的核心,区别传统单资产时序自注意力。
此设计动态模拟股票相互影响,提高模型对市场信息传递的感知能力。[page::9]
2.4 图结构嵌入对股票分类效果
结合2022年相关文献,报告用k-means对沪深300股票的图结构隐层输出进行聚类,分为10类(图9)。
各类股票数量分布均匀,进一步计算沪深300风格因子偏离(日beta、盈利、成长、杠杆、流动性、动量、市值等,详见表格图10),分析显示每类风格偏离显著,尤其在beta、动量、价值等因子上的差异标志着结构特征的判别能力强。
行业分布(图11)显示部分行业如证券、银行、医药具有明显的图结构分类效能,而周期性行业分类较弱。
结论是图结构嵌入捕获股票潜在风格与行业属性,利于模型构建更具辨识力的因子表示。[page::10][page::11]
---
3. 模型效果实证
3.1 参数及准确率
模型使用2010-2018年沪深300日频量价数据训练,后续按年滚动预测2019年以后每日涨跌。训练过程耗时长(结构向量法训练单变量约10小时,整体三天以上),使用RTX4090显卡。
混淆矩阵指标定义准确率、精确率、召回率与F1分数,报告数据显示训练集准确率可达80%,验证集稳定在68%,精确率最高70%(图14、15)。
表明模型预测下一交易日收盘价涨跌具备较高的识别能力。[page::12][page::13]
3.2 模型选股表现
以模型输出的涨跌概率作为因子cmd="struclearning"回测,2019年至2023年表现突出,因子日度IC均值0.16,ICIR1.2,分组年化收益单调分布(图16、图17)。
经行业市值中性化, IC降至0.1但选股效果依旧显著(图18、图19)。
构建日调仓多头组合年化超额收益95.6%,信息比率8.0,胜率62.2%,换手率高达220次/年(图20-22)。
因子表现优异但容量有限,报告指出中性化收益下降缘于深度学习模型本身含有并利用了风格与行业多头收益信息,盲目剥离反而损害收益(图23、24)。
策略理想交易容量在1千万左右(图25)。
为解决容量问题,增加持股至137只,形成沪深300增强组合,年化超额收益46.7%,信息比率5.87,容量提升到24.7亿(图26、27、28),表现略有下降但更加稳健(图29)。[page::13][page::14][page::15][page::16][page::17]
3.3 模型择时表现
利用合成的沪深300成分股上涨概率构建指数仓位择时策略,按日从9:35开盘价格调仓,手续费双边千分之一。策略实现年化超额收益13.3%,信息比率1.47,指数涨跌预测准确率64%(图30-32)。
提升策略激进程度(满仓信号阈值下移至50%)使收益和波动率显著提升,夏普比率达2.41(图34、35)。
若支持做空,可采用多信号阈值策略,权衡收益和空仓频率,报告测试不同阈值的多空收益和胜率,阈值[0.45,0.55]平衡最佳(图36,37)。
以上表现说明模型预测能力强,且对指数层面择时同样有效,显示较好扩展性。[page::16][page::17][page::18][page::19][page::20]
---
4. 总结与思考
报告总结了利用“可见性图”将价量时序数据映射成复杂网络,从中提取结构嵌入向量(struc2vec)及节点权重(CI),并结合深度两阶段循环神经网络(DARNN)与跨资产注意力网络(CAAN),对沪深300股票进行明晰的日频涨跌概率预测。模型准确率高达68%,日频有效选股因子IC均值0.16,策略表现卓越,具备显著选时能力。
报告同时提醒限制:
- 可见性图时序转换适用的时效窗口较短,较适合日频而非周频等中长期建模;
- 深度学习模型存在可解释性且重训练时间长等挑战;
- 量化模型基于历史数据,市场变动可导致模型失效。
整体来看,该方法创新有效,将复杂网络理论应用于量化选股择时的做法值得关注并可进一步推广。[page::21]
---
5. 风险提示
明确指出量化模型基于历史数据,存在未来市场变化带来的失效风险,提醒谨慎投资。[page::22]
---
三、图表深度解读
- 图1-2:可见性图的构建示意与实际例子,直观展示时间序列如何转换为复杂网络,重要于理解后续方法;
- 图3:简单可见图结构因子日度IC较小但稳健累积,说明潜在有效性;
- 图4:CI节点权重示例,展示不同节点信息价值差异,为强化因子贡献度提供依据;
- 图5:结构向量法多层图、随机游走及skip-gram向量学习步骤,关键技术框架的视觉化帮助理解;
- 图6-8:模型架构图,清晰描绘各部分数据流转与网络结构,体现本文深度学习框架的逻辑;
- 图9-11:股票聚类与风格、行业分布图,显示图结构嵌入能有效分类股票,模型因子表现背书;
- 图12-15:参数设置及混淆矩阵基础说明,训练及验证准确率曲线,验证模型学习能力且表现良好;
- 图16-22:选股因子日度IC及年化收益,含中性化处理后效果展示,净值曲线彰显收益质量,体现核心选股能力;
- 图23-25:因子组合风格及行业暴露与容量估计,说明策略风格合理,容量有限;
- 图26-29:增强组合持股数、容量及表现曲线,展示扩容后的稳定收益;
- 图30-32:指数仓位择时信号与净值曲线,成功扩展模型为指数择时工具;
- 图33-37:激进择时及多空策略表现及信号阈值调节效果,提示策略灵活调整空间及风险收益权衡。
每张图与文本紧密结合,数据均合理匹配论文描述,主要图表均已充分利用,增强了技术及实证说明的说服力。
---
四、估值分析
本报告为量化研究报告,未涉及传统公司估值指标与估值模型。主要数据为因子IC、组合超额收益与信息比率等表现指标,属于策略性能评估而非企业估值范畴。
---
五、风险因素评估
报告提及的风险主要是模型基于历史数据,市场环境若发生结构性变化,策略可能失效,此外深度学习的不可解释性及重训练耗时也潜在增加使用风险。报告未详尽展开缓解措施,建议用户结合多模型及风险管理手段降低单一模型风险敞口。[page::22]
---
六、批判性视角与细微差别
- 模型数据与模型复杂度的平衡:报告基于沪深300流动性强股票做训练,结构向量法计算量大,训练耗时长,模型部署面临技术门槛,策略容量有限说明实际应用中或受流动性制约。
- 因子中性化导致性能下降:报告指出深度学习模型已捕捉风格和行业收益,中性化剥离部分信息使效果减弱,隐含模型对传统因子的依赖,表明深度模型尚未完全独立获得超额收益,可能存在替代传统因子的潜力但依然相关性较强。
- 数据窗口短与时效限制:可见性图适合短期(日度)分析,适用范围限制模型中长期应用场景。
- 可解释性不足:深度模型内涵复杂,失效时难以诊断原因,存在模型黑箱风险。
- 未明确策略费用对收益的全面影响,换手率极高可能对收益造成拖累,影响实际净收益;未来实现策略需考虑实现成本和冲击成本。
- 潜在信息溢出风险:模型预测依赖历时结构嵌入,如行情大幅波动,过去模式不一定延续,模型稳健性有待进一步压力测试。
- 无显著周期行业区分:行业间尤其周期性行业分类有限,反映模型在不同行业情境下识别能力的局限。
---
七、结论性综合
该报告系统介绍了基于“可见性图”映射时间序列至复杂网络并通过结构向量法提取节点嵌入向量,融合传统量价信息,通过双阶段循环注意力神经网络加跨资产注意力机制综合学习潜在股票结构信息和股票间关联,对沪深300个股实现日频涨跌概率预测,最终构建出集成选股与择时的复合量化策略。
实证结果显示,构建的深度学习模型在验证集准确率稳定68%,精确率70%左右,选股因子表现突出,日度IC均值0.16,回测年化超额收益高达95.6%,信息比率8.0,模型在持股扩充后依然保持较高收益和较强的策略容量(24.7亿),还成功实现基于个股信号的沪深300指数仓位择时策略,年化超额收益13.3%,信息比率1.47,涨跌方向准确率64%。
报告中对可见性图及其结构嵌入的理论机制讲解详尽,辅以多幅图表展现模型架构、训练趋势及风格行业分类,层层论证模型有效性,内容扎实,辅以全面风险说明。报告亦注意到深度模型的黑箱性、历史数据依赖及容量受限等现实运用难题。
综合来看,报告提出的基于时间序列复杂网络结构的深度学习增强策略,体现了金融量化领域跨学科融合创新,具有实际可操作性和拓展潜能,尤其适合短期日频交易策略构建,值得量化研究和投资应用层面关注和进一步跟踪优化。
---
参考图片(部分重要图示)
- 图1:可见性图连接规则示意

- 图3:可见性图结构因子日度IC表现

- 图6:基于图结构嵌入的深度神经网络结构

- 图7:DA-RNN网络结构

- 图16:struclearning因子日度IC及累计IC

- 图21:struclearning因子多头组合净值曲线

- 图29:沪深300增强组合净值曲线

- 图32:沪深300仓位择时策略净值

- 图36:不同阈值信号年化多空收益与胜率表

---
总评:
本报告展示了从金融时间序列信号的图结构特征提取、无监督嵌入学习,到深度循环神经网络预测与注意力跨资产建模的全流程量化策略开发,观测结果充分印证该策略对沪深300个股涨跌,及指数择时均表现优异。报告严谨系统,技术细节丰富,图文并茂,且结果引用充分佐证观点,凸显了复杂网络嵌入结合深度学习在量化投资中的新兴应用,具备较高的参考及实践意义。[page::0-22]
---
(全文字数约2800字)