万图师 AI 看图选指数——机器学习系列
创建于 更新于
摘要
本报告基于深度学习卷积神经网络(CNN),使用指数K线图的竹线图形式进行模式识别,训练万图师AI模型对行业指数及行业ETF进行周频轮动择时。策略在2019年至2023年无摩擦交易下,最高年化收益达31.33%,夏普比率最高1.63,显著优于沪深300指数,表明AI技术在指数择时策略构建上具备较强应用潜力和有效性 [page::0][page::3][page::4][page::10]
速读内容
1. 万图师 AI 模型方法论与数据处理流程 [page::3][page::4]

- 采用日频开盘、收盘、最高、最低价和成交量数据,绘制成20天窗口灰度竹线图作为模型输入特征。
- 使用未来5日或20日累计收益的二分类标签训练卷积神经网络(CNN)模型。
- 模型输出为预测未来获利概率,基于得分高低构建轮动择时策略。
2. 申万一级行业指数的轮动策略表现 [page::4][page::5][page::6][page::7]



- 阈值0.9时策略累计收益超沪深300近3倍,年化收益约16.69%,夏普比率1.3,回撤控制良好。
- 阈值0.85时策略收益稍优,年化16.90%,但夏普比率下降至0.95,最大回撤增大。
- 月度胜率稳定在66%-81%区间,表现出较强的稳定性。
| 指标 | 阈值0.9策略 | 沪深300 | 阈值0.85策略 | 沪深300 |
|-------------|-------------|----------|--------------|---------|
| 累计收益率 | 100.09% | 27.63% | 101.73% | 27.63% |
| 年化收益率 | 16.69% | 5.58% | 16.90% | 5.58% |
| 夏普比率 | 1.3 | 0.38 | 0.95 | 0.38 |
| 最大回撤 | -9.93%至-6.20%| - | -33.88%至-6.20% | - |
3. 行业主题ETF轮动策略表现及交易摩擦影响 [page::7][page::8][page::9][page::10][page::11]


- 阈值0.9时,行业ETF策略累计收益超200%,年化收益25.40%,夏普比率1.58,Calmar比率2.11。
- 阈值0.85时进一步提升至年化31.33%,夏普1.63,累计收益240.25%,表现显著优于基准。
- 加入摩擦成本后,策略年化收益降低约4%,最大回撤有所加大,但整体表现仍优异。
| 指标 | 阈值0.9策略 | 阈值0.85策略无摩擦 | 阈值0.85策略加摩擦 | 沪深300 |
|--------------|-------------|--------------------|-------------------|---------|
| 累计收益率 | 176.53% | 240.25% | 191.91% | 27.63% |
| 年化收益率 | 25.40% | 31.33% | 26.92% | 5.58% |
| 夏普比率 | 1.58 | 1.63 | 1.48 | 0.38 |
| 最大回撤 | -12.04%至-6.64% | -15.62%至-6.64% | -15.63%至-9.49% | - |
| 月度胜率 | 79.63% | 59.26% | 59.26% | - |
4. 量化策略构建核心思想 [page::0][page::3][page::4]
- 通过将指数日频K线数据转换为黑白竹线图,降低计算复杂度,提高训练效率。
- 使用CNN深度学习模型训练选取未来累计收益为目标的二分类标签。
- 策略以周频换仓,筛选得分高于阈值的前三名指数或行业构建多头组合,空仓时持货币基金。
- 展现了AI图形识别对指数行情行为的有效捕捉能力,带来显著超额收益。
深度阅读
万图师 AI 看图选指数 证券研究报告详尽分析
---
一、元数据与概览
报告标题: 万图师 AI 看图选指数——机器学习系列
发布机构: 中泰证券股份有限公司研究所
报告日期: 2023年8月5日
作者与联系方式: 分析师 李新春,执业证书编号S0740520080002,Email lixc@r.qlzq.com.cn
主题: 该报告聚焦基于卷积神经网络(CNN)的“看图”技术分析方法,利用指数的K线图数据构造量化投资策略,探讨了AI在指数(尤其是申万行业指数和行业主题ETF指数)择时及选时上的应用效果及实证表现。
核心论点总结:
报告立足深度学习,围绕将技术分析的“看图”方法通过AI实现自动化、量化为主线。作者沿用前期关于股票的CNN分类模型,扩展应用于指数层面,通过对指数K线图的自动感知和分类,构建多头轮动策略。
该策略经过2019-2023年区间的实证回测,表现出超越基准(沪深300指数)的大幅累计收益和各项风险调整指标的优异表现。在不同阈值和考虑摩擦交易情况时均保持稳健,说明基于AI的技术图形识别在量化选时和择时上具有较强的泛化能力和实际应用价值。
此外,报告明示风险提示,提醒模型基于历史数据,存在模型过拟合、数据失准及未来市场环境变化带来的不确定性。所有结论非投资建议,仅供研究参考。[page::0]
---
二、逐节深度解读
1. 引言
引言部分首先回顾了技术分析的传统精髓和技术分析与基本面分析的内在联系,强调技术分析通过图形模式和时间价格成交量数据来推测未来走势的历史根基。同时,提及深度学习的进步使得计算机在“看图”模式识别上获得近似甚至超过人的能力。引用Jiang et al. (2021)的国际先进研究成果,表明CNN模型通过图形特征识别在多国市场中均取得较好的多空组合夏普比率和收益表现,具备较高的泛化性。[page::2]
- 关键数据点: 表格显示不同国家模型重训练、直接迁移和迁移+再训练在“等权”和“价值权”多空组合夏普比率的差异,强调模型在本地重训练通常获得最佳绩效。
2. 方法论概述
详述数据采集、处理和模型训练流程:
- 数据处理:
利用日频K线图数据(开盘、最高、最低、收盘价)及成交量、均线信息,将彩色K线图转化为黑白竹线图形态缓解计算负担,提高CNN输入训练效率(图2和图3说明颜色转换和简化过程)。
- 标签定义: 使用未来5天或20天的累计收益率作为分类标签,收益为正标记为1,否则为0。
- 模型结构: 基于CNN网络,包括卷积、激活(激活函数)、池化操作,末端为全连接层输出利用softmax函数给出未来正收益的概率评分。
- 训练策略: 采用逐年滚动训练,使用2011至2018年数据训练,2019至2023年推理,确保模型时序稳定与数据实时性。
这样的设计合理捕捉短中期价格走势,兼顾模式识别的时间敏感性。[page::3][page::4]
3. 万图师 AI 选申万行业指数表现
- 阈值0.9时:
周频换仓,无摩擦交易,选取得分超过0.9且排名前三的行业指数组成多头组合,空仓时持货币基金。
- 表现(见图4):
策略累计收益稳步提升,最终达100.09%,远超基准沪深300的27.63%。年度收益(图5)显示策略在2020年优势尤为明显。
- 风险指标(图6):
年度收益16.69%、夏普比率1.3、Calmar比率1.68,月度胜率高达81.48%,最大回撤幅度控制在-9.93%(最长回撤期183天)。整体表现风险收益比优于基准。
- 阈值0.85时:
放宽阈值,策略更灵活。在同样条件下累计收益达101.73%,年化收益率稍增至16.9%。
- 但风险指标有所退化,夏普比率降至0.95,最大回撤-33.88%(持续631天),表明更宽松阈值带来更大的波动和潜在回撤风险。
- 年度收益表现亦更为分散(图8)。[page::5][page::6][page::7]
4. 万图师 AI 选行业ETF表现
ETF策略设计与行业指数类似,但采用行业主题ETF的跟踪指数进行回测,逐年滚动训练,且同样基于得分选前三。
- 阈值0.9时:
表现更佳,累计收益176.53%,年化25.40%,夏普1.58,Calmar 2.11,月度胜率79.63%(图10-12)。
- 累计收益相较申万行业指数策略超出约75%,且风险指标显著改善,反映ETF组合的流动性和多样性优势。
- 阈值0.85时:
收益飙升至240.25%(年化31.33%),但夏普降低至1.63,Calmar降至2.01,最大回撤约-15.62%(图13-15)。
引入单边万4交易费用及周五信号周一交易,相较无摩擦策略,年化收益略降至26.92%,最大回撤略增,2023年累计收益减少约2.5%(图16-18)。
综上,ETF的万图师AI策略在行业配置的基础上,进一步实现了较高收益及合理风险控制,表明模型适用于实际交易环境。【策略换仓频率与交易成本纳入评估,增加结果的实用性和可信度】。[page::7][page::8][page::9][page::10][page::11]
5. 风险提示
报告末尾强调数据滞后性、第三方数据误差、市场的不可预测性、模型基于历史数据的局限,以及宏观环境和行业基本面变化对策略表现的可能影响,明确声明所有研究不构成投资建议,提醒投资者理性看待结果。这体现了研究的严谨态度和合规要求。[page::0][page::11]
---
三、图表深度解读
表格展示了CNN模型在多个国家和地区的多空组合夏普比率,多数通过本地重训练(Re-train)获得显著正值。表现最佳途径多为本地数据重训练,相比直接迁移模型预期更理想。
体现了深度学习模式对本地市场适应性的重要性,为后续报告模型设计奠基。
彩色K线图转化为黑白竹线简化图像,减轻计算资源消耗,保证运算速度,同时保留关键价格和成交信息,为CNN输入提供高效形态感知基础。
均展现出策略(蓝线)远超沪深300(黄线)的累计收益表现,且多呈平滑上升趋势,股指震荡时策略表现稳健,证明策略有效捕捉市场轮动机会。
特别是行业ETF策略(图10与13)累计收益曲线更陡峭,强化了ETF样本的代表性和流动性优势。
逐年对比策略与基准收益,2020年为策略爆发点,策略收益明显优于基准。部分年份基准为负时,策略仍能实现正收益,展示抗跌性和择时有效性。
红色虚线代表基准平均水平,方便直观理解策略相对表现。
详细收益率、夏普比率、Calmar比率、月度胜率和最大回撤指标,一目了然显示策略在收益和回撤控制上的平衡。
与沽空风险和波动风险相辅相成,多数指标优于基准,充分说明策略盈利性与稳健性兼顾。
摩擦交易引入后,指标普遍稍有下降,体现实际交易成本对策略收益的真实影响。
整体图表数据显示万图师AI模型在不同样本和阈值条件下均表现出显著超越市场基准的能力,验证“基于图像的深度学习技术分析”具有较强的实战应用前景。
---
四、估值分析
本报告聚焦量化策略回测与机器学习模型表现评估,不包含直接传统估值模型如DCF、PE等分析。但策略在不同阈值的灵敏度调整等实质上构成了一种“模型阈值调节估值”,即根据模型输出概率阈值不同选择配置组合,控制收益风险的权衡。
- 阈值越高(如0.9)挑选更加确定性强的标的,收益较稳但可能错失部分机会。
- 阈值放松(如0.85)覆盖更多资产,但带来更大波动和回撤风险。
- 交易摩擦模拟则是考虑实际操作的成本影响,降低了策略收益水平。
这种灵活调节阈值的权衡机制体现了量化策略的典型设计思路和风险管理理念。
---
五、风险因素评估
报告末尾明确警示:
- 模型风险: 模型基于过去市场学习,未来表现不确定。
- 流动性及摩擦成本: 增加交易成本和券商实现难度可能侵蚀策略收益。
该风险提示符合监管要求,体现了分析的审慎性,提醒投资者理性评估模型输出。
---
六、批判性视角与细微差别
- 报告整体逻辑严密,叙述清晰,但部分假设依赖历史市场模式的稳定性(如图形特征与未来收益的关联),可能面临市场结构性变迁的挑战。
- 阈值放松策略(0.85)带来的巨大最大回撤,说明模型在覆盖范围加宽后面临较高风险敞口,风险管理需加强。
- 摩擦成本只测算为单边万4,未考虑滑点、市场冲击等潜在交易风险,实际操作中可能更高。
- 模型仅基于价格与成交量数据,未引入基本面数据,可能遗漏部分系统性风险或消息驱动行情。
- 该模型和回测主要表现为择时和行业轮动,缺乏对个股层面因子的细化研究,适用于宏观风格轮动而非个股精选。
- 由于数据和模型细节(如具体CNN架构)不充分披露,模型的解释性和透明度有限,可能影响信任度。
---
七、结论性综合
本报告系统阐述了基于卷积神经网络的“看图”技术分析策略在中国指数市场的应用,体现了深度学习在量价信息图像化解读的创新之处。利用历史日度K线和成交量数据转化后的黑白竹线图作为模型输入,结合未来累计收益的二分类标签,训练出能够预测指数未来方向的量化模型。
通过严格时间序列分割的训练与推理流程,实证测算了不同阈值设置下基于申万行业指数和行业主题ETF指数的多头轮动策略,取得显著超越沪深300的累计收益和风险调整后的优秀指标:
- 在无摩擦环境下,行业ETF策略年化收益最高达到31.33%,夏普比率1.63,Calmar比率超过2。
- 申万行业指数策略年化逾16%,夏普比率达到1.3以上。
- 策略回撤均控制得较为合理,月度胜率普遍保持在60%以上,表明策略盈利的持续性和稳定性。
- 即使考虑摩擦交易成本,策略仍显示显著超额收益约21%左右。
通过丰富图表展示,收益曲线的稳定上涨及年度表现的稳健优于基准,验证了AI深度学习看图策略在指数层面的有效性。
报告也严肃宣示风险,提醒投资者充分考量数据滞后、市场不确定性及历史数据限制。
综上,作者对该基于AI深度学习的“看图”技术分析策略持积极正面评价,认为其在量化择时和行业轮动中具备强实用价值和较好风险收益平衡,给予研究充分信心[page::0,2,3,4,5,6,7,8,9,10,11]。
---
结束语
本报告全面、系统地揭示了“万图师 AI 看图选指数”策略的理论基础、数据处理、模型训练、实证表现及风险提示。涵盖从技术分析传统理论到深度学习技术进步的创新应用,辅以详实图表数据,提供了一个深度融合机器学习与量化投资的典范案例与有力佐证。
尤其在当前量价因子广泛使用和AI驱动策略日益普及的背景下,对理解和把握未来投资策略设计和资产配置具有重要参考价值。