数据驱动下的择时专题系列之二:深圳成指
创建于 更新于
摘要
本报告基于数据驱动的因子构建与多因子回归模型,构建深圳成指择时交易策略。模型采用Price-to-Distance、SIN(Low)、CDL3INSIDE、MACD及CDLSHOOTINGSTAR等因子,通过滚动样本外回测,取得夏普比率2.72,年化收益达73.53%,最大回撤32.22%。报告还进行了交易成本测算、参数敏感性与二次样本外验证,确认策略稳定性及潜在过拟合风险,为股票市场量化择时提供实证支持。[page::0][page::2][page::3][page::4][page::5]
速读内容
深圳成指交易策略因子构建与模型说明 [page::2]
| 因子 | 含义 | 作用 |
|------------------------------|----------------------------------|------------|
| Price-to-Distance(amount,22) | 价格的涨幅/路程 | 预测目标 |
| SIN(low) | Sin函数 | 影响因子 |
| CDL3INSIDE(open, high, low, close) | 三日K线内部上涨形态 | 影响因子 |
| MACD(close, fast=10, slow=7, signal=1) | 异同移动平均线 | 影响因子 |
| Rolling_Cor(..., nperiod=18, shiftn=6) | 价格与滞后价格的相关性 | 影响因子 |
| CDLSHOOTINGSTAR(open, high, low, close) | 一日K线上影线长,预示下跌 | 影响因子 |
交易法则基于Price-to-Distance的历史分位判定进行做多、做空或观望决策,体现量化择时思想。[page::2]
样本外回测与交易成本假设 [page::2][page::3]
- 回测方法为固定起点滚动样本外验证,确保模型稳定性。
- 假设开仓、日内及隔日平仓交易成本分别为万分之3、千分之一及万分之3。
- 净值曲线平稳上升,回撤主要控制在32.22%左右
回测主要绩效指标及收益分布 [page::4]
| 指标 | 数值 |
|--------------|--------------|
| 夏普比率 | 2.72 |
| 平均年化收益 | 73.53% |
| 最大回撤 | 32.22% |
| 胜率 | 57.26% |
| 盈亏比 | 1.23 |
| 夏普波动率 | 1.01 |
| 年化收益波动率 | 42.84% |
| 平均持仓时间 | 6.98天 |
- 年度夏普比率整体稳健,高峰于2015年及2007年
- 日收益分布接近正态,符合风险收益预期

参数敏感性分析与策略稳定性评估 [page::4][page::5]
| 指标 | 最大值 | 平均值 | 最小值 | 基准值 |
|----------|--------|--------|--------|--------|
| 年化收益 | 83% | 61% | -6% | 73% |
| 最大回撤 | 97% | 57% | 28% | 32% |
| 夏普比率 | 3.11 | 2.25 | -0.22 | 2.72 |
- 相比基准,调整MACD与Rolling Cor参数能提升收益表现。
- signalperiod参数调整带来盈利能力显著变化,表现出参数灵敏度。
- 总体策略参数不敏感性较好,保持稳定收益。
二次样本外验证及风险提示 [page::5]
- 以2018年1月1日前数据构建策略,2018年后数据做二次样本外测试。
- 验证期内,尽管有接近历史最大回撤的表现,但整体净值持续创新高,策略仍具参考意义。

- 风险提示:模型基于历史数据,存在失效可能,应用需谨慎。[page::0][page::5]
深度阅读
《数据驱动下的择时专题系列之二:深圳成指》研究报告详尽分析
---
1. 元数据与报告概览
报告基本信息
- 标题:《数据驱动下的择时专题系列之二:深圳成指》
- 发布机构:安信证券股份有限公司研究中心
- 发布日期:2019年3月18日
- 报告作者:杨勇、周袤(均具备中国证券业协会授权的证券投资咨询执业资格)
- 研究主题:深圳成指的量化择时交易策略模型构建及回测分析
- 核心议题:基于完全数据驱动的量化择时模型,研究并验证以深圳成指为交易标的的多因子择时策略。
报告核心论点、目标及意图
本报告作为“数据驱动下的择时专题系列”之一,旨在构建一个完全基于历史数据的多因子量化择时模型,并通过样本内和样本外严格的回测验证其有效性。报告重点介绍深圳成指的Price-to-Distance模型,结合多种技术指标(如SIN低点函数、三个K线模式、MACD指标及射击之星K线形态),搭建量化交易策略。核心目标是挖掘和验证策略的收益潜力及风险特征,指导交易策略的实现。回测结果显示策略整体表现优异,夏普比率达到2.72,平均年化收益约73.53%,最大回撤32.22%,显示具有较强的风险调整后盈利能力。
风险提示明确指出,由于数据驱动且策略基于历史数据,存在模型本身可能失效以及“无内在逻辑”风险,强调模型结果需审慎对待。
---
2. 逐节深度解读
2.1 深圳成指的交易策略模型
2.1.1 因子介绍(表1)
报告梳理了构成模型的核心因子,包括:
- Price-to-Distance (amount, 22):反映价格涨幅或者达到的“路程”,作为预测目标因子。
- SIN(low):低点的正弦函数变换,作为价格波动的影响因子。
- CDL3INSIDE(open, high, low, close):三日内缩K线形态判定,指三根K线中阴阳阳组合,预示未来走势。
- MACD(close, fastperiod=10, slowperiod=7, signalperiod=1):异同移动平均线,反映价格趋势和动能,用“短均线10,长均线7”的设定,区别于常规MACD。
- Rolling_Cor:计算当前价格与过去一定周期平均价格的相关性,捕捉价格的相关性变化。
- CDLSHOOTINGSTAR(open, high, low, close):射击之星形态的判定,通常是技术分析中反转的信号,表示上涨后可能回调。
这些因子涵盖技术分析中动能、形态与趋势多维度信息,映射价格行为多样特征,体现了多因子模型建设的科学性和多角度视野。
2.1.2 模型构建方法
模型形式为多元回归,Price-to-Distance因子作为因变量,以上技术指标作为自变量(因子)构建一个多元线性模型。两个版本的模型诠释如下:
- 模型A:Price-to-Distance ~ 截距项 + SIN(low) + CDL3INSIDE + MACD(10,7,1) + CDLSHOOTINGSTAR
- 模型B:Price-to-Distance ~ 截距项 + SIN(low) + CDL3INSIDE - MACD(7,10,1) + CDLSHOOTINGSTAR
逻辑上,两模型通过不同MACD参数配置和符号,使得策略在趋势确认和反转信号的识别上有所差异。
2.1.3 交易规则
- 当Price-to-Distance估计值高于历史75分位数时,执行做多。
- 当Price-to-Distance估计值低于历史25分位数时,执行做空。
- 介于25%-75%分位的估计值时,不做任何交易(保持空仓状态)。
此交易规则简单且基于历史分布的极端观察值,体现量化择时模型的实用性与易执行特征。
2.1.4 回测方式
采用固定起点滚动样本外回测方法。具体为:
- 以时间点T1为界,采用0到T1期间数据训练模型,依次在T1至T2区间内样本外测试该模型。
- 前移至T2时间点,使用0到T2期间数据重新训练,测试T2至T3区间。
- 依此类推,形成长时间段的滚动检验结果汇总。
该回测方式有效规避了样本内效应,提升模型的稳健性和泛化能力。
2.1.5 交易成本假设
- 开仓成本:单边万分之3 (0.03%)
- 日内平仓成本:单边千分之一 (0.1%)
- 隔夜平仓成本:单边万分之3 (0.03%)
此设定适度反映了实际市场中的手续费及滑点风险,确保回测结果更具现实参考价值。
---
2.2 深圳成指的回测结果分析
2.2.1 净值走势(图2)
从2007年到近年,回测策略净值曲线呈持续上升趋势,显示整体稳健的资本增值能力。期间净值没有出现严重断崖式下跌,体现策略抗风险能力。
2.2.2 最大回撤(图3)
最大回撤最高峰约为32.22%,期间波动较大,但总体回撤多分布在十几至三十几百分比区间。回撤曲线显示策略经历市场大幅震荡时仍能保持相对控制风险。
2.2.3 分年度夏普比率(图4)
年度夏普值多在1.0以上,部分年份如2007年和2015年,夏普比率接近甚至超过4.5,极为优异。说明策略在调控风险的同时实现了较高的收益。
2.2.4 日收益分布(图5)
收益分布近似对称,呈峰态集中,主峰在0附近,少部分极端收益。该分布意味着每日收益波动可控且极端情况有限,利于稳定交易。
2.2.5 回测主要指标(表2)
| 指标 | 数值 |
|---|---|
| 夏普比率 | 2.72 |
| 平均年化收益 | 73.53% |
| 最大回撤 | 32.22% |
| 胜率 | 57.26% |
| 盈亏比 | 1.23 |
| 波动率(夏普波动率) | 1.01 |
| 年化收益波动率 | 42.84% |
| 平均持仓时间 | 6.98天 |
这些指标展示出策略的高收益与合理风险平衡,且策略操作频率适中,符合实际可操作性需求。
---
2.3 交易策略分析总结
报告指出本策略为众多可能的深圳成指交易策略中的一种,提醒读者策略并非唯一最优,需结合其他工具和策略进一步综合分析。
2.3.1 参数敏感性分析(图6、表3)
- 主要结论:
- MACD指标的长均线从7变6,Rolling Cor的shiftn由6变7,均带来策略性能略微提升,收益稳定性增强。
- signalperiod参数由1变2,策略的年化收益和夏普率大幅下降,甚至变亏,说明该参数对策略影响显著。
- 参数表现:
| 参数状态 | 年化收益 | 最大回撤 | 夏普比率 |
|---|---|---|---|
| 最大值 | 83% | 97% | 3.11 |
| 平均值 | 61% | 57% | 2.25 |
| 最小值 | -6% | 28% | -0.22 |
| 基准值 | 73% | 32% | 2.72 |
整体而言,模型对绝大多数参数较为鲁棒,显示出策略的稳定性,但signalperiod参数需谨慎调整。
2.3.2 二次样本外分析(图7)
通过将2018年1月1日以前的数据固定作为样本内研究区间,之后数据作为二次样本外,模拟真正的“未来验证”。
- 该测试右侧的样本外段显示策略在2018年上半年曾接近历史最大回撤水平,之后市场逐步回升,创出新高。
- 该结果提示策略仍有一定的过拟合风险,或面临市场结构变化带来的挑战。
报告通过二次样本外分析强化了策略回测的实际参考价值,同时发出策略使用警示。
---
3. 图表深度解读
图1:固定起点滚动样本外回测示意
图表展示了从起点逐步推进的样本内和样本外训练与测试窗口,呈“斜向片区”结构。回测设计合理,逐段迭代更新模型,提高了结论稳健性及适应市场变化能力。
图2:策略净值曲线(2007-2017)
策略净值曲线平稳上升,初期和后期均呈攀升态势。净值曲线曲折但整体稳健,表明策略能较好适应不同市场环境,具备良好资本增值力。
图3:回撤趋势
显示策略累计最大回撤时段,存在2007-2008和2015年市场波动引发的严重回撤事件,尤以2008年金融危机期间最为明显。整体回撤控制较为得当,符合高收益策略常见风险特征。
图4:分年度夏普比率
展示每年风险调整后收益,数据表明绝大多数年份策略提供正增长和较高回报,尤其2007和2015年表现突出。
图5:日收益分布
收益呈现接近常态分布,分布中峰度较尖锐,暗示多数交易日波动适中,极端收益较少。
图6 + 表3:参数敏感性分析图与数据
参数调整测试结果清晰,一些参数调整显著影响策略表现,尤其signalperiod变化对策略绩效影响巨大。
图7:二次样本外净值表现
突出2018年后策略在市场剧烈波动中的表现,对策略过拟合和适用性提出疑问,增强了报告的批判性和警示度。
---
4. 估值分析
本报告未涉及传统意义上的公司估值分析,因研究焦点为量化择时交易策略,而非企业基本面估值或股价目标定价。报告关注策略的收益与风险表现,侧重量化模型效能验证。
---
5. 风险因素评估
报告明示几个关键风险点:
- 模型内在逻辑不确定风险:模型依赖历史数据,可能不具备经济学上的合理解释,存在“数据偶然关系”风险。
- 历史数据拟合及过拟合风险:过度基于历史数据的策略难免遭遇未来市场结构变化带来的失效可能。
- 市场交易成本及滑点风险:模型交易假设了具体交易成本,实际市场波动可能导致成本上升,影响策略收益。
- 参数敏感性导风险:部分参数变化对策略表现影响巨大,尤其signalperiod参数,需谨慎设定以减少性能波动。
报告虽未详细展开缓解方案,但通过样本外滚动回测与二次样本外验证手段为缓解策略失效风险提供保障。
---
6. 批判性视角与细微差别
- 本研究模型虽采用多因子结合,但大多基于技术指标和价格行为,缺乏基本面或宏观面因素考量,模型完整性可能受限。
- 参数设置细节中,MACD的“短长均线顺序”调整和信号期对模型表现影响极大,显示模型对特定技术细节依赖较重,容易出现非稳健性。
- 样本内和样本外回测均显示策略表现优秀,但二次样本外的回撤提醒模型依然潜藏过拟合风险,尤其在极端市场环境下表现承压。
- 交易成本假设较为理想化,实际执行时可能遭遇更高滑点,尤其短均线高频交易背景下,执行难度和成本压力值得关注。
- 报告态度较为中立,风险提示充分,没有过度夸大模型优越性,体现了较强的专业审慎态度。
---
7. 结论性综合
本报告以深圳成指为交易标的,利用Price-to-Distance等创新因子结合SIN函数、K线形态和独特MACD参数,构建了一个完全数据驱动的量化择时策略。策略通过固定起点滚动样本外回测验证,取得了优异的风险调整后收益表现,夏普比率高达2.72,年化收益超过70%,最大回撤控制在32%以内。另外,参数敏感性分析和二次样本外分析进一步验证了策略的鲁棒性及潜在风险。
图表直观展示了策略净值稳健增长,回撤在合理区间内波动,且多数年份保持较高夏普比率,日收益分布峰态明显,表明策略的实际操作中的风险收益特征较为合理。参数敏感性分析突出说明了部分关键参数(如signalperiod)对策略生死攸关的影响,而二次样本外分析则揭示了策略在市场极端震荡时面临的挑战和潜在过拟合风险。
总体来看,本报告传递的信息是:通过科学合理的数据驱动量化模型,可以在技术面层面构建有效的择时策略,但仍需警惕历史数据局限和参数选择带来的不确定性,合理控制交易成本和风险,持续进行样本外验证。报告谨慎推荐模型可以作为深圳成指交易的择时参考,强调模型内在逻辑不确定性和历史失效风险,彰显了量化投资研究应有的专业严谨风范。
---
以上分析基于报告内容和图表数据综合解读,所有定量指标和观点均来源于报告正文和附图,具体引用页码详见注明。
---
参考标注
- 报告主题、模型概述、风险提示及撰写者信息:[page::0]
- 目录及章节结构概览:[page::1]
- 因子定义、模型构建及交易规则、回测方法与交易成本假设:[page::2][page::3]
- 回测净值、回撤、夏普比率和日收益分布图表及回测结果统计指标:[page::3][page::4]
- 参数敏感性分析图、结果表及二次样本外分析及图示:[page::4][page::5]
- 分析师声明、免责声明:[page::6]
- 联系方式及机构信息:[page::7]