`

股指期货日内分时段收益特征——技术分析系列报告之四

创建于 更新于

摘要

本文基于股指期货主力合约2010至2013年的数据,运用CART决策树模型及线性回归模型研究股指期货日内11个时段的收益特征及其关联性。CART模型适合刻画单一投资者的买卖心理,样本内模拟交易盈利丰厚但样本外稳定性较差;线性模型更适合描述市场总体行为,纯外推收益和稳定性均优于CART模型。分时段盈利贡献统计显示部分时段(如10:00~10:30和13:30~14:00)负贡献明显,剔除后策略累计收益提升。本文模拟交易考虑滑点与交易费用,结果具有一定现实参考价值,但仍存在简化假设和模型风险 [page::0][page::8][page::9][page::14][page::15][page::16]

速读内容


交易习惯是日内分时段收益模式的基础 [page::0][page::3]

  • 股指期货日内走势被划分为11个时段,用于研究不同时间段的涨跌模式。

- 部分投机者的交易心理模式如“开盘及前15分钟上涨,后30分钟上涨概率大”形成市场稳定的交易模式。
  • 美林统计显示S&P Futures存在类似的小时分时涨跌模式。


CART模型介绍及分时段涨跌预测 [page::4][page::5][page::6][page::7]




  • 利用前一日涨跌幅、收盘价变化及当日已发生的涨跌幅作为解释变量,使用递归划分空间的CART模型分析不同时间段收益符号。

- CART模型通过最小化Gini系数实现最优二分划分,决定以横线或竖线划分数据,以分类最小混乱度为准。

基于CART模型的样本内外模拟交易表现 [page::8][page::9]



  • 样本内用全历史数据拟合的决策树模拟交易收益累计超过600万元,几乎无回撤。

- 逐月外推动态更新模型后,累计收益显著下降且波动回撤增大,更接近实际交易表现。
  • 过度拟合导致执行效果差异,提示单阈值划分对市场整体表达能力有限。


线性模型描述市场总体分时段涨跌及回归结果 [page::9][page::10][page::11]


  • 构建含前一日涨跌幅、收盘价涨跌幅及当日所有已发生涨跌幅的线性模型,回归分析11个时段涨跌。

- 多数时段能找到具有统计显著性的解释变量,说明不同时间段的涨跌存在较强的线性关系。
  • 两个子样本回归结果显示模型稳定,且纯外推策略累计盈利更优。


基于线性回归预测的分时段多空策略模拟 [page::12][page::13][page::14][page::15]




  • 模拟交易规则为阶段末确定多空持仓,剔除隔夜仓并考虑滑点及交易成本。

- 逐月外推系数使策略更具可操作性,累计收益约为全样本拟合的一半,但更稳定。
  • 分时段盈利贡献显示0、3、7三个时段周期性负贡献明显,特别是10:00~10:30和13:30~14:00时段。

- 按季度统计各时段贡献,负贡献时段季度胜率低,正贡献时段季度胜率较高。
  • 剔除负贡献明显的0、3、7时段后,策略累计收益提升,风控优化效果明显。


CART模型分时段决策树详细结果附录 [page::17-21]

  • 各时段CART决策树结构图,展示不同解释变量及阈值划分,体现复杂的递归特征。


研究结论与风险提示 [page::0][page::16]

  • 投资者分时段交易习惯形成部分稳定模式,基于此的量化策略具有一定盈利可能。

- CART模型适合单一投资者行为刻画,线性模型更适合市场总体行为描述。
  • 需注意模型简化、历史数据拟合和市场变化风险,模拟交易结果不代表未来必然表现。

深度阅读

股指期货日内分时段收益特征——技术分析系列报告解构与分析



---

一、元数据与概览


  • 标题:《股指期货日内分时段收益特征》

- 报告系列名:技术分析系列报告之四
  • 发布机构:广发证券发展研究中心

- 核心分析师:俞文冰(主要联系人)
  • 发布时间:不详(报告时间范围采样至2013年3月末)

- 研究对象:中国股指期货主力合约的日内涨跌分时段模式研究
  • 主要内容:本文通过CART回归树模型和线性回归模型分析股指期货在日内11个交易分时段的价格涨跌动态,探寻市场参与者的交易习惯对价格表现形成的稳定分时段模式,并基于模型开展模拟交易策略设计及检验。

- 主要结论
- 投资者具有一定的分时交易习惯,表现出特定涨跌模式。
- CART模型能较好刻画单个投资者的心理阈值,但纯外推效果不佳。
- 线性模型则更适合描述市场整体行为,外推收益和稳定性优于CART模型。
- 不同时间段对整体收益的贡献差异显著,部分时段甚至带来负收益,实际交易中可考虑剔除。
- 模拟交易策略样本内和外推均显示较好盈利能力,但风险提示强调模型简化现实,模型预测存在不确定性。[page::0,3,8,9,13,16]

---

二、逐节深度解读



2.1 交易习惯——模式的来源


  • 核心观点:市场价格的稳定分时段模式来源于交易者的习惯行为。举例:开盘和收盘时间的成交量较大形成稳态特征;投机者存在“开盘上涨且开盘15分钟上涨后,接下来30分钟上涨概率较大”的心理。

- 引用外部研究:美林对S&P Futures日内每小时模式的统计,使用符号“+”表示上涨,“-”表示下跌,及价格与开盘方向一致或相反的情况(图1和图2展示了这些统计结果),体现了日内涨跌与交易时间的关联性。
  • 报告处理:本报告不采用小时划分,而是对一天分为11个分时段(详见表1),以获得更细粒度的市场行为分析。

- 意义:这一区分是后续模型分析的基础,精准解释不同时间段的行情波动,有助于揭示潜在的交易心理模型。[page::0,3,4]

2.2 使用CART模型寻找分时段模式


  • 核心观点:CART(分类与回归树)模型以递归分割解释变量空间,寻找形如“如果A大于阈值a,且B满足某条件,则下一阶段上涨概率较大”的区间规则。

- 实例说明:以两个解释变量(前一日涨跌幅$x1$,前一日收盘价相对结算价涨跌幅$x2$)预测下一日开盘的涨跌。图3是开盘涨跌与这两个变量关系的散点图,通过CART模型对变量空间画最佳划分阈值线(如横线),实现“混乱度”降低,从而划分涨跌概率不同的子空间。
  • 关键指标Gini系数说明

- 通过度量概率分布纯度减少(混乱度下降),评估划分效果;
- 选择使加权Gini系数最小的分割阈值,实现最优分割。
  • 递归分割:模型通过反复细分提高预测有效性,直至满足样本容量或类别纯度阈值。

- 实际结果:图5展示针对13:00-13:30时间段的完整决策树示例,充份利用前一交易日和已有时段涨跌幅解释变量达到较准确分类。
  • 局限性:虽能刻画单投资者心理阈值,但不同投资者阈值不一,导致纯阈值模型对整体市场预期刻画不足,且样本外表现较弱。[page::4,5,6,7]


2.3 基于CART模型的模拟交易策略


  • 策略设计:基于CART模型预测各时段涨跌,构造单张合约逐日分时段多空交易策略,规则强制于每阶段结束前调仓,严格平仓不持隔夜仓,涵盖交易成本和滑点。

- 样本内表现(图6):累计盈利超600万元,几乎无回撤,表面效果极佳。
  • 样本外表现(图7):采用逐月更新模型参数、基于最近200交易日历史样本外推,盈利锐减至约30万元、伴随较大回撤,透露过拟合风险。

- 结论:CART模型适用于单投资者行为模拟,但受投资者心理差异限制,对市场整体协同行为预测能力不佳。[page::8,9]

2.4 线性模型描述市场总体分时段涨跌


  • 模型设定:依次回归十一时段涨跌幅 $ri$,解释变量包含常数项、前一日涨跌幅$xm$、当日所有已发生时段涨跌幅 $r0,...,r{i-1}$,模型形式为线性组合:


$$
ri = \summ \alpha{i,m} xm + \sum{k=0}^{i-1} \beta{i,k} rk + \varepsiloni
$$
  • 区别于图1、2:图1只考虑常数项,图2只考虑一次简单相关;本模型综合多变量效应,刻画更全面的分时段交互影响。

- 回归结果:回归系数详见表2,统计显著性表3和P值表4,整体回归稳定,表5罗列了5%显著性水平下显著解释变量,表6展示了不同时间段的盈利贡献稳定性。
  • 模型稳定性:通过样本拆分(2010-2011和2012-2013)发现回归关系大体一致,说明模型稳健(附录提供详细回归参数)。

- 意义:线性模型能更好捕捉投资者观点分布,兼顾多个阈值层次,因而在预测市场整体态势、构造模拟交易时展现更优表现。[page::9,10,11]

2.5 基于线性回归模型的模拟交易及收益贡献分析


  • 交易规则:类似CART模型模拟,每阶段的多空仓位由下一阶段收益率预测正负决策,成本和滑点依旧计算。

- 样本内表现(图8):累计盈利约250万元,顺滑上升曲线验证模型的有效性。
  • 样本外表现(图9):通过逐月滚动回归系数,实际预测能力更佳,累计盈利约60万元,稳健性优于CART模型样本外表现。

- 盈利贡献分时分析(图10、11、表6):
- 11个时段中,有6个时段贡献显著正收益,2个时段贡献微弱,3个时段持续负贡献。
- 负贡献时段分别为:前日结算至开盘(0时段)、10:00~10:30(3时段)、13:30~14:00(7时段)。
- 季度分解持久显示3、7时段负贡献,多数季度负贡献显著,指示这些时段可能存在系统性交易成本或市场噪声影响。
  • 优化交易策略:(图12)排除以上3个时段持仓,利润及稳定性进一步优化。

- 总结:线性模型实证支持市场存在分时亮点与风险时段,调整交易时段可有效提升盈亏比与策略质量。[page::12,13,14,15]

2.6 风险提示与模型局限


  • 风险说明:报告明确指出模型抽象简化现实,无法完全准确刻画市场或未来价格走势,模型与结论存在不确定性和潜在失真风险。

- 实际应用谨慎:模拟收益需结合实际交易限制和盘面变化审慎对待,不能简单复制,亦不保证未来稳定盈利。
  • 策略实施风险:滑点、交易费用、流动性等因素可能影响实际表现。

- 模型依赖历史数据:突发事件或结构性变化可能破坏模型稳定性。
  • 建议:结合多元研究与风险管理措施,审慎应用于实际投资。[page::0,16]


---

三、图表与表格深度解读



图1 & 图2(报告页3)


  • 展示1997-2003年S&P Futures日内每小时的涨跌方向阶段模式。

- 图1用“+”/-标示涨跌趋势,图2表示涨跌相对于开盘方向的一致性。
  • 这些历史数据模式支持报告中分时趋势存在稳定性的重要假设。


表1 (报告页4)


  • 定义日内11个时间段变量 $r0$至 $r{10}$,细化研究对象,使模型预测更贴合真实市场节奏。


图3 & 图4(报告页5-6)


  • 图3:开盘涨跌状况与前一交易日两个解释变量的散点图,色彩表示涨跌。

- 图4:展示CART模型如何通过递归划分解释变量空间,形成不同涨跌概率区间。
  • 表现CART模型通过减少“混乱度”分割,提高分类准确度机制。


图5(报告页7)


  • CART模型针对13:00-13:30时间段涨跌形成的决策树。

- 节点含义为各种解释变量阈值,终端节点的涨跌预测及其概率。
  • 说明模型实际形成的复杂规则和逻辑路径。


图6 & 图7(报告页8-9)


  • 模拟交易基于CART模型。

- 图6样本内,盈利曲线平滑且超过600万元。
  • 图7采用逐月外推,累计盈利锐减且出现较大回撤,体现模型过拟合问题。


表2、3、4及表5(报告页10-11)


  • 详细线性回归系数、t值、p值,验证模型变量的统计显著性。

- 表5总结5%显著性变量,强调大部分时间段解释变量显著,反映模型解释力。
  • 回归稳健与解释变量关系清晰,是线性模型优势。


图8 & 图9(报告页12-13)


  • 基于线性模型构造的模拟交易收益。

- 图8样本内模拟,曲线稳定上升,收益明显。
  • 图9样本外外推,盈亏波动较大但仍保留盈利性,优于CART模型外推表现。


图10、图11及表6(报告页14-15)


  • 图10统计各时段在模拟策略中的净盈利贡献,显示时段之间极端差异。

- 图11分季度统计,验证贡献稳定性,图示高低收益时段季节性差异。
  • 表6明确量化各时段正负贡献的季度频率,指出剔除负贡献时段的合理性。


图12(报告页15)


  • 策略剔除负贡献时段0、3、7后的累积盈利表现,表现更佳。


附录图13~图22(报告页17-21)


  • 各个时段对应的CART模型决策树细节,支持主文中模型构造。

- 分时段深入展示解释变量阈值及分类路径,辅助理解模型逻辑。

---

四、估值分析



本报告不包含对股指期货合约的传统估值(如DCF等)分析,侧重于技术面分时涨跌行为的统计建模与交易策略实现。

---

五、风险因素评估


  • 模型误差风险:因模型为简化抽象,难以完全捕捉复杂市场动态。

- 过拟合风险:如CART模型样本内表现优异,样本外表现显著恶化。
  • 市场结构变动风险:法律政策、市场参与者行为变化可能削弱模型有效性。

- 交易成本与滑点:实际执行成本和流动性风险未能完全量化。
  • 时段剔除带来的风险:遗漏某些潜在盈利机会,策略局限性。

- 风险缓解建议:动态评估模型效果,适时调整策略边界和信号阈值,配合风险管理机制。[page::0,16]

---

六、批判性视角与细微差别


  • CART模型在反映单一投资者心理阈值方面有较好表现,但忽视了投资者之间的异质性,导致整体市场行为预测能力和样本外泛化能力较弱。

- 线性模型虽然更稳健,但线性假设可能简化复杂非线性动态,尤其在高频分时段上的异常行情处理可能不足。
  • 模拟交易结果均存在样本内外差异,模型固有的“历史依赖”限制了未来预测的绝对准确性。

- 剔除亏损时段的做法虽提高收益稳定性,但同时可能导致策略的“过于保守”,失去了部分市场机会。
  • 模型依赖历史统计规律,忽视突发事件、极端市场波动的影响。

- 报告缺乏对策略风险收益比及最大回撤等其它风险指标的深入讨论。
  • 建议结合多模型与风险度量进一步优化,避免单一模型盲目追随。[page::8,9,10,13,16]


---

七、结论性综合



本报告通过对中国股指期货主力合约分日内十一半小时段涨跌幅进行量化分析,揭示了市场参与者行为模式的时间依赖特征。采用CART模型和线性回归模型分别解析投资者典型“阈值式”心理和整体市场预期,得出了以下关键见解:
  • 市场存在稳定的分时涨跌结构,由投资者交易习惯所驱动,可通过分时段统计量化。

- CART模型适合刻画单投资者的决策阈值,但受限于单阈值假设,在纯外推验证中收益和稳定性大幅下降,表明过拟合及异质性问题。
  • 线性模型利用广泛的解释变量和历史时段涨跌数据,更有效捕捉市场整体行为,且在样本外能维持更稳定盈利。

- 构建的模拟交易策略验证了模型的应用价值,单张合约收益显著,风险可控,尤其剔除表现持续负贡献的特定时段后,收益稳定性提升明显。
  • 风险提示明确表达模型的简化本质及未来不确定性,实际策略应用需结合风险管理,避免盲目依赖历史统计规律。

- 详实的附录图表为理解模型细节提供支持,涵盖每一时段CART决策树结果和线性回归显著变量,增强报告透明度和可信度。

总的来看,报告体现出基于技术分析的市场微观结构和行为金融结合的前沿研究,既揭示了股指期货市场内在的时间分布交易特性,也为实际量化交易策略制定提供了理论和实证依据,推荐投资者和研究者重点关注其分时段效应及风险应对措施。[page::0-25]

---

图表示例



图1:股指期货CART模型纯外推累计盈利(样本外,万元)





该图显示了基于CART模型进行逐月外推方式构建的单张合约累计盈利曲线。可以看出,尽管存在盈利,但相比样本内(图6)呈大幅下降并出现回撤,说明CART模型纯外推存在过拟合问题。

图2:股指期货线性模型纯外推累计盈利(样本外,万元)





线性模型外推累计盈利相较CART模型更高且更稳定,表明线性模型对市场整体分时行为的刻画能力更优。

图3:不同阶段盈利贡献(万元)





图3显示各时段收益贡献量化情况,明显存在部分时段带来负贡献(0,3,7),显著差异支持剔除低效时段的策略优化需求。

---

术语解释


  • CART模型(分类回归树):一种机器学习算法,递归地对数据特征空间进行划分,按一定规则将样本分为多个类别或预测数值,通过降低“混乱度”实现最优划分。

- 线性回归模型:利用解释变量的线性组合预测目标变量,模型假设因变量与自变量呈线性关系,估计回归系数以拟合数据。
  • Gini系数:衡量分组纯度的统计指标,越小群体越纯,常用于决策树划分评估。

- 外推:使用历史数据训练模型,再用模型预测训练区间外的新数据表现。
  • 滑点:交易时因市场价格波动产生的额外成本。

- 显著性水平:统计检验中用于决定拒绝原假设的概率阈值,一般设为5%。

---

结语



该报告系统地构建并比较了CART和线性模型对股指期货日内分时段涨跌的量化描述,开展了交易策略模拟,提供了市场行为与交易习惯稳态关联的有力证据。其细致的模型构建、回归分析及回测方案,为国内量化交易和市场行为研究贡献了重要经验,值得行业内专业人士深入学习和借鉴。

---

[全文引用页码标识]
[page::0,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25]

报告