“技术分析拥抱选股因子”系列研究(十六) CPV 分时版
创建于 更新于
摘要
报告提出基于日内分时段价量相关性的技术分析因子CPV分时版,通过构建最后30分钟价量相关性标准差因子PV_corr_std_1430,有效提升了选股多空对冲收益及风险调整表现。分时版因子在沪深300、中证500等多指数样本外均表现优异,信息比率显著高于传统全天价量因子,且回测显示相关性较低的纯净因子依旧保持强选股能力。此外,基于该因子构建指数增强组合,实现了稳定的超额收益和较小回撤,具备良好应用前景[page::0][page::4][page::12][page::17][page::20]
速读内容
高频价量相关性因子构建与表现 [page::3][page::4][page::5]

- PVcorravg因子在样本内有效,样本外失效,年化收益约12.61%,信息比率1.13。
- PVcorrstd因子样本内外均有效,年化收益19.98%,信息比率提升至1.80,显著提升了选股能力。
分时价量相关性因子的理论基础与构造方法 [page::6][page::8][page::9]

- 考虑交易日240分钟分为8个30分钟段,分别计算价量相关性,发现部分时段相关性与全天显著不同。
- 最后30分钟交易存在更高比例的知情交易,信息含量最大。
- 存在辛普森悖论现象,全天价量相关性不能代表各时段表现,突显构建分时版因子的必要性。
分时版因子样本内外回测绩效及分时选段优选 [page::10][page::11][page::12]

| 时间段 | 年化收益率 | 年化波动率 | 信息比率 | 月度胜率 | 最大回撤率 |
|---------|-----------|-----------|---------|---------|-----------|
| 全天 | 18.81% | 8.79% | 2.14 | 72.97% | 10.23% |
| 14301500 | 25.93% | 9.39% | 2.76 | 80.56% | 9.46% |
- 最后30分钟的价量相关性标准差因子(PV
分时版因子推广与纯净因子分析 [page::13][page::14][page::15]
| 传统价量因子 | 年化收益率 | 信息比率 | 最大回撤率 |
|-----------------|-----------|---------|-----------|
| Vol1430 | 22.59% | 1.50 | 18.79% |
| STR1430 | 41.63% | 2.82 | 9.67% |
- 分时因子对波动率、换手率因子同样有效,支持方法的推广应用。
- 分时版纯净PVcorrstd1430与Barra风格因子相关性小,回归剔除行业后仍有效,年化收益13.66%,信息比率2.43。
多空收益分解及各类指数中表现 [page::16]
| 指标 | PVcorrstd1430 | PVcorrstd |
|--------------|----------------|-------------|
| 多空对冲收益率 | 27.71% | 19.98% |
| 多头超额收益率 | 6.87% | 5.43% |
| 空头超额收益率 | 19.81% | 14.09% |
- 分时版因子在多头和空头策略中均有更好表现。
- 在沪深300、中证500、中证1000、国证2000各种指数成份股中均优于传统因子。
指数增强组合构建及绩效表现 [page::17][page::18][page::19]

- 基于PVcorrstd_1430因子构建月度等权选股组合,在沪深300及其他主流指数成份股中均实现稳定超额收益和较低回撤。
- 组合在各指标均明显优于传统反转因子Ret20和波动率因子Vol20。
策略核心思想总结 [page::4][page::6][page::12]
- 利用价量相关性标准差度量价量配合的稳定性。
- 对日内交易时段分割,突出最后30分钟的信息价值与交易活跃度。
- 构建基于最后30分钟价量相关性标准差的因子,并剔除行业及风格影响形成纯净因子,以提升选股稳定性和持续盈利能力。
- 该因子构建的指数增强策略年化收益率超27%,信息比率达2.55,具备较高的风险调整收益能力。
深度阅读
分析报告:《技术分析拥抱选股因子”系列研究(十六):CPV 分时版》详细解读
---
一、元数据与报告概览
报告标题: “技术分析拥抱选股因子”系列研究(十六)——CPV 分时版
发布机构: 东吴证券研究所,东吴金工团队
报告日期: 2024年12月29日
分析师: 高子剑、庞格致
研究主题: 挖掘和优化基于高频价量相关性的选股因子,重点关注“CPV”(成交价量相关性)因子的分时构建与表现
核心论点与结论:
报告延续了2020年首次提出的高频价量相关性因子CPV,针对其样本外表现不佳问题,创新引入“分时版”因子,即将交易日划分为8个30分钟段分别计算价量相关性,重点关注最后30分钟的价量相关性标准差因子PVcorrstd1430。该分时版因子在全样本和样本外均表现稳健优异,年化收益率高达27.7%,并通过剔除行业和Barra风格因子系数,验证了其纯净选股能力。最终,报告建议采用最后30分钟的价量相关性标准差作为CPV分时版的代理变量,具有较高的投资参考价值和推广潜力。
风险提示主要包括基于历史数据的不确定性、单因子模型波动性、及数据测算误差风险。[page::0,20]
---
二、逐节深度解读
1. 高频价量相关性因子(章节1)
1.1 CPV因子背景与定义
价量关系是技术分析中重要理论,价上涨放量(价量配合)通常预示股价强势,反之则为价量背离。报告通过对2019年10月16日两只个股“中公教育”“微芯生物”分钟级价量走势观察,说明相关系数可代理价量配合程度,正相关表现强势股。
此处以相关系数作为因子,将每只股票在过去20个交易日内每日分钟级价量的相关系数拿来计算均值和标准差,得两个因子:PVcorravg(均值)和PVcorrstd(标准差)。[page::3]
1.2 PV
corravg 与 PVcorrstd 因子的选股表现以2014-2023年数据回测,PVcorravg因子样本内表现优异,年化收益12.61%,信息比率1.13,但样本外明显失效(多空对冲净值无明显升值趋势)。反观PVcorrstd标准差因子,年化收益近20%,ICIR达1.8,且样本外仍保持效果稳定,显示波动性(标准差)比均值更能反映选股能力。
图3和图4分别展示两个因子的10分组净值走势,PVcorrstd分组间差异较大,上层组明显跑赢下层组,支持其因子有效性。[page::4,5]
1.3 趋势因子 PV
corrtrend趋势因子通过对20日内价量相关系数变化趋势回归获得的系数(β),并做市值及传统因子正交处理。回测显示,PVcorrtrend因子年化收益约10%,信息比率1.18,但最大回撤率达到30.19%,说明其稳定性不足。[page::5,6]
---
2. CPV 分时版(章节2)
2.1 构建动因和理论基础
- 分时化因子基于两个关键观察:
1. 收盘前最后30分钟知情交易者比例升高(图6),市场信息更丰富,价量关系更有鉴别力。
2. 之前研究(“求索动量因子”系列)证明最后半小时换手率对隔夜收益排序效果最佳(图7)。
- 因此,分时版因子将交易日划分为8个30分钟段,分别计算每段的价量相关性,致力于找到信息信号最强的时段。
- 此外,报告提示全天价量相关性可能因时段内不同价量关系而偏离真实效果,类似所谓“辛普森悖论”的现象(后文详述)。[page::6,7]
2.2 分时价量相关性因子具体计算方法
定义每个时段 \([a, b]\) 内分钟收盘价和成交量的相关系数,将20交易日内的相关系数计算平均值和标准差,作市值中性化处理,构造分时因子PVcorravg和PVcorrstd。符号“1-8”代表8个30分钟段,“0”代表全天。[page::7]
2.3 全天vs分时:辛普森悖论实例
报告通过两个个股案例说明全天价量相关性存在偏差问题:
- 龙溪股份(600592.SH)2023-06-30:
全天相关系数0.67,第一时段相关系数0.74,其他七个时段相关系数多数为负,去除第一时段后整体相关性转负(图8-11)。该现象表明第一时段对全天数据贡献过重,掩盖其他时段的不同表现。
- 昱能科技(688348.SH)2023-06-29:
全天价量相关系数0.55,分时各段多数呈负相关,分时数据内部负相关,但分组间整体正相关,即辛普森悖论(图12-15)。投射到价量相关性指标,使用全天数据会产生误导。
- 对于涨跌停股(如中体产业案例),价量相关性缺乏实质意义,故作剔除(图16-17)。
综上,全天价量相关性指标容易产生偏差,分时度量能更准确反应真实价量配合、信息披露动态。[page::7~10]
2.4 最佳分时段因子选择及回测表现
- 八分时因子年化ICIR指标(图18、19)表明,PV
- 表1和表2展示了PVcorrstd每个时段不同指标的样本内和样本外回测结果,结果明确支持最后30分钟的标准差因子作为CPV分时版因子。
- 该因子(PV
---
3. 其他重要讨论(章节3)
3.1 传统价量因子与分时版类比
报告不仅仅对价量相关性进行分时处理,同时验证了“波动率(Vol)”、“换手率(Turn)”、“换手率标准差(STR)”等因子分时版本在选股效果上的优势(表3)。分时策略具有更广泛的推广应用价值和普适性。[page::13]
3.2-3.3 分时版价量因子的年度表现及纯净度检验
- PVcorrstd1430因子分年度表现良好,多年度信息比率高,月度胜率大多超过60%(表4)。
- 与Barra风格因子相关度较低(大部分相关系数|r|<0.3),为风格中性因子(表5)。
- 通过对Barra风格因子与行业因子做回归残差,构造纯净PVcorrstd1430因子,依然保持强劲表现,年化收益13.66%,信息比率2.43,最大回撤仅4.91%(图21,表6)。说明该因子能提供独立且有效的选股信息。[page::14,15]
3.4 参数敏感性分析
改变回溯期(20、40、60日)测试回测结果,PVcorrstd1430因子长期表现最稳定,最佳为20日回溯期(表7)。该设计反映因子既不过度反应短期噪声,也不过度滞后。[page::15]
3.5 多空收益分解
分时因子PVcorrstd1430的多头和空头超额收益均好于未分时版,信息比率和月胜率亦高于未分时因子,显示其选股和避险能力更全面(表8)。[page::16]
3.6 不同指数成份股样本验证
在沪深300、中证500、中证1000和国证2000四大指数样本中,PVcorrstd1430因子均表现优于未分时版本和传统反转、波动率因子,无论从年化收益率、信息比率还是最大回撤均表现优异,适用范围广泛(表9)。[page::16]
3.7 指数增强组合应用
基于PVcorrstd1430构建等权重指数增强组合,覆盖沪深300、中证500、中证1000、国证2000,均表现出累积超额净值优势,信息比率和收益率领先其他三类组合(传统反转因子Ret20、波动率Vol20、未分时PVcorrstd)(图22-25,表10-13)。证明该因子不仅具备学术选股能力,在实际投资组合构建中亦有良好表现和应用价值。[page::17~19]
---
三、图表深度解读
- 图1、2(中公教育与微芯生物分时价量曲线) :展示典型价量配合与背离案例,生动说明价量相关系数正负的直观含义,为CPV因子设计提供直观逻辑支持。[page::3]
- 图3、4(PVcorravg与PVcorrstd分组净值曲线) :PVcorrstd在样本外依然保持有效性,曲线分组间差异明显,强化标准差因子相较均值因子的优越。[page::4,5]
- 图6、7(日内信息交易概率及动量因子):确认最后30分钟交易中信息含量最高,支撑将分时价量因子构建重点放在后半小时。[page::6,7]
- 图8-11(龙溪股份分时价量相关性示例):视觉明示全天数据可能被首个30分钟时段数据主导,导致整体相关性掩盖其他时段真实关系。[page::8]
- 图12-15(昱能科技与辛普森悖论):生动演绎统计学悖论如何导致价量相关性误导,强化分时处理的必要性。[page::9]
- 图16-17(涨跌停股价量相关性无效性):提示极端价格限制下价量指标失真,需剔除特殊样本以保证因子有效。[page::10]
- 图18-19(分时PVcorravg和PVcorrstd年化ICIR):突出PVcorrstd分时最后半小时选股指标最优。[page::10,11]
- 图20(PVcorrstd1430分组净值):分组分明且稳健上升,界定因子优质标准。[page::12]
- 图21(纯净PVcorrstd1430多空净值):净化行业与风格影响后仍具良好性能,验证因子独立性和实用价值。[page::14]
- 图22-25(指数增强组合净值):横跨不同指数成份股,展示因子构建投资组合的持续超额收益与风险控制能力。[page::17~19]
---
四、估值分析
本报告主要是基于量化因子研究,未涉及公司估值模型及目标价评估,不适用常规DCF或多重估值法的解读。报告核心工作为因子构造和选股绩效回测。重点是因子设计合理性、时间频段选取、样本外表现及纯净因子构造。
---
五、风险因素评估
- 历史数据依赖风险:所有统计基于历史交易数据,未来市场结构或行为模式变化,可能导致因子失效。
2. 单因子收益波动性:因子本质为单一指标,存在较大波动,建议结合风控、资金管理等多因子策略使用。
- 数据测算误差风险:高频数据质量及计算方法误差可能影响因子稳定性和实际应用效果。
报告未提及风险缓解措施,建议投资者在应用过程中结合实盘动态监控和多因子对冲技术。[page::0,20]
---
六、批判性视角与细微差别
- 报告对全部结论均依赖于历史回测和统计显著性,没有从微观市场结构变化角度或潜在制度变革风险作深入探讨。
- 因子表现的分时优化虽有效,但对计算及数据处理要求较高,实际交易中执行成本和滑点影响未涉及,可能影响因子落地效果。
- 虽强调了因子与传统风格因子相关性较低,但对其他潜在系统性风险因子间的交叉影响尚不明确。
- “最后30分钟因子表现最佳”结论来源于ICIR等统计指标,但因子逻辑上的因果机制未做深层次验证,未来需警惕样本挖掘偏差。
---
七、结论性综合
本报告提出并系统验证了“CPV分时版”因子,即基于日内最后30分钟的价量相关性标准差构建的选股因子PVcorrstd1430,成功解决了早期CPV因子样本外失效的问题。通过细致分时分析,发现全天价量相关性常因某一时段过度影响而失真,且存在辛普森悖论效应,分时度量显著提升选股信号的准确性和稳定性。
量化回测覆盖2014年至2023年,样本内外泛化良好,信息比率显著优于传统价量及动量因子,最大回撤较小,月度胜率高,支持其作为稳健选股信号的地位。剔除风格和行业影响后,因子纯净性强,独立贡献显著。
同时,分时因子适用范围广,不仅局限于价量相关性,还延伸到波动率、换手率等因子,展现其广泛应用潜力。构建的基于PVcorrstd1430的指数增强组合在沪深300、中证500、中证1000及国证2000等多样样本空间均表现稳健超额收益。
总结来看,东吴证券研究团队通过数据驱动和理论结合,创新构建了一个具有显著实用性的高频选股因子,体现价量配合在不同交易时段的信息价值差异。研究方法科学严谨,结论支持因子在实务中作为增强指数投资组合和单股票策略的重要工具。
投资者在应用时,应注意历史数据依赖及单因子波动风险,结合资金管理与多因子框架,并关注后续市场环境变动对因子稳定性的影响。
---
全文关键数据及指标回顾:
- PVcorrstd因子年化收益约20%,样本外稳定
- PVcorrstd_1430(最后30分钟)年化收益27.7%,信息比率2.55
- 最大回撤控制在9.46%以内,月度胜率75%以上
- 纯净因子(剔除风格与行业)年化收益13.66%,信息比率2.43
- 因子与Barra风格相关度小,独立性强
- 不同指数成份股表现均优,适用性广泛
- 指数增强组合体现出持续稳健的超额回报能力
报告通过大量图表、分时实例、生动演绎理论悖论及严密统计验证,清晰说明了分时CPV因子的设计逻辑与实证效果,极具参考价值和实操意义。[page::0~21]
---
结语
本报告深入剖析了高频价量相关性因子的进阶构建方法,强调分时处理尤其是最后30分钟价量相关性标准差指标的强大选股能力和稳健性,全面提升技术分析因子在实际投资中的适用性和表现,值得投资研究者和实务操盘手重点关注与应用。