`

价量类新因子 Neg_pos_ID 和 CO 的有效性测试

创建于 更新于

摘要

本报告测试了两种价量类新股选因子Neg_pos_ID与CO的有效性,发现Neg_pos_ID表现为价格动量因子,CO表现出非线性选股效果。CO因子加入后显著提升了多因子模型预测能力,且两因子在构建期越短时选股效果越显著。以换手率或成交额衡量CO因子均表现相似,增加这两个因子能显著提高A股股票横截面收益预测能力,为量化选股提供新思路。[page::0][page::4][page::5][page::6][page::8][page::9][page::10]

速读内容


NegposID因子的基本定义与选股效果 [page::0][page::4][page::5]

  • NegposID定义为下跌天数比例减上涨天数比例,反映价格动量特征。

- 因子值低(上涨天数多)股票后期1个月收益表现更好,因子值高(下跌天数多)股票收益表现较差。
  • 控制反转因子后,NegposID的选股效果有所增强,极端组间收益差由0.50%增至0.63%。


CO因子的概念与表现特点 [page::0][page::5][page::6]

  • CO因子衡量上涨和下跌时交易活跃度(换手率)的差异,体现投资者情绪的过度反应。

- CO因子分组组合收益表现为明显的负相关性,最低组月均收益2.40%,与最高组相差1.05%。
  • Fama-French三因子超额收益中亦体现该规律,极端组超额收益高达0.85%。


CO因子多维度回归分析与非线性表现 [page::6][page::7][page::8]


  • 表1显示CO因子与市值、反转、换手率等因子相关性显著,调整后仍具负单调选股能力。

- 控制市值、反转等其他因子后,CO因子表现出拟二次函数型的非线性效应。
  • 分解CO为正负两部分,分别反映不同市场情绪影响,对收益预测差异显著。


横截面回归结果及新因子边际贡献分析 [page::7][page::8]


| 模型 | 市值涨跌系数 | 反转系数 | 换手系数 | 波动系数 | 价值系数 | 营业利润同比增长 | NegposID系数 | COneg系数 | COpos系数 | 调整R方 |
|------|-------------|---------|---------|---------|---------|----------------|---------------|----------|----------|---------|
| 方程1(基础6因子) | -0.95% (t=-5.14) | -0.41% (t=-3.17) | -0.35% (t=-2.73) | -0.42% (t=-5.39) | 0.07% (t=-0.69) | -0.05% (t=-2.42) | - | - | - | 7.85% |
| 方程2 (+NegposID) | -0.94% | -0.47% | -0.36% | -0.41% | 0.06% | -0.05% | -0.10% (不显著) | - | - | 7.89% |
| 方程3 (+COpos, COneg) | -0.94% | -0.33% | -0.23% | -0.43% | 0.06% | -0.05% | - | 0.11% (显著) | -0.26% (显著) | 8.27% |
| 方程4 (+NegposID, COpos, COneg) | -0.92% | -0.40% | -0.22% | -0.41% | 0.06% | -0.05% | -0.18% (显著) | 0.06% | -0.31% | 8.31% |
  • CO因子显著提升模型预测能力,NegposID边际贡献较弱但能微提升调整R方。

- 新因子对换手率因子的系数和显著性有显著影响,表明新因子与换手率相关性强。[page::8]

CO因子不同计算方式及因子构建期敏感性分析 [page::8][page::9]


| 构建期 | COpos收益率 | COneg收益率 | NegposID收益率 | 调整R方 |
|--------|-------------|-------------|-----------------|-------|
| 2周 | -0.50% (t=-7.01) | 0.08% (t=1.86) | -0.26% (t=-3.32) | 8.79% |
| 1个月 | -0.31% | 0.06% | -0.18% | 8.31% |
| 3个月 | -0.21% | 0.03% | -0.10% | 8.28% |
| 6个月 | -0.17% | 0.01% | -0.14% | 8.22% |
  • 以成交额替代换手率计算CO因子,结果基本一致,表明计算方式稳健。

- 构建期越短,因子表现越优,2周构建期COpos因子表现最佳,显著性和解释力最高。[page::9][page::10]

结论与风险提示 [page::0][page::10]

  • Negpos_ID为动量类价量因子,CO为反转和情绪过度反应因子。

- 这两种新因子能在一定程度上提升传统多因子模型的收益预测能力,尤其是CO因子显著。
  • 风险包括市场环境变化与因子失效风险,投资需注意谨慎。

深度阅读

关于两种价量新因子的研究报告的详尽分析



---

1. 元数据与概览


  • 报告标题:价量新因子测试

- 作者:冯佳睿、罗蕾(海通证券研究所,金融工程团队)
  • 发布日期:未明确具体日期,但文献引证至2017年

- 研究机构:海通证券研究所
  • 主题:探讨两种创新价量因子——NegposID和CO在中国A股市场的选股效果与预测能力,评估其是否能为传统资产定价因子模型增添增量信息。


报告核心论点是,NegposID和CO因子体现了股票价格运动的时间分布特征及其伴随的交易活跃度,更精细地捕捉了价格动量和过度反应特征,有助于提高收益率预测效率。报告通过实证测试和横截面回归分析,验证这两个因子的有效性和边际贡献,并对因子构建方法及敏感性进行了全面讨论。报告重点揭示:
  • NegposID因子反映上涨天数与下跌天数之差,体现价格动量特征。

- CO因子衡量股票上涨与下跌期间的交易活跃差异,体现投资者情绪及过度反应特征,其选股效果呈非线性。
  • 新增因子提高了收益率预测的调整R方,尤其是CO因子的增量贡献显著。

- 因子构建期越短,预测能力越强,表明日频数据较月频表现更好。

风险提示则围绕市场环境变化和因子失效风险,强调模型结果仅供参考、不构成直接投资建议。[page::0,10]

---

2. 逐节深度解读



2.1 相关研究与研究背景(引言部分)



报告首先引入了国内外相关价量因子研究,特别是 Da et al. (2014)提出的信息离散度指标(PosID/NegID)和Suk等(2014)提出的过度反应度量指标CO。二者均从价格变动的连续性及交易活跃度角度挖掘股票动量与反转特征。报告指出因中美市场投资者结构差异,传统月度计量不适合A股,故采用更高频(日度)指标以提升模型表现。[page::4]

2.2 NegposID因子测试结果


  • 定义:NegposID = 下跌天数占比 - 上涨天数占比。反映价格运动中上涨与下跌持续性天数差异。

- 逻辑:NegposID较低(下跌天数较少,上涨天数多)表示股票表现相对强势,预期未来1个月收益较好。
  • 数据表现:图1显示2007-2016年分组后,NegposID最小组股票月均收益最高(2.83%),最大组最低(2.32%),差异0.5%,10%置信水平显著。图2控制反转因子(前期收益)的影响后,选股单调性增强,极端组差距增至0.63%。

- 推理:在相似跌幅或涨幅组中,价格出现极端变动天数较少的股票,其价格更可能存在过度反应,未来修正概率及收益更高。

这表明NegposID既捕获了一定的价格动量特征,又部分体现价格过度反应信息,但整体选股效果因其指标设计较为朴素,表现不如传统动量因子显著。[page::4,5]

2.3 CO因子测试结果


  • 定义:CO指标度量上涨与下跌期间的换手率之差,权重采用最近交易日更重的指数移动平均,反映投资者在股价不同方向变动时的交易情绪活跃度。

- 逻辑:负CO反映下跌时交易更活跃(投资者悲观),正CO反映上涨时交易更活跃(投资者乐观)。预期表现差的股票(CO负)未来收益与CO正相关,表现好的股票(CO正)则负相关,总体呈非线性。
  • 数据表现:图3表明CO从小到大分5组,极端组差值约1.05%,T统计3.24显著;图4显示极端组基于Fama-French三因子调整后的阿尔法收益差异为0.85%。表1进一步揭示CO因子与其他因子(市值、反转、换手率、波动)呈显著相关,特别市值呈负相关,换手率和反转正相关。

- 控制其他因子后:图5和图6显示仍保有显著的负相关单调性,同时因子收益呈二次函数型非线性趋势(图7、8),提示传统单因子线性模型解释有限,建议拆分COpos与COneg或加入平方项捕捉该非线性。

CO因子表明投资者对股价变动方向的交易活跃度存在过度反应,且该过度反应对未来收益具有较强的预测能力。尤其CO正部分对上涨过度反应及其未来反转更具解释力。[page::5,6,7]

2.4 横截面收益率回归分析


  • 研究构建了以市值、反转、换手率、波动率、价值、营业利润同比增长率为基础的6因子模型,调整R²约7.85%。

- 在基本模型中增加NegposID因子,模型预测能力提升微弱(调整R²升至7.89%),系数未达到显著水平,说明其增量贡献有限。
  • 增加CO因子(拆分COpos和COneg)显著提高模型预测能力(调整R²升至8.27%),两个因子均显著,且符号符合预期:

- COneg(负CO部分)对未来收益正向影响,
- CO
pos(正CO部分)则负向影响,且系数绝对值更大,显示上涨过度反应的反转效应更明显。
  • 进一步模型(方程4)显示NegposID与COneg存在相关性,二者共同纳入时NegposID变得显著,且减弱了COneg的有效性,新因子对换手率因子的影响尤为明显,换手率系数及显著性降低,表明二者存在信息交叉。

- 新因子的加入不影响市值、反转等传统因子系数,保障了模型的稳定性和解释力结构。

综上,CO因子为模型带来了实质性预测增量,NegposID的贡献较弱但存在边际价值,二者与换手率因子呈现相关性,需要综合考虑因子多重共线影响。[page::7,8]

2.5 因子其他计算方式与构建期敏感性测试


  • 用成交额代替换手率计算CO因子,回归结果差异极小,调整R²略有提升,表明因子对换手率和成交额这类表现活跃度指标的选择不敏感,稳健性较强。

- 构建期限从6个月、3个月、1个月到2周依次缩短,因子收益率及显著性均增强,调整R²从8.22%升至8.79%,且2周期的COpos因子收益率达到0.5%,显著性最高。
  • 解释成分为短期的价格动量和投资者情绪波动更能反映市场微观活跃信息,增强因子捕捉能力。


因此,短期更频繁的数据构建显著提升价量因子的预测效率,提示A股市场中短期投资者行为特征突出,符合高频交易对动量和反转的敏感性。[page::8,9]

2.6 结论与风险提示


  • NegposID表现为价格动量因子,低值代表上涨天数多、未来收益好。

- CO表现为非线性过度反应因子,反映投资者买卖活跃度差异,整体表现为换手率等量时收益最佳,利于分辨投资者情绪极端反应。
  • 两个因子补充传统6因子模型,提高了收益率预测能力,CO因子增量贡献尤为明显。

- 因子计算方式和构建周期影响较大,短期(日频)表现更佳。
  • 风险主要为市场结构变化致因子失效,且模型基于历史公开数据,未纳入主观判断,存在一定局限。


特别声明强调这些模型结果不构成投资建议,存在市场与因子失效风险。[page::9,10]

---

3. 图表深度解读



3.1 图1和图2:NegposID分组月均收益


  • 图1展示2007-2016年按NegposID分為5组,月均收益最高组D1为2.83%,最低D5为2.32%,呈轻微负单调趋势,因子极端值间差约0.5%。

- 图2排除反转因子影响(控制后),曲线趋于更加单调且极端差距扩大至0.63%,反映Neg
posID独立于反转效应具备一定预测能力。

3.2 图3和图4:CO因子分组表现与FF3月均超额收益


  • 图3显著负相关,最低CO组D1月均收益为2.4%,最高组D5坠至1.34%。

- 图4显示基于Fama-French三因子调整后超额收益同样负相关,极端组差约0.85%,证明因子具有风险调整后的显著有效性。

3.3 表1:CO组合收益与特征


  • CO因子负相关于市值,正相关于反转、换手率和波动率,显示其混合了多种市场特性。

- 组合收益差体现因子的强选股能力。

3.4 图5和图6:控制其他因子后CO收益表现


  • 多条线分别表示控制市值、反转、换手率和波动后的收益走势,整体曲线仍呈现负单调趋势,有部分折线显示组合收益呈现非线性形态(似抛物线)。


3.5 图7和图8:20组分组后CO因子非线性表现


  • 将CO因子细分20组后,显示组合收益随因子值先上升后下降的趋势,更明显展现非线性关系,进一步验证报告建议的平方项和双分版本策略。


3.6 表2:横截面回归关键结果总结


  • 差异尽显于CO及NegposID因子,引入后调整R²明显提升(尤其是含CO因子)。

- CO
pos与COneg系数符号相反,回归T值均显著。
  • 换手率因子系数下降,暗示新因子部分替代其预测能力。


3.7 表3和表4:稳健性测试


  • 表3两种计算CO方式拟合结果近似,体现数据计算的稳健性。

- 表4不同构建期的回归结果显示短构建期(2周)优于长构建期(6个月),其余因子表现相对稳定。

---

4. 估值分析



本报告并无传统公司估值分析,因其核心为因子研究与选股模型搭建,故未涉及市盈率、DCF等估值模型,重点放于模型的预测调整能力和因子的边际贡献分析。

---

5. 风险因素评估


  • 市场环境变动风险:市场结构、投资者行为改变可能导致因子失效。

- 因子失效风险:如因子信息被市场充分反映或套利消除,因子信号会减弱甚至消失。
  • 模型假设限制:数据来源仅为公开市场信息,无任何主观调整,模型对非线性和高阶交互缺乏深度捕捉。

- 技术实现风险:较短构建期的高频数据需要高质量数据支持,存在数据噪声与过拟合风险。

报告未明确提出具体缓释策略,但通过稳健性测试与对因子非线性特征的探讨显示出研究人员在避免过拟合与模型鲁棒性方面的谨慎。[page::0,10]

---

6. 批判性视角与细微差别


  • 因子解释力有限:NegposID因子表现较弱,增量解释能力不足且与COneg存在相关性,实际使用时可能需合并或筛选。

- 非线性处理待深化:CO因子展现非线性,报告建议平方项或双因子拆分,但模型回归仍主要为线性,非线性因子模型开发空间大。
  • 换手率因子的替代问题:新因子替代了换手率部分效力,暗示二者可能存在重叠信息,组合策略应避免多重共线。

- 样本范围局限:时间窗口固定为2007至2016年,且排除ST股和刚上市个股,未来市场结构及政策变化可能影响因子稳定性。
  • 高频改进显著但计算成本上升:短构建期因子表现优异,但计算和数据处理的复杂度也高,实际操作时需权衡。


总体,研究严谨,但需注意报告模型所基于的历史经验在未来间或难以完全复制,投资者应结合风险管理与多因子融合应用。[page::4,7,8,10]

---

7. 结论性综合



本报告聚焦两种价量新因子:NegposID代表价格动量的时间序列分布特征(上涨/下跌天数差异),CO衡量价格涨跌周期内的交易活跃度差异,刻画投资者的过度反应行为。研究基于中国A股市场2007-2016年的数据,采用分组收益比较、Fama-French三因子超额收益分析及横截面多因子回归方法系统验证因子的有效性。
  • NegposID体现了一定的价格动量效应,尤其在剔除反转因子影响后,带来更显著的选股收益,但整体选股收益差异有限,模型增益较小。

- CO因子展现强烈的预测增量价值,在控制常见因子后依然产生显著调整后超额收益,且表现出非线性关系,特别对投资者情绪及交易活跃度不同情况的股票收益预测尤为有效。
  • 两个因子的加入提升了模型的拟合优度,其中CO因子的贡献尤为突出,增强了收益预测能力,尤其构建周期为2周的短期因子表现最佳。

- 使用成交额替代换手率计算因子,保持了模型稳健性,体现因子设计具备一定普适性。
  • 新因子与换手率因子相关,并部分替代其效果,但并未削弱其他传统因子的预测稳定性。


图表中,收益走势、分组超额收益及回归统计显示出以上因子确实包含了传统模型未充分捕捉的额外信息,特别是CO因子的非线性选择趋势和显著的超额收益。此外,涵盖多层次控制因子后,仍然能有效横跨不同市值及波动率水平,表明其适用范围较广。

本报告充分体现出利用高频交易行为数据和细致的价格变动记录提升多因子模型预测能力的潜力,但也提示需警惕市场环境变迁与因子失效风险,建议投资者结合自身风险容忍度及动态调整策略审慎应用。

---

参考图片展示(重要图表)


  • 图1 NegposID分组月均收益(2007-2016)


  • 图2 控制反转因子后 NegposID 分组月均收益


  • 图3 CO 分组月均收益(2007-2016)


  • 图4 CO 分组 FF3 月均超额收益(2007-2016)


  • 表1 CO 从小到大排序分组后的组合收益与组合特征

(见详细解读部分)
  • 图5 控制其他因子后 CO 分组月均收益(2007-2016)


  • 图6 控制其他因子后 CO 分组 FF3 月均超额收益


  • 图7 CO 分组月均收益(2007-2016,20组)


  • 图8 控制其他因子后 CO 分组月均收益(20组)



---

(全文依据报告内容逐字细读分章节分析整理,引用信息附页码标识。)

报告