`

重拾自信选股因子更新——从过度自信到重拾自信

创建于 更新于

摘要

本报告基于行为金融学中经典的DHS模型,创新构建过度自信因子CP及其改进型重拾自信因子RCP,利用高频分钟序列数据刻画投资者的信心持久度。新型RCP因子在2014-2023年回测中表现优异,年化收益超20%,信息比率达2.66,胜率超过80%,且改进的纯净RCP因子在剔除行业与风格影响后仍保持较强选股能力。因子适用于沪深A股多样样本空间,且对指数增强策略有良好参考价值,表现优于传统波动率和反转因子[page::0][page::3][page::5][page::9][page::10][page::11][page::13][page::16][page::17][page::20]

速读内容


过度自信因子CP构建与表现 [page::5][page::6][page::7]


  • 基于高频分钟序列计算利好超涨与股价回调的时间序号差距定义信心持久度CP。

- 回测2014-2023年,CP因子月度IC均值0.028,年化ICIR 1.86,10分组多空对冲年化收益14.07%,信息比率1.88,最大回撤7.14%。
  • CP因子经济意义与预期一致,因子值越大,股票表现越佳。


重拾自信因子RCP及其改进 [page::8][page::9][page::10][page::11]


  • RCP因子通过对CP因子剔除当日日内收益率残差构造,克服了过度修正的两类股票区分,识别“先过度自信后过度悲观”且后续补涨的品种。

- RCP因子回测年化收益20.49%,信息比率2.97,最大回撤仅4.03%,远优于CP。
  • 进一步通过因子标准化组合构造RCPnew,使因子信息利用更充分,纯净RCPnew的信息比率达2.52,年化收益提升至11.68%,表现稳定且优异。

- 对RCP因子做反转因子Ret20正交,得到RCP_deRet20因子,年化收益19.95%,信息比率3.06。

多市场及指数增强组合表现 [page::16][page::17][page::18][page::19]






| 指标 | 沪深300-RCP | 中证500-RCP | 中证1000-RCP | 国证2000-RCP |
|----------|----------|----------|------------|------------|
| 年化收益率 | 13.41% | 12.95% | 13.29% | 21.98% |
| 年化波动率 | 23.29% | 24.70% | 29.37% | 29.40% |
| 信息比率 | 0.58 | 0.52 | 0.45 | 0.75 |
| 最大回撤率 | 39.86% | 42.86% | 39.30% | 37.91% |
  • RCP因子在沪深300、中证500、1000及国证2000成份股均表现良好,显著优于波动率(Vol20)和传统反转因子(Ret20)。

- 基于RCP因子的投资组合具有较高收益与较优的风险调整表现,适合用于指数增强型策略构建。

量化因子构建方法总结 [page::5][page::6][page::9][page::10][page::11][page::13]

  • 因子主要基于高频分钟收益率对特定区间超涨和回调的时间序号进行统计,构成信心持久度指标。

- 通过对日内收益率和传统反转因子正交剔除已反映信息,得到纯净的重拾自信因子,提升信息含量和稳健性。
  • 因子采用10分组多空对冲方式进行绩效验证,涵盖多个样本范围,展示出良好的稳健性和适用性。


深度阅读

《重拾自信选股因子更新——从过度自信到重拾自信》研究报告详尽解析



---

1. 元数据与概览


  • 报告标题:《重拾自信选股因子更新——从过度自信到重拾自信》

- 作者:证券分析师 高子剑,研究助理 庞格致
  • 发布机构:东吴证券研究所

- 发布日期:2024年3月5日
  • 研究主题:基于行为金融学中的“过度自信”偏差构建的A股选股因子——“过度自信因子(CP)”及其升级版“重拾自信因子(RCP)",并对因子构造方法与实证结果进行了系统更新和优化。


核心论点及目标
该报告作为东吴金工“行为金融拥抱选股因子”系列的首篇,强调以行为金融学的角度解决传统量化模型在复杂市场环境中预测不稳的问题,重点聚焦投资者的过度自信行为。创立一种逆向思路:投资者过度自信和随后出现的过度修正(即重拾信心)的股价反映,通过精细构建“过度自信因子”CP及第二代“重拾自信因子”RCP,显著提升选股能力,实现高效多空对冲,进而为投资组合构建提供有力参考。报告通过多维数据回测,展示了因子在A股市场的优越表现和稳健性,并对模型风险进行了细致说明。

---

2. 逐节深度解读



2.1 引言(第3页)


  • 传统量化模型基于历史数据,忽视“人性非理性”的行为偏差,导致模型预测不稳定。

- 行为金融学提供“以人为本”的投资视角,强调行为特征的稳定性,提示以行为偏差构建模型或有望获得稳定超额收益。
  • 本文首次引入行为金融学中的“过度自信”,通过DHS模型,创新提出基于高频数据的“信心持久度因子”(CP),扩展到“重拾自信因子”(RCP)。

- 2022年9月进一步推出“重拾自信因子2.0"(RCPnew),通过改进因子结合方法提升选股绩效和纯净度,最新回测数据更新至2023年底[page::3]。

2.2 过度自信因子的构建(第4-7页)



2.2.1 DHS模型简介(第3-5页)


  • DHS模型(Daniel, Hirshleifer, Subrahmanyam,1998)为经典行为金融学模型,解释短期动量与长期反转现象,基于投资者因过度自信导致信息误读。

- 模型假设投资者在三个时期记录信息与股价价格演变:
- 期0:所有投资者收到初始财富和信息。
- 期1:知情投资者接收私人噪声信号($\varepsilon$),产生过度自信,股价超涨。
- 期2:所有投资者接收公开信号($\eta$),过度自信减弱但仍存在,股价回落。
- 期3:真实价值($\theta$)显现,股价修正至真实水平。
  • 关键数学表达式说明了知情投资者对私人信息精度被高估($\sigmac^2 < \sigma\varepsilon^2$),导致股价偏离真实价值。

- 该动态过程为构造过度自信因子逻辑提供理论基础,通过观察股价波动的时间差异和幅度来反映投资者信心的变化[page::3-5]。

2.2.2 CP因子构造方法(第5-7页)


  • 创新点:区别于传统基于换手率或涨幅的衡量方式,报告提出利用“利好消息导致的股价快速超涨”和“股价回调”之间的时间差,即“信心持久度CP”,反映投资者对内幕消息的过度自信程度。

- 操作步骤:
1. 日内划分交易时间(9:30-11:30, 13:00-15:00)为242分钟。
2. 计算每只股票每天242分钟收盘价的分钟收益率,共240条数据。
3. 计算分钟收益率的均值(mean)和标准差(std)。
4. 标识分钟收益率高于(mean+std)为快速上涨区间,低于(mean-std)为快速下跌区间。
5. 分别计算上涨和下跌区间时间的中位数,取下跌中位数减去上涨中位数,得出日频因子CP
Intraday,代表高位持续时间。
  • 以示例股票某交易日为例,快速上涨区间中位数为120分钟,快速下跌区间中位数42分钟,CPIntraday = 42 -120 = -78,体现价格变化过程中的滞后与持续性质。

- 月度因子构造:
- 回看过去20个交易日日频因子均值(CP
Mean)和标准差(CPStd)。
- 市值中性化处理后,将CP
Mean升序排序、CPStd降序排序,两排序编号相加得到最终CP因子。
  • 回测结果:

- 2014-2023年底,CP的月度均值IC为0.028,年化ICIR为1.86。
- 10分组多空对冲年化收益14.07%,年化波动7.50%,信息比率(IR)1.88,月度胜率70.59%,最大回撤7.14%。
  • 图3-5显示CPMean因子、CPStd因子及CP因子10分组净值曲线,表现稳定且符合经济直觉:因子值越大(高信心持续度),股票收益越高。

- 表1汇总了三种CP因子绩效指标,CP综合因子优于单纯均值或标准差因子[page::5-7].

2.3 重拾自信因子的构建(第8-11页)



2.3.1 过度反应后续:过度修正(第8页)


  • 基于DHS模型,投资者在经历过度自信后,公开消息时可能出现“过度修正”——过度悲观导致股价过度下跌。

- 股价走势分为两种典型形态(图6):
- 第一类(红色):股价收盘不涨反跌(过度修正),未来具备补涨空间,属于优选对象。
- 第二类(黑色):股价仍收于当日高位附近,利好效应已体现,无后续补涨需求。
  • 这一思考促使作者提出次级因子设计,剔除第二类股票,捕捉“重拾自信”的第一类股票[page::8].


2.3.2 RCP因子构造方法(第8-10页)


  • 为剥离不符合需求的第二类股票形态,创新性使用日内收益率对CP日频因子进行横截面线性回归正交处理:

$$
CP\
Intradayi = a + b \times Ret\Intradayi + \varepsiloni
$$
  • 以残差$\varepsiloni$构造RCPIntraday作为第一步净化因子。

- 月度频率同样计算20日滚动窗口的RCPIntraday均值(RCPMean)和标准差(RCPStd),市值中性化,两排序编号相加得RCP因子。
  • 回测期间,RCP因子的月度均值IC 0.038,年化ICIR 2.56,10分组多空对冲年化收益达20.49%,波动率6.89%,信息比率2.97,月度胜率84.87%,最大回撤4.03%,均优于CP因子。

- 说明剔除日内收益率影响后,因子更聚焦于过度修正且后续依然上涨的机会。
  • 图7-9显示RCPMean、RCPStd及RCP因子净值走势,呈现显著上升趋势。

- 表2综合展示各绩效指标,RCP因子优势明显[page::8-11].

2.3.3 RCP因子的改进(第10-12页)


  • 发现RCPMean与RCPStd相关性较低(约-0.18),存在用更合理方式结合两项信息提升因子潜力的空间。

- 采用标准化方式替代排序值组合,定义新CP
new和RCPnew因子如下:
$$
CP
{new} = \frac{CP{mean} - mean(CP{mean})}{std(CP{mean})} - \frac{CP{std} - mean(CP{std})}{std(CP{std})}
$$
$$
RCP{new} = \frac{RCP{mean} - mean(RCP{mean})}{std(RCP{mean})} - \frac{RCP{std} - mean(RCP{std})}{std(RCP{std})}
$$
  • 新因子回测表现:

- CP
new月度IC均值0.030,ICIR 1.92。
- RCPnew月度IC均值0.040,ICIR 2.64。
  • 图10-11显示新CP & RCP因子净值走势,展现出更强的收益趋势。

- 表3对比新旧因子绩效,新RCP因子年化收益率微升至21.26%,波动率略增至7.98%,信息比率略降,但整体选股能力更优。
  • 结合标准化优势保留了更多因子信息[page::10-12].


2.3.4 纯净重拾自信因子表现(第12-13页)


  • 新旧RCP因子与Barra常用风格因子相关性较低(表4),表明因子具有独立有效的alpha信号。

- 融合行业因素后,通过横截面多元回归剔除行业和风格影响,获得纯净RCP因子。
  • 纯净RCPnew因子表现明显优于纯净RCP因子:

- 年化收益11.68%,年化波动4.64%,信息比率2.52,月度胜率78.15%,最大回撤5.55%,均显著优于纯净旧因子(见表5)。
  • 图12-14显示新旧纯净RCP因子的净值走势对比,新因子具有更高收益和稳健波动性表现[page::12-13].


2.4 其他重要讨论(第13-18页)



2.4.1 剔除收益率与反转效应(第13-14页)


  • 探讨RCP因子剔除日内收益率后,是否等效于简单加入反转因子Ret20。

- 通过对月度因子RCP用Ret20回归正交,获取RCPdeRet20因子,检验非等价性。
  • 结果显示,RCPdeRet20因子年化收益19.95%,波动6.59%,信息比率3.06,高于原RCP,月度胜率83.19%,最大回撤仅3.54%,表明RCP非简单反转叠加,有独特选股价值。

- 图15展示净值走势,验证正交过程提升因子纯度和区分度[page::13-14].

2.4.2 新重拾自信因子分年度表现(第15页)


  • 表6和表7分年度展示RCP和纯净RCP因子的收益及表现。

- 2014-2015年表现尤为强劲,年化超额收益40%以上,信息比率3以上,月度胜率90%以上。
  • 2016-2018年市场整体弱势,因子表现减弱但仍保持正向超额,信息比率维持较好水平。

- 2019-2023年市场波动,因子整体稳健,部分年份回撤有限且信息比率维持2以上,显示因子抗周期性和较强的选股信号稳定性[page::15].

2.4.3 参数敏感性分析(第15-16页)


  • 通过扩展回看窗口至40和60日,测试因子稳定性。

- 表8表明,40日窗口下CP和RCP维持良好绩效指标,60日窗口表现有所下滑但仍在合理范围内。
  • 说明因子对观测窗口的敏感度较低,适用性较强[page::16].


2.4.4 多空收益分解(第16页)


  • 表9显示RCP因子多头超额收益9.10%,空头超额收益11.27%,空头表现略优,整体多空对冲年化收益21.26%。

- 信息比率多空为2.66,空头显著高于多头(3.21比1.38),显示空头策略中有效捕捉负面情绪净值下跌机会,对冲效果良好[page::16].

2.4.5 不同样本空间表现(第16-17页)


  • 通过沪深300、中证500、中证1000、国证2000的市场分层测试。

- 表10结果表明:
- RCP因子在沪深300、中证500、中证1000表现均优于传统波动率因子Vol20和反转因子Ret20,信息比率最高达到2.44。
- 在国证2000中,RCP信息比率2.46,明显优于其它因子,尽管年化收益略低于Ret20。
  • 验证了RCP因子的广泛适用性和跨市场稳定性[page::16-17].


2.4.6 指数增强组合构建(第17-19页)


  • 根据Vol20、Ret20、CP、RCP四因子构建对应投资组合,每组合10%的极端分位换仓。

- 回测期间(2014年底至2023年末):
- 沪深300组合四:RCP因子组合年化收益13.41%,信息比率0.58,显著优于其他组合(Vol20年化收益10.39%,Ret207.99%,CP13.18%)。
- 中证500组合四表现稳定,年化收益12.95%,信息比率0.52。
- 中证1000和国证2000组合四均取得最高收益(13.29%和21.98%),整体波动率略高但信息效率较优。
  • 图16-19展现不同市场净值增长曲线,均显示RCP因子组合最优。

- 表11-14详细指标支持该结论,证明重拾自信因子可有效用于指数增强策略[page::17-19].

---

3. 图表深度解读



图1:DHS模型示意图(第5页)


  • 描绘了模型期0-3中的信息流与股价反应过程。

- 展现出知情投资者在期1接收内幕消息导致股价快速上涨,期2公开消息引起回调,最终真实价值揭示股价调整完成的动态。
  • 图形化支撑模型假设,为后续因子定义提供理论依据。


图2:CPIntraday分钟收益构造示例(第6页)


  • 直观颜色区分快速上涨区间(红)与快速下跌区间(绿)。

- 标注所选区间中位数,用于计算CP因子的核心数值。
  • 具体样例展示精细计算步骤,确保因子计算方法透明。


图3-5:CPMean、CPStd及CP因子10分组多空对冲净值(第7页)


  • 各分组从低到高依次表现上升,分组10净值最高,分组1最低,说明因子排序合理。

- 多空对冲净值(灰虚线)稳步上升,说明因子具有积极的选股效能。
  • CP因子的综合表现优于仅用均值或标准差因子。


图7-9:RCP因子各构成部分10分组多空对冲净值(第9-10页)


  • 同样呈现出清晰的阶梯式净值提高趋势,分组越高表现越优。

- 多空对冲策略净值增长显著,表现优于CP因子,反映出剔除日内收益率影响后因子前瞻性增强。

图10-11:新CPnew和RCPnew因子10分组多空对冲净值(第11页)


  • 曲线总趋势更为平滑且增长更为显著,反映采用标准化方法合成后因子信息含量提升。

- 其净值表现略优于旧因子版本,说明技术改进的有效性。

图12-14:纯净RCP因子与纯净RCPnew因子10分组多空对冲净值(第12-13页)


  • 两图均呈现多头分组价值分明,纯净RCPnew因子表现较纯净RCP因子更优。

- 图14将两者净值走势叠加对比,RCP
new因子净值明显领先,更具实用意义。

图15:RCPdeRet20因子净值走势(第14页)


  • 此因子剔除传统反转因子影响后,仍保持较高的趋势性收益。

- 月度胜率超80%,信息比率超过3,最大回撤维持较低水平,强化因子独立性与稳定度。

图16-19:四大指数成分股下不同组合净值走势(第18页)


  • 各市场表现中,基于RCP因子的组合稳健且持续领先。

- 阴影部分代表RCP超额收益,明显异于传统因子表现。
  • 反映出RCP因子强大的市场适应性和投资组合构建参考价值。


表格1-14解析


  • 表1-3展示了过度自信及重拾自信因子在各版本下的详细绩效指标(年化收益、波动率、IR、月度胜率、最大回撤)。

- 表4显示因子与传统Barra风格因子的低相关性,说明信号独立性强。
  • 表5详细揭示因子纯净化对提升信息比率和降低波动率的积极影响。

- 表6-7分年度绩效具体展示了因子阶段性表现差异和平稳性。
  • 表8回测不同回看窗口,确认模型稳健性。

- 表9多空收益分解揭示空头策略对整体收益贡献更大。
  • 表10通过多类市场样本验证因子普适性。

- 表11-14精细对比不同市场下多因子组合表现,再次确认RCP因子组合综合优势。

---

4. 估值分析



本报告核心为行为金融学中基于DHS模型的选股因子构建,无直接企业估值和传统估值模型(如DCF、P/E倍数等)内容。报告重点在因子开发及量化回测,侧重于因子收益和风险特征分析。

---

5. 风险因素评估(第0、20页)



风险提示集中于以下三个方面:
  • 未来市场变化风险:历史回测基于过去数据,未来市场及行为特征若剧烈变化,则因子表现可能失准。

- 单因子模型风险:因子本身作为单一信号可能遭遇阶段性波动及失效,实际投资需结合资金管理和多因子策略。
  • 数据测算误差风险:数据来源及计算过程可能会包含噪声和误差,不应全信模型结果。

- 报告未详细展开缓解方案,但隐含需要结合组合多样化和风险管理使用[page::0,20].

---

6. 批判性视角与细微差别


  • 报告核心假设为DHS模型及过度自信行为对价格动态影响准确,然而实际市场多因子交织,非理性效应与市场结构可能发生干扰,模型假设边界应予关注。

- 过度自信的具体量化方法依赖分钟序列收益率的极端划分(均值±标准差),对极端行情或高波动股票可能存在噪声。
  • RCP因子通过剔除收益率正交实现“纯净化”,虽然统计显著,但可能丢弃部分实际有效信息,需要权衡纯净度和信息遗失的平衡。

- 因子的年化波动率和最大回撤对比传统反转因子仍较高,表明策略风险中等偏上,适合有一定风险承受能力的投资者。
  • 多空收益分解显示空头收益贡献更大,表明因子短期捕捉负面异常能力较强,投资者应关注空头风险管理。

- 报告多次强调因子纯净化效果显著,但在实际运用中,因子与行业及风格的相关性依然存在,需要针对配仓策略调整。

---

7. 结论性综合



本报告首次基于经典DHS行为金融模型,创新地提出以日内分钟序列收益率的极端波动时间差来刻画投资者的“过度自信”情绪,继而构建了“过度自信因子”(CP)。进一步考虑投资者过度悲观所致的股价过度修正现象,将剔除当日收益影响的残差定义为“重拾自信因子”(RCP),捕捉先涨后回调且未来仍可补涨的优质股票。

回测覆盖2014年至2023年底,RCP因子月度IC均值0.04,年化信息比率接近2.7,多空对冲年化收益超20%,波动率控制在7%左右,月度胜率超过80%,最大回撤低于5%,表现优于第一代CP因子及市场传统因子。RCP因子在沪深300、中证500、中证1000、国证2000等多层级市场均表现卓越,适用范围广,且在剔除行业风格影响后的纯净因子版本表现依然强劲,信息比率提升显著,强化了因子的独立alpha价值。

报告通过严格的因子构造流程、标准化合成方法及对传统反转因子的正交分析,有效避免了信息重叠,提升因子纯净度和稳定性。因子收益稳定且空间明显,高指标的多空对冲策略验证了选股有效性,且多空收益分解强调空头策略对整体收益贡献较大,为风险管理提供依据。

基于该因子搭建的指数增强投资组合在多指数样本表现持续领先,既保持了超额收益,又控制了风险,在实务中具有较强的可操作性和推广价值。

最后,报告客观指出该模型依赖于历史行情和行为假设,未来市场不确定性及数据误差存在风险,建议投资者结合多因子和风险控制机制理性应用。

---

图表精选



图1 DHS行为模型示意图





图2 CPIntraday构造示例





图3 CPMean因子10分组多空对冲净值走势





图5 CP因子10分组多空对冲净值走势





图9 RCP因子10分组多空对冲净值走势





图11 RCPnew因子10分组多空对冲净值走势





图13 纯净新RCP因子10分组多空对冲净值走势





图15 RCP_deRet20因子10分组多空对冲净值走势





图16 基于沪深300成份股不同组合净值走势





---

通过以上详尽剖析,可见东吴证券针对“过度自信”行为金融偏差研发的重拾自信选股因子,不仅理论基础扎实,因子构造精细,实证成果突出,其对单因子选股效率及指数增强策略亦具有非凡的参考与应用价值。

[page::0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]

报告