`

量化选股系列——机构情绪与个人情绪

创建于 更新于

摘要

本报告从行为金融学视角出发,利用“总热度”和“关注粘性”两类投资者注意力因子构建综合热度因子Attn,发现高关注度股票短期被高估,未来收益显著下跌,低关注度股票未来收益较好。通过因子条件双重排序及多次中性化处理,验证了Attn因子的稳定负相关性及其经济意义。融合分析师情绪因子构建多因子选股组合,2017年至2023年回测年化收益达24.6%,显著优于中证1000基准。报告揭示个人与机构投资者情绪错配为市场提供投资机会 [page::0][page::5][page::8][page::15][page::27]

速读内容


投资者关注度及注意力因子构建 [page::6]


  • 采用“总热度”和“关注粘性”指标衡量投资者对个股关注度。

- 总热度指标代表一定时间内对个股的点击、浏览次数,关注粘性代表用户重复关注比率,覆盖率均高于90%。

总热度与关注粘性单因子表现 [page::8][page::11]


  • 总热度因子IC均值-0.11,绝大多数时间IC < 0,表明高关注度个股未来收益较低,体现市场短期过度反应。

  • 关注粘性IC均值-0.039,波动较大但整体负相关。

- 两因子分组收益表现相似,Top组表现差,Bottom组年化收益11%-12%。

综合热度因子 Attn 构建与表现 [page::14][page::15][page::16]


  • 等权合成总热度与关注粘性指标得综合因子Attn,IC均值约-0.09,稳定性更高。

- Attn因子Top组短期负收益明显,Bottom组年化收益约15%。
  • 多空组合年化收益可达37%,夏普比率2.4,表现优于单因子。


Attn 因子条件双重排序与中性化检验 [page::17][page::18][page::19][page::20]


  • 控制市值、过去一个月收益、换手率后,Attn因子依旧显著区分组内收益,单调性良好。


  • 中性化后IC稍有下降(从-0.09降至-0.08),但分组收益区分度仍显著,多空组合年化收益达27%,夏普2.16。


宽基指数内部表现 [page::20][page::21][page::22]


  • 在中证1000、中证500和沪深300中检验,表现在中证1000最佳,表现稳定;

- 沪深300表现波动较大,21年后多头组合回撤明显。

策略组合优化:结合分析师情绪因子 [page::22][page::23][page::24]


  • 将Attn因子(个人投资者情绪)与分析师文本情绪因子(机构情绪)联合应用,形成30组细分组合;

- 低热度+高分析师情绪组收益最高,月均收益具备良好单调性;
  • 测试期间(2017-2023)组合年化收益24.6%,基准中证1000 -4.3%,超额28.4%,最大回撤33.1%。


策略行业与市值分布及风险收益情况 [page::25][page::26]


  • 主要集中于医药生物、化工、机械设备等行业,小市值个股占比较高;

  • 策略稳健跑赢基准,2017年至2022年多数年份超额收益15%以上。

深度阅读

【专题报告】量化选股系列——机构情绪与个人情绪


——华创证券研究所2023年度报告详尽分析

---

一、元数据与概览(引言与报告概览)


  • 报告标题:《量化选股系列——机构情绪与个人情绪》

- 发布机构:华创证券研究所
  • 报告作者:秦玄晋、王小川

- 发布日期:2023年(具体日期未明)
  • 报告主题:量化选股中的投资者情绪因子研究,聚焦个人投资者情绪(注意力/热度)与机构投资者情绪(分析师文本情感因子)的结合,以挖掘策略超额收益


核心论点与评级

本报告立足于行为金融学视角,提出并验证“投资者有限注意力”对股价的影响。具体来说,当股票吸引过多关注(高度“热度”)时,价格短期往往过度反应,导致未来回报率下降;反之,某些被忽视(低热度)的股票伴随缓慢被市场发现,可能获得回报提升。通过“总热度”和“关注粘性”因子构建综合“Attn”因子,结合代表机构情绪的分析师文本情感因子,构建双因子选股策略表现显著,年化收益达24.6%,明显跑赢基准。

总体上,报告认可基于投资者情绪的量化因子作为突破传统基本面因子的有效补充,展示了显著的负向预测能力和策略超额收益潜力[page::0,1,27]。

---

二、逐节深度解读(逐章剖析)



1. 因子简介和行为金融学背景



本章节介绍行为金融学对市场非理性现象的解释,强调投资者有限注意力导致的信息不完全反映现象及市场定价失真。以ChatGPT的市场反应为案例,展示新信息被市场逐步接受的过程,强化有限注意力的重要性。报告首次引入同花顺的“总热度”“关注粘性”作为量化“注意力”指标,解释其定义及数据来源,同时说明热度与股价涨跌趋势有一定的正相关性,暗示投资者注意力的市场定价作用[page::5-6]。

2. 单因子测试分析



(1)总热度因子


  • 统计特征:总热度因子平均值2.53,标准差4.41,存在显著右偏,部分明星股吸引过度关注。因子覆盖超过90%以上市场股票,尤其沪深300覆盖近乎100%[page::7-8]。

- IC表现:因子IC多为负值,长期平均-0.11,显著且稳定。IC半衰期3.1个月,显示信号衰减平缓[page::8-9]。
  • 分组收益:将股票按因子值分10组,热度最高的Top组表现最差,年化收益为-16%,最大回撤69%;而最低组收益约12%[page::9-10]。多空组合收益年化31%,夏普比2.07,风险调整后表现突出[page::10]。

- 逻辑推断:热点股票被短期资金推高,价格过高导致未来回报降低;低热度股票回报较好,但前几组收益无明显区分,说明低热度不必然等于低估[page::10]。

(2)关注粘性因子


  • 与总热度定义相似,具体衡量投资者持续关注比例。

- IC表现同样为负,平均-0.039,较总热度因子稳定性稍差,但显著[page::11]。
  • 分组检测显示粘性最高组收益明显为负,低粘性组年化达11%,但组间单调性稍逊[page::11-12]。

- 多空组合年化25%,夏普2.17,表现稳健略低于总热度因子[page::12-13]。

3. 综合热度因子(Attn因子)构建与检验



将“总热度”和“关注粘性”因子等权合成Attn因子,增强预测能力:
  • 相关性分析:两个因子相关性仅0.26,分别受到大市值、过去1个月收益、换手率等因素的影响——尤其换手率与总热度相关高达0.48[page::13-14]。

- Attn因子IC表现:比两个单因子更稳定,平均IC -0.09,年化ICIR -3.26,半衰期3.2,与纯单因子相比有明显提升[page::15]。
  • 因子分组表现:Top组年化收益约-18%,Bottom组年化15%,单调性好,体现明确的反向关系。多空组合年化收益达到37%,夏普比2.4,明显优于单因子[page::15-17]。

- 条件双重排序:仍在控制市值、过去月收益、换手率的情况下,Attn在各中间分组维持收益单调递减。发现大市值组中Attn区分效果较弱,可能因机构关注度高,定价更有效[page::17-18]。
  • 中性化处理后:去除上述相关风险因素后因子表现略降,平均IC降至-0.08,年化ICIR-2.96,依然显著,收益分组单调性保持[page::18-20]。

- 宽基表现回测:在沪深300、中证500、中证1000都进行测试,中证1000表现最佳,IC均值-0.07,回撤情况也较优,且多空组合夏普1.74,表现稳健。沪深300受限于少数大蓝筹波动,效果最弱[page::20-22]。

4. 应用:结合机构情绪因子(分析师文本情绪因子)


  • 投资逻辑:机构与个人投资者情绪错配理论引入,体现两类不同投资者对信息解读及反应差异。分析师文本情感因子代表机构投资者情绪,Attn因子代表个人情绪,两者相关性极低(时序平均-0.01),优势互补[page::22-23]。

- 双重排序分析:同时按分析师情绪分组(10组)与Attn分组(3组),构成30个组合,显示了明显的单调收益结构,特别是在分析师情绪高、个人热度低的股票组收益最优,说明选股效果显著[page::23]。
  • 策略回测

- 回测区间2017-01-01至2023-08-31。
- 组合月度调仓,等权分配,单只股票最大持仓5%。
- 策略年化收益率24.6%,基准中证1000年化-4.3%,阿尔法28.4%。
- 最大回撤33.1%,发生在2021年末至2022年年初。
- 盈利天数占55.07%,盈利日均涨幅1.08%,亏损日均跌幅1.11%[page::24]。
  • 策略行业与风格分析

- 行业持仓以医药生物、化工、机械设备等主导,公用事业、电子、食品饮料等次之[page::25]。
- 持仓股票偏中小市值,2023年市值中位数下降至60亿-80亿区间,体现明显风格偏向[page::25]。
  • 分年风险收益表现

- 策略在2017年至2022年多数年份实现15%以上超额收益。
- 2022年超额收益为负但幅度轻微,且远超同类主动基金中位数表现。
- 2023年初至8月,组合绝对收益4%,相对超额约9%[page::26]。
  • 最新持仓30只股票名单详列,不同市值与行业分布合理,如传媒、家电、医药、计算机领域占比较多[page::26]。


5. 总结与风险提示


  • 市场非理性是常态,投资者有限注意力导致对信息的非理性短期反应,热度高股票短期内获额外关注从而过度定价,未来收益降低。相反被忽视的个股可能被低估,有反转潜力。

- 两个个人投资者情绪因子(总热度与关注粘性)表现稳健且负相关股价未来收益,合成Attn因子后效果更佳,特别在中证1000范围表现突出。
  • 结合机构投资者情绪因子,构造低热度+高机构乐观选股组合表现优异,2017起年化超24%。

- 风险提示:策略基于历史回测,未来有效性不保证,存在市场环境变化导致策略失效的可能[page::27]。

---

三、图表深度解读(重点图表解读)


  • 图1(主题行情与市场注意力):展示ChatGPT发布后,其指数和百度搜索指数的时间演变,表明市场对新科技的注意是滞后的,体现有限理性和注意力集中效应[page::5]。
  • 图3及图4(关注度因子描述统计与覆盖度):关注度两因子呈右偏,极少数股票吸引大量关注;覆盖度长期稳定在90%以上,保证因子代表性[page::7]。
  • 图6-7(总热度因子IC及衰减):IC多数为负且稳定,半衰期3.1提示信号持续性较好[page::8]。
  • 图9-11(总热度分组收益和统计):Top组年化-16%,Bottom组12%,确认热度越高回报越低的负相关现象,夏普和信息比率均表明优质信号[page::9-10]。
  • 图12-13(多空组合净值与绩效):多空组合表现极佳,年化31%,夏普2.07,表现远胜单边做多[page::10]。
  • 图14-16(关注粘性IC表现与统计):趋势同总热度,IC波动更大,稳定性稍差[page::11]。
  • 图17-21(关注粘性因子分组统计及多空表现):与总热度类似,Top组负收益明显,整体年化25%收益,夏普2.17[page::11-13]。
  • 图22(因子相关矩阵):展示总热度与关注粘性低相关,且二者与市值、过去收益和换手率相关性中等,强调后续中性化重要性[page::14]。
  • 图23-30(Attn因子IC表现与分组收益、多空组合):综合后IC更加稳定,半衰期3.2,Top组负18%年化,Bottom组15%,多空组合明显示范效应,年化37%,夏普比达2.4[page::15-17]。
  • 图31-33(条件双重排序热度因子在市值、收益、换手率分组中的表现):热度因子提供显著的组内区分能力,尤其在中小市值组表现更佳[page::17-18]。
  • 图34-41(中性化后Attn因子表现):去除相关风险因子影响,IC与表现有所弱化但依旧稳定,多空组合年化27%,夏普2.16,表现依然健壮[page::18-20]。
  • 图42-48(宽基回测IC及多空组合净值):中证1000表现最优,回撤控制较好,夏普指标突出,体现策略对中小盘更具有效性[page::20-22]。
  • 图49-50(分析师情绪+Attn双重排序收益及样本量):策略跨时序表现稳定,样本规模合适,为后续实盘应用奠定基础[page::23]。
  • 图51-54(选股策略净值与风险收益):策略超额大幅跑赢中证1000基准,回撤控制合理,年份超额收益持续性较佳[page::24-26]。
  • 图55(最新Top30持仓名单)具有行业和规模多样性,覆盖医疗、消费、科技等多个板块,反映策略的多样性[page::26]。


---

四、估值分析



报告未包含传统的估值模型(如DCF、市盈率等)分析,核心在于构建和验证基于行为金融学理论的“注意力情绪”量化因子以及结合分析师情绪构建选股组合的预测能力与收益表现。因此估值方法聚焦于信息系数(IC)分组收益测试。IC用于衡量因子预测未来收益的统计质量,分组收益测试与多空组合收益用于展示因子经济意义和策略表现。

信息系数(IC)是因子预测力的核心指标,IC的负值且统计显著意味着对应因子存在反向预测未来收益的能力,支持构建反转策略。

分组收益和多空组合分析 通过排除极端高热度组做空,低热度组做多,验证收益区分度和单调性,体现因子实际应用效果。

材料中也体现条件双重排序法,用于剔除市值、过去收益和换手率等常见因子影响,进一步检测热度因子的独立贡献。

综上,估值层面聚焦因子回归与收益统计类方法,与传统公司估值模型不同[page::8-22]。

---

五、风险因素评估



报告重点风险提示为:
  • 策略基于历史数据回测,过去表现不代表未来收益,尤其市场环境变化可能带来策略失效风险。

- 投资者情绪因子本质上依赖市场行为特征,若市场结构、投资者行为发生重大转变,因子预测能力或降低。
  • 大市值股票回报率和因子表现相对弱化,注意力因子对机构主导的大盘股定价效率较有限。

- 策略最大回撤达33.1%,反映在市场极端波动时可能遭受重大亏损。
  • 没有明确缓解措施,风险控制依赖于组合多样化与仓位限制。


综上风险集中体现为“模型风险”和“市场风险”,需在实际投资中结合风控策略谨慎应用[page::0,27]。

---

六、批判性视角与细微差别


  • 负向IC解释需谨慎:因子表现为负向IC显著,表明热门股票未来收益较低,这与市场的“过度反应”逻辑一致,但负向关联也提醒投资时要逆向操作,注重组合构建和调仓效率,否则可能面临较大回撤风险。

- 数据来源和指标限制:注意力因子来源于同花顺数据,关注程度受限于平台用户及行为,存在代表性限制。近年来社交媒体、机构大资金流动等多样化信息未详细纳入。
  • 大盘股表现弱:因子对大市值股票识别能力有限,需要结合基本面和机构情绪进行综合判断;此外,报告描述了2021年中后期沪深300表现不佳,显示量化因子在不同市场阶段有效性波动。

- 中性化后效果下降:去除常见风险因子相关影响后,因子稳定性和预测力下降,说明关注度因子与市值、换手率强相关,独立信息量有限,实际应用需关注多因子配比问题。
  • 部分统计指标波动较大:IC及收益分布有明显波动,表明策略收益可能存在阶段性集聚风险。

- 策略回撤显著:月调仓及组合仓位严格限制但最大回撤仍达33.1%,投资者需考虑风险承受能力。
  • 推断基础及应用局限:报告基于历史A股数据与特定市场结构构建,国际市场以及未来市场结构变迁适用性未明。

- 报告内部一致性良好,各章节论述逻辑连贯,但对因子构建细节(如具体数据处理、回归模型设定)细节披露不足。

综上,报告提供强有力的投资者行为因子证据,但投资者需注意模型风险和市场阶段差异,结合多维度信息进行策略优化[page::0-27]。

---

七、结论性综合



本报告立足行为金融学框架,从投资者关注度与注意力出发,创设“总热度”“关注粘性”两大因子,通过全面统计学及经济学检验,确认高热度股票短期回报显著较低,体现市场对热门个股的过度反应及行为性非理性。

“Attn”综合因子结合两者优势,提升预测稳定性和单调性,且通过市值、近期收益、换手率的条件双重排序和中性化分析,确保因子较强独立性。基于此因子构建的多空组合和选股策略在各主要宽基指数(沪深300、中证500、中证1000)均表现优异,其中以中证1000的表现最为稳健和突出,年化超额收益显著。

最具突破意义在于将个人投资者行为因子与代表机构投资者情绪的分析师文本情感因子结合,剖析情绪错配现象,选出“低热度+高分析师情绪”股票组合,实现2017年以来24.6%的年化收益率,明显跑赢市场。

全报告系统展开了因子构建、检验、优化及实际回测的闭环验证,凸显投资者行为维度的实用价值与未来潜力,为量化选股增加了新的有效工具。风险方面,需警惕历史回测无未来保证、大盘股识别不足及因子与市场结构依赖性。

综上,“投资者注意力热度因子+机构情绪”双因子模型为提升量化选股效率提供了强有力支撑,值得进一步研究与实践应用[page::0-27]。

---

详细图表样式示例



(图1:ChatGPT发布后市场指数及百度搜索指数演变)

(图6:总热度因子IC时间序列,平均IC负值稳定)

(图26: Attn因子分组年化收益,表现清晰单调)

(图49:分析师情绪+Attn双重排序各组年化收益)

---

本分析详细解释了报告每处核心内容及主要图表,着眼于理论基础、数据分析、模型构建、回测结果和应用展望,力求全面、深刻且客观,符合资深金融分析师要求。所有结论均严格引用原文具体页码,确保来源明晰。[page::0,1,2,3,5-27]

报告