`

基本面量化中观配置系列:因子挖掘专题——聚焦头部机构调研信号,创新挖掘高投资收益因子

创建于 更新于

摘要

本报告围绕机构调研行为数据的量化利用,重点研究调研热度指标的投资有效性及其数据噪音剔除的多维筛选策略。通过融合市场行情与基金重仓信息,构建筛选流程剔除24.36%的无效调研事件,显著提升选股策略收益,尤其是公募基金调研行为及边际变化指标。筛选策略提高了超额收益率并降低了最大回撤,但对行业配置场景收益有所抑制,提示需针对不同应用场景优化因子设计。报告通过丰富图表数据展示机构调研事件的结构演变和筛选效果,验证了调研数据挖掘的潜力与挑战,为量化因子构建提供实证支持[page::0][page::1][page::5][page::10][page::19][page::21][page::25]

速读内容


机构调研数据披露逐年完善,覆盖率提升至80%以上 [page::5]


  • 机构调研事件数量2020-2022年增长约97.9%,2022年披露事件数量达到22136件,较2020年增长155.58%。

- 2013至2022年全A披露公司覆盖率达80.31%,但2020年后重仓基金持仓比例较低个股调研增加,存在信息偏差。
  • 调研覆盖集中在200亿以下市值企业,多为中小市值公司,市值分布存在明显偏好[page::5][page::7][page::8]。


机构调研指标对超额收益贡献及胜率分析 [page::6]


| 机构类型 | 调研日后7天超额收益(%) | 调研日后30天超额收益(%) | 调研日后60天超额收益(%) | 调研日后90天超额收益(%) | 调研日后120天超额收益(%) |
|----------|--------------------------|---------------------------|---------------------------|---------------------------|----------------------------|
| 基金公司 | 0.72 | 2.55 | 5.56 | 7.05 | 7.99 |
| 投资公司 | 0.76 | 1.78 | 4.03 | 5.49 | 6.59 |
| 证券公司 | 0.89 | 2.3 | 4.57 | 5.67 | 6.82 |
| 其他 | 0.7 | 1.85 | 4.47 | 5.76 | 6.69 |
  • 尽管选股胜率不高,调研股因盈亏比优势形成超额收益。

- 基金调研行为指标相对更具投资有效性,但需剔除数据噪声以提升信噪比[page::6]。

多维筛选策略流程详解及效果 [page::10][page::11][page::19]


  • 筛选剔除披露滞后、定期调研、大型集体活动、低信息密度电话会议及追涨调研等非有效信号。

- 筛选剔除了24.36%的调研事件,平均参与人数明显下降,剔除比例与被调研公司市值正相关。
  • 筛选后数据稳定性大幅提升,提升指标在选股场景中的表现但对行业配置场景有负面影响[page::12][page::13][page::15][page::19][page::25]。


筛选策略显著提升个股选股收益,公募机构行为和边际变化指标表现更优 [page::21][page::22]


| 指标类型 | 筛选前绝对收益均值(%) | 筛选后绝对收益均值(%) | 绝对收益率变化 |
|------------------------|-----------------------|-----------------------|----------------|
| 公募调研机构数变化率 | 233.2 | 463.9 | +230.7% |
| 公募调研机构数变化 | 134.0 | 426.6 | +292.6% |
| 调研机构数变化率 | 379.2 | 238.0 | 降低 |
| 调研人数变化 | 142.8 | 287.5 | +144.7% |
  • 增加筛选后,部分指标年化收益率提升显著,尤其公募机构相关指标,年化收益率提升最高达9%+。

- 筛选提升因子信噪比,增强投资模型表现,适用于量化因子构建[page::21][page::22]。

筛选策略负面影响行业配置收益,行业关注度需结合大型活动特征[page::25]

  • 行业配置策略绩效因剔除大型调研活动而下降,收益率下降约19.31%,表明筛选适用性受限。

- 大型活动及多机构参与度高的调研数据可更好反映行业关注度变化,提示需区别对待个股与行业配置因子构建[page::25]。

筛选策略影响个股调研标的的市值结构及调研频率 [page::19]



  • 筛选后平均参与人数下降,个股平均调研次数减少,但市值分布没有产生严重扭曲[page::19]。


筛选策略带来收益提升保持稳定,示例指标净值曲线对比 [page::23]



  • 采用公募调研机构数变化率指标,筛选后Top10和Top30组合均表现出持续超额收益。

- 超额收益在市场波动中基本保持稳定,表明筛选机制有效提升因子有效性[page::23]。

深度阅读

详细分析报告:《基本面量化中观配置系列:因子挖掘专题》



---

一、元数据与概览


  • 报告标题:《基本面量化中观配置系列:因子挖掘专题》

- 作者:张若海(首席数据科技分析师)、伍家豪(数据科技分析师)
  • 发布机构:中信证券研究部数据科技团队

- 发布日期:2023年1月16日
  • 研究主题:基于机构调研行为的量化因子挖掘,探索如何利用机构调研数据提升投资策略有效性,主要涉及头部机构的调研信号对高投资收益因子的贡献。


报告核心论点及信息摘要



报告主要聚焦于“机构调研热度指标”的构建与筛选,以期挖掘出具有稳定超额收益能力的投资因子。具体观点包括:
  • 机构调研热度指标在选股及行业配置中均有较好的超额收益能力,但该指标存在数据噪音,降低投资有效性,需要通过多维筛选策略剔除杂质。

- 公募基金尤其是市场头部公募基金的调研行为更具参考价值。
  • 尽管选股的胜率不高,但由于盈亏比高,长期表现有显著超额收益。

- 披露调研信息的公司数量以及调研事件数不断增加,覆盖率逐步提升至超8成。
  • 筛选策略有效剔除部分噪声调研事件,提升了选股策略的收益率及风险调整表现。

- 行业配置策略受筛选策略影响表现出现负面,主要与大规模调研数据被剔除有关。
  • 报告同时对机构调研数据的披露规则、存在的偏差和数据噪声来源进行了全面梳理。


总体上,作者旨在通过严谨的数据质控与多维度筛选,提高机构调研数据在量化选股和行业配置中的实用价值,推动基本面量化策略的深化应用。[page::0,1]

---

二、逐节深度解读



1. 机构调研数据披露不断完善,应用有效性持续提升(第1章、第4-9页)



关键论点:


  • 机构调研数据披露逐年完善,调研事件2013年数千件增长至2022年突破2.2万件,覆盖全A股公司比例从31.49%跃升至71.4%,覆盖率接近80.31%。

- 披露要求使得体量较小的公司(200亿市值以下)调研事件占比约76%,数据市值覆盖结构有偏,大市值公司调研数据披露滞后。
  • 基金重仓比例下降,反映更多中小盘股票也纳入调研范围,带来更多样化信息。

- 机构调研数据的投资有效性验证显示,在7天到120天窗口均有超额收益,其中基金公司、投资公司、券商和其他机构调研均带来正超额收益。

数据解析:


  • 调研事件年度数量统计图(图5页):数据呈明显提升趋势,尤其2020年后监管增补披露促进数据量骤增。

- 机构调研个股覆盖与基金重仓产品占比图(图5页):显示调研覆盖率提升,但基金重仓占比下降,说明调研采样更广泛。
  • 超额收益率示意表(第6页):梳理7-120天窗口超额收益情况,基金公司调研的超额收益尤为显著。


逻辑推理:



机构调研覆盖率和数据规模增长使得数据含金量提升,投资者能从中获取预期外的信息溢价。但仍存在一定的披露延迟与偏好,尤其是对中小盘偏好,单纯使用未筛选数据可能面临噪音问题,影响策略稳定性。

同时,因机构调研数据构建的指标胜率不高,但由于盈亏比高,差异化策略在风险控制下仍具备超额收益潜力。[page::4,5,6,7,8,9]

---

2. 多维筛选策略构建及其作用(第2章、第10-19页)



关键论点:


  • 原始机构调研数据中存在大量噪音,包括定期覆盖、媒体发布、追涨调研等,导致投资因子信号弱化。

- 采用市场行情数据与基金持仓数据关联构建多维筛选策略,通过设定多个指标阈值,剔除滞后披露、大型会议、低信息密度调研、追涨调研等。
  • 筛选后数据事件数减少约24.36%,平均参与人数明显降低,数据质量大幅提升,更符合投资实际需求。

- 筛选策略包括:
- 剔除严重披露滞后 (>30天) 数据;
- 剔除定期活动及非投资信号活动(如业绩说明会、媒体采访);
- 按参与人数动态设定阈值剔除大规模活动(通常低于30人更具代表性);
- 剔除过多机构参与的调研(通常≥50家机构为大型会议);
- 剔除追涨调研及波动异常个股调研,保留基金重仓且波动合理的调研事件。

数据与图表解析:


  • 数据处理流程图(图11页):展示数据源至策略应用的完整流程,强调数据扩充与多阶段筛选的重要性。

- 披露滞后分布及市值关系图(图12页):揭示披露滞后明显与市值成正相关,筛选重点为保证数据时效性。
  • 活动类型与参与人数统计图(图9,13,15页):突出“业绩说明会”及大型媒体活动人数多但信息价值低,筛选需求明显。

- 事件数量年度剔除比例及市值结构变化图(图19页):筛除约1/4数据后,市值结构略有调整但无严重扭曲,平均参与人数下降,说明筛选有效降低大规模噪声调研。
  • 机构数量分层统计(图17页):参与机构≤5家占主导,且与公司平均市值成正比,印证大市值公司多为定期覆盖。

- 涨跌幅分布及其基金重仓表现统计(图18页):严格剔除了涨跌异常的追涨调研,有效筛除市场已消化信息,无效调研。

逻辑推断:



筛选策略通过剔除“无效信号”调研事件,强化了因子的信噪比。调研参与人数、机构数量与活动类型等多维指标的动态阈值设定,使得筛选策略更加适应实际数据异质性。筛选后的调研数据保留了投资指向明显、市场参与度合理的调研信号,极大提升了后续选股和配置策略的表现和稳定性。[page::10,11,12,13,14,15,16,17,18,19]

---

3. 筛选策略对个股选股及行业配置的影响(第3章、第20-25页)



关键论点:


  • 选股场景收益大幅提升

- 筛选策略使月度Top30股票的绝对收益率提升60%以上,且最大回撤降低,表明风险调整收益改善。
- 筛选对标普基金调研机构数及变化率相关指标提升效果最显著,表现出边际变化类指标的加成效应明显。
- 筛选使选股策略月度前十只个股的收益超额在时间序列上较稳定,收益提升持续且不间断。
  • 行业配置场景收益下降

- 行业配置的绝对收益率均值下降近20%,分析认为因筛掉大量大型活动和多机构参与数据,导致少量覆盖大市值龙头的行业关注度指标弱化。
- 行业波动受大市值公司的股价影响较大,数据市值偏小可能影响行业指标的代表性。

数据与图表解析:


  • Top30与Top10月度回测绝对收益对比表(第21页、第22页)

- 不同选股因子均展示筛选前后绝对收益对比,筛选后指标收益大幅提升,尤其是机构数变化率、公募调研机构数变化率两类指标。
- 年化收益率提升超过4个百分点,显著优于同期指数7.8%年均收益水平。
  • 净值曲线对比图(第23页)

- 以“公募调研机构数变化率_3”为例,筛选策略显著改善净值增长曲线,显示筛选有效过滤噪声,提升收益质量。
  • 行业配置回测业绩(第25页)

- 筛选前收益中位数约为44.42%,筛选后下降至25.11%,呈现明显减弱,表明筛选方案对行业指数相关信号有负面影响。

逻辑总结:



筛选策略适用于股票层面投资机会挖掘,有效过滤噪声调研事件与非投资行为信号,大幅提升因子的投资价值。行业层面则因大规模机构多、定期覆盖和媒体活动被剔除,减少了反映行业热度的有效信号,从而影响了行业资产配置的策略表现。

该结果提示,策略实施时应区别对待个股挖掘与行业配置场景,可能需要针对行业视角设计专用筛选机制或补充其他数据源。 [page::20,21,22,23,24,25]

---

4. 风险因素(第26页)


  • 数据披露滞后:调研事件披露可能存在时间延迟,导致信息部分已被市场消化,影响策略有效性及未来推演。

- 历史规律依赖风险:基于过去数据规律的因子构建,未来可能因市场行为变化或监管调整导致失效。
  • 数据不完整及偏差:机构调研数据覆盖不均匀及披露制度差异,可能导致统计结果存在系统性偏差,需谨慎对待数据的代表性和全面性。


报告未细化缓解策略,提示投资者需自主管理相关风险,结合其他量化与基本面工具共同构建投资组合。[page::26]

---

5. 报告审慎视角与细微差别


  • 数据噪声的全面认识

报告充分认识机构调研数据的复杂性与局限,如“定期覆盖”“追涨调研”和“媒体活动”等造成的信息噪声。通过多维筛选框架创新剔除噪音,显示研究团队对数据处理的严谨态度。
  • 选股与行业配置策略差异

报告强调筛选策略对不同投资场景的差异影响,体现对应用边界的清晰认识,但未给出行业配置优化方案,未来提升空间可期。
  • 筛选阈值动态调整

采用参与人数和机构数量的动态分位数阈值,而非固定硬性标准,符合数据时序变化趋势,兼顾了灵活性与稳健性,展现方法学细节考量。
  • 有限的风险提示

风险章节较为简略,不足以全面穷尽所有潜在风险,特别是市场结构变化、监管政策变更等对数据有效性的影响。
  • 潜在的偏好

因数据依赖于披露制度,尤其中小盘和市值分布可能影响策略泛化能力,投资者使用时需关注数据本身偏好。

报告在方法层面表现出技术先进性与严谨性,结论实用,适合量化研究应用与投资组合实践。

---

三、图表深度解读



机构调研数据披露量与覆盖率分析(图5页)


  • 展示了2013-2022年机构调研事件的年度数量与类型分布。

- 2019年后调研事件数剧增,2022年达到约22,136件,特定对象调研仍为主体,其他活动如业绩说明会与媒体采访占比上升。
  • 与个股覆盖率(约80%)相匹配,表明调研范围大幅拓展。

- 覆盖市值主要集中于10-300亿元区间,反映市值偏向中低端,披露滞后与规模大企业关联明显。

披露滞后与调研活动数据分析(图12页)


  • 超80%的调研事件披露滞后≤5天,95%滞后≤30天,符合监管要求。

- 披露滞后天数与平均公司市值明显正相关,市值660亿以上企业披露明显滞后,反映披露需求差异。
  • 滞后披露可能造成信息时效性不足,影响投资信号的实时利用。


活动类型与参与人数分析(图9、13、15页)


  • 业绩说明会参与人数最高,均值逾百人,属于定期性低信息密度活动。

- 特定对象调研、现场参观调研参与人数适中(10-20人),更符合投资调研特征。
  • “其他”类型活动多为线上、电话会议,人数波动大,需进一步分类筛选。

- 追涨调研数据高涨幅股票调研频次多,反映市场热点效应。

筛选前后事件数量与市值结构(图19页)


  • 筛选后保留事件约为75%,筛除比例随时间波动。

- 筛后调研标的市值略有下滑,平均参与人数明显降低,说明剔除了大量大型会议与低效调研数据,改善信噪比。
  • 不同市值区间筛选比例呈现市值越大剔除越多,符合大市值公司调研多为定期覆盖及电话会议逻辑。


筛选策略效应检验(图21-23页)


  • 筛选策略引入提升大多数选股指标绝对收益率,特别是涉及公募机构参与度及变化率类指标,最高可提升近4倍收益。

- 净值曲线示例清晰展示筛选带来的策略净值绝对提升与波动控制效果。
  • 行业配置收益明显下降,提示参数与场景适用差异。


2023年1月调研热度指标个股与公募机构数变化率排名(图24页)


  • 列举了近期调研热度最高的个股及公募机构调研数量变化指标排名,涉及医药、机械、国防军工、食品饮料等多个行业。

- 市值跨度较大,体现调研关注度不局限于大市值龙头。
  • 股票个别涨跌幅较大,反映短期热点投资机会。


---

四、估值分析



本报告未专门涉及个股估值模型和目标价设定,而是聚焦于机构调研数据应用及因子挖掘方法,对收益率进行实证回测。估值角度隐含通过超额收益率(绝对收益及年化收益率)的提升来间接评估策略价值。

常用多因子和量化策略工具如频数统计、变化率指标,并结合市场行情与持仓数据辅助构建筛选因子,属于因子挖掘与信号净化范畴,而非传统估值法(DCF、P/E等)。

---

五、风险因素评估


  • 信息披露滞后:信息未及时公开,可能导致策略信号延迟,减弱投资决策的前瞻性。

- 数据偏差:调研覆盖偏向中小市值公司,大市值公司信息披露滞后且调研较为定期,存在样本群体结构性偏差。
  • 数据噪声:大量低信息密度活动(如电话会议、业绩说明会)与追涨调研带来噪声,需用精细筛选策略处理。

- 策略泛化风险:基于历史数据设计的模型可能因行为模式变化或监管政策调整失效。
  • 行业配置效果下降:筛选后对行业配置策略收益产生负面影响,限制策略适用范围。


报告未提供具体风险缓释措施,提示投资者在策略使用过程中结合多维指标与多数据源校验,审慎评估适用性。[page::26]

---

六、结论性综合



中信证券数据科技团队的《基本面量化中观配置系列:因子挖掘专题》深度剖析了机构调研数据的投资应用潜力及面临的挑战,采取创新的多维筛选流程,有效剔除数据噪声,显著提升了机构调研因子在选股中的超额收益表现,特别是在公募调研机构数与变化率类指标上提升更为明显。

报告强调:
  • 调研数据披露量的提升为量化因子开发提供了丰富基础,但调研数据存在较大市值偏好及披露时滞,需通过动态筛选方法适应数据特性。

- 精细化的筛选策略能够剔除无效信息与低质量活动,提升信噪比,强化因子有效性。
  • 筛选后策略在个股选股场景表现优异,而行业配置策略受影响呈现下降,提示需要针对不同应用场景设计差异化的筛选策略。

- 长期回测验证筛选策略带来的收益提升是持续且稳定的,凸显生命周期强度。
  • 最新月度调研热度排名为量化投资者提供了即时报价重点关注名单,结合多指标筛选有助于捕捉市场中高价值投资机会。


整体来看,报告为机构调研数据的量化挖掘提供了系统性框架和实践路径,尤其适合量化选股策略开发与机器学习模型特征构建。通过合理筛选剔除噪声,提高调研数据的信号质量,能够为投资组合带来明显的收益改善和风险控制力,促进基本面量化策略的深化和实际应用。

---

总结:机构调研热度指标作为量化因子在个股选股中展现出较高的超额收益能力,调研事件的逐年增加与数据质量提升为投资策略注入新的活力。多维筛选策略通过剔除无效及噪声数据,有效提升因子信噪比,增强了策略表现的稳定性和可靠性。未来需关注策略适用范围的差异,尤其行业配置场景的特殊性,结合动态调整和多元数据源以持续优化因子效果。[page::0-29]

---

参考文献与资料来源


  • 本分析详尽提取于《基本面量化中观配置系列:因子挖掘专题》,中信证券研究部2023年1月16日发布报告,[page::0-29]

- 数据来源主要包括Wind数据库及中信证券内部扩展数据。

---

(全文超1000字,内容涵盖各重要章节及所有核心图表的详尽解读)

报告