`

招商定量·琢璞系列 | 投资者关注度与股票回报

创建于 更新于

摘要

本文基于Jian Chen等2022年文章,构建了通过偏最小二乘、标度主成分分析及主成分分析方法提取的投资者综合关注度指数,实证检验该指数对未来美国股票市场超额收益的显著负向预测能力,且预测持续时间达1-2年。研究表明该指数比单一关注度指标具有更强的预测能力,并且其经济价值显著,能为均值方差投资组合带来较高的确定性等价收益和夏普比率。此外,投资者综合关注度与个人投资者净买入流动密切相关,暂时推动价格上涨后价格会趋于反转,这一机制有助于解释负回报的可预测性[page::0][page::5][page::6][page::7][page::11][page::13][page::15][page::17]。

速读内容


投资者关注度指标与综合指数构建 [page::1][page::2][page::3]

  • 研究采用12个单一关注度代理变量,包括异常交易量、极端收益、过去回报、接近指数高点、分析师覆盖度、广告费用、共同基金流入流出、媒体报道、谷歌搜索量及EDGAR搜索量。

- 通过等权方法聚合公司层面关注度指标,避免大盘股主导。
  • 投资者综合关注度指数通过PCA、PLS和sPCA三种信息聚合方法估计,分别为APCA、APLS和AsPCA。


投资者综合关注度指数预测股市回报能力 [page::5][page::6][page::7][page::8]


  • 三种综合关注度指数均对未来1~24个月股票市场超额收益呈显著负预测作用,月度预测β值约为-0.64%(PLS指数)。

- 预测效果在控制经济基本面变量(如DP、DY、EP等)后仍显著,表明该指数提供了独立于经济周期的增量信息。
  • 投资者情绪指数与关注度相关性较低,关注度对回报的预测能力具有独特价值。

- 单个关注度指标预测能力有限,综合指数效果显著提升。

样本外预测与经济价值分析 [page::10][page::11][page::12][page::13]

  • 样本外检验显示,综合关注度指数的预测均显著优于基准模型,样本外R²最高可达6.6%(年化)。

- 基于综合关注度指数构建的均值方差资产配置策略,年化确定性等价收益(CER)最高达到近4%,即愿意为此支付高达400个基点的年化管理费。
  • 夏普比率显著优于市场买入持有策略,且在50基点交易成本下仍表现稳健。


投资者关注度的经济解释与市场机制 [page::14][page::15]

  • 关注度指数升高伴随个人投资者净买入流显著增加,推动价格短期上涨,随后买入放缓导致价格反转,形成负回报预测的市场机制。

- 此外,高关注度还可能体现投资者对公司基本面的深入信息获取,降低风险溢价,预测未来回报降低。

横截面特征异质性分析 [page::16][page::17]


  • 投资者综合关注度对高贝塔、高特质波动率股票的负预测能力更强,表明高波动性股票更吸引投资者关注,价格压力及其逆转机制更加明显。


量化因子相关介绍

  • 本文虽未直接开发量化因子或组合策略,但聚合关注度指标构建的综合指数本身可视为一种多因子信息融合因子,且该因子具有明显的预测能力和经济价值。


深度阅读

招商定量·琢璞系列 | 投资者关注度与股票回报 —— 研究报告详尽分析



---

1. 元数据与报告概览



报告标题:《招商定量·琢璞系列 | 投资者关注度与股票回报》
作者与发布机构: 招商定量任瞳团队,2022年7月29日发布
研究源头: 文章基于Jian Chen, Guohao Tang, Jiaquan Yao和Guofu Zhou于2022年发表于 Journal of Financial and Quantitative Analysis 的论文《Investor Attention and Stock Returns》。
研究主题: 研究投资者关注度这一“认知稀缺资源”如何影响总体股市的超额回报,特别是关注度的综合指标在预测股市收益方面的作用及其经济来源。
核心论点:
  • 通过偏最小二乘法(PLS)、标度主成分分析(sPCA)和传统主成分分析(PCA)三种信息聚合技术,从12个不同的关注度代理变量中提取投资者综合关注度指数,并实证验证该指数在预测未来股市超额收益方面的显著统计学和经济学意义。

- 综合关注度指数的预测能力不仅优于单一代理变量,还能持续1到2年。
  • 投资者关注度对市场回报的影响独立于传统经济基本面变量,且包含不同于投资者情绪的信息。

- 从资产配置视角看,基于投资者关注度预测构建的策略对均值方差投资者具有显著经济价值。
  • 投资者关注度与个体投资者行为密切相关,主要表现为关注度高时净买入流增加,导致价格暂时上涨,随后价格回落,解释了负向预测股市回报的原因。


风险提示: 该结论基于美国市场实证,对中国市场适用性尚存不确定性。

---

2. 逐章节精读与剖析



2.1 引言与研究动机


  • 关注度为有限资源,投资者通常关注市场和行业信息多于单一股票信息,理论上这暗示投资者关注度与市场整体回报存在联系。

- 以往文献集中研究关注度对股票横截面回报的影响,鲜有研究关注度对整体市场回报的预测能力。
  • 本文创新点在于首次构造和验证用于预测总体市场超额收益的综合关注度指数,突出投资者关注度在资产定价中的重要作用。

- 该指数为后续理论和实证研究提供了一个统一的市场级投资者关注度衡量标准。

---

2.2 数据与投资者关注度构建



2.2.1 单个关注度代理变量


  • 采用的12个单个代理变量涵盖异常交易量、极端收益、过去收益、接近指数高点、分析师覆盖、广告费用、媒体报道、共同基金流入流出、谷歌搜索量及EDGAR文件搜索。

- 每个代理变量均通过市场层面等权加总,避免大盘股权重垄断带来的代表性偏差。
  • 数据时间跨度最长覆盖1980年1月至2017年12月,部分代理(如基金流入流出、媒体报道、搜索数据)起始于2004年,数据来自CRSP、IBES、RavenPack、Google Trends等权威数据库。


2.2.2 代理变量统计特征与相关性


  • 表1(结构化)汇报了12个代理变量的中位数、分位数、偏度和一阶自相关,所有变量均标准化处理(均值0,方差1)。

- 变量间总体上呈正相关,相关系数从-0.37到0.80不等,表明这些代理捕获了投资者关注度的共同和各自特征。
  • 负相关较弱且可忽略,暗示整体代理变量表现出一定的聚合性。


2.2.3 综合关注度指数的构建方法


  • 真正的投资者关注度为不可观测变量,单一代理仅为其噪声掺杂的代理。

- 采用三种降维方法:
- 主成分分析(PCA): 提取12个代理中最大共同变异的第一主成分作为关注度指数。优点是简单流行,缺点是可能捕获无关的共同误差(Et),影响预测有效性。
- 偏最小二乘法(PLS): 以未来股票超额回报为协变量,通过两步回归筛选每个代理与未来收益的相关度,提取最佳预测相关的线性组合。该方法有效剔除不相关噪声,增强预测能力。
- 标度主成分分析(sPCA): 用未来回报对应的斜率对每个代理加权后再做PCA,结合监督降维和权重调整的优点。
  • 图1展示了三种方法得到的关注度指数时序,均呈现衰退期关注度下降的现象(“鸵鸟效应”),验证了投资者注意力随市场环境波动的心理特点。


---

2.3 实证结果与预测能力



2.3.1 样本内预测市场超额收益(表3)


  • 单变量回归结果显示,三种综合关注度指数均显著负向预测1到12个月区间的市场超额收益,且随着预测时间延长,系数绝对值减小但仍存在一定预测性。

- 以PLS为例,月度斜率约-0.64%(t值-2.66/-2.85),年化约7.68%,预测效应经济学意义显著。对应的解释能力($R^2$)从月度2.15%上升至12个月7.65%。
  • sPCA和PCA指标表现类似,PLS略优于PCA,证明信息聚合和噪声过滤的重要性。

- 与12个单一代理相比,只有少数(如接近历史高点和共同基金流入)在短期范围内略有预测能力,但远不及综合指标,说明单一指标噪声较大,难以准确度量关注度。

2.3.2 控制经济变量的多元回归(表5)


  • 控制了经典文献Goyal和Welch(2008)提出的8个经济变量后,关注度指数的预测斜率依旧显著,且经济意义未减,表明关注度对市场回报的预测作用独立于传统经济基本面。

- 投资者关注度与经济变量组合能显著提升整体预测$R^2$,最高超过13%,显示两者信息互补。

2.3.3 与投资者情绪指数的比较(表6)


  • 关注度指数与Baker和Wurgler(2006)投资者情绪指数相关度低(0.01~0.37),表明关注度传递了与情绪不同的信息。

- 联合回归控制情绪后,关注度指标仍保持对市场回报的显著预测能力,强调其独立性和重要性。
  • 共同使用关注度和情绪指数,市场回报预测能力进一步增强,投资者可基于两者构建更有效的资产配置策略。


---

2.4 样本外预测与经济价值



2.4.1 样本外预测能力检验(表7和表8)


  • 采用Campbell和Thompson (2008)的样本外$R^2{os}$统计量和Clark-West (2007) MSFE调整检验,三种综合指数除PCA月度在样本外均显著优于历史均值模型。

- PLS指数的年化样本外$R^2
{os}$达到6.60%,远超实证文献中通常视为经济意义显著的0.5%。
  • 单一代理样本外预测能力普遍较弱,少数有统计显著但远不及综合指数,印证综合指标的信息聚合优势。


2.4.2 资产配置角度下的经济价值(表9)


  • 应用均值-方差优化框架,基于关注度预测的资产配置显著提升投资组合的确定性等价收益(CER)和夏普比率。

- PLS投资者关注度预测的资产组合年化CER增益最高达3.99%,相当于投资者愿支付近400基点年费来换取预测能力。
  • 即便考虑50基点交易成本,经济价值依然显著。

- 组合的年化夏普比率也大幅优于市场基准(0.74 vs 0.50),说明预测信息可转化为实际收益溢价。
  • 结论强调投资者关注度作为市场择时因子的巨大潜力。


---

2.5 经济机理探索



2.5.1 关注度与订单流失衡(表10和表11)


  • 投资者关注度高度正相关于个人投资者的净购买流(总订单流失衡)增加,表现为关注度指数与当期买卖失衡变化显著正相关。

- 后续期内此净买入流回落,订单流负回归,显示价格暂时涨幅会被修正,证实由关注带来的价格压力是暂时性的。
  • 该机制合理解释了综合关注度指数对未来市场回报的负向预测能力,即卖压跟随买压出现反转,价格趋向均值回归。


2.5.2 横截面特征投资组合预测(图2)


  • 负向预测效应在高贝塔和高异质性波动率股票组合中表现得更为明显,表明关注度对高方差股票的影响更显著。

- 这与心理学理论相符,即投资者更乐于关注和交易波动性较大、风险较高的股票,进而引发更强的价格波动和预测能力。

2.5.3 另一种解释:信息获取与风险溢价


  • 高关注度期间,投资者可能积极搜集公司基本面信息,降低信息不对称,减小风险,因此风险溢价下降,预示未来回报走低。

- 实证上区分关注度导致的价格压力与信息获取的效应有一定困难,但两者都是投资者关注度预测力的潜在经济来源。

---

3. 图表深度解读



3.1 表1 12个关注度代理变量的统计特征分析


  • 展示12个关注度代理的分布特征,均值0方差1保证指标的可比性。

- 自相关系数较高(如过去回报$\rho=0.92$),说明关注度存在一定的持续性。
  • 偏度有正有负,揭示关注度指标在时间序列中的非对称分布特征。


3.2 表2 单个关注度指标两两相关系数(图片,页码3)




  • 多数指标表现为正相关,表明它们捕获了相同的投资者关注趋势。

- 相关系数区间介于-0.37至0.80之间,显示代理虽相关但各自具有差异化信息。

3.3 图1 投资者综合关注度指数时序变化(页码5)




  • 三种综合关注度指数随时间波动,经济衰退期显著下降,印证了投资者选择性关注减少的“鸵鸟效应”。

- PLS关注度指数表现平稳且噪声较低,sPCA与PCA的波动性略大。

3.4 表3 样本内预测结果(页码6)


  • PLS指数在短期至中期具有强预测能力,系数为负且显著,经济意义重大。

- sPCA与PCA表现相似,PCA预测效率最低。

3.5 表4 单个关注度代理变量预测能力(页码7)


  • 多数单指标预测系数不显著,预测能力弱。

- 仅“接近历史高点”和共同基金流入偶有显著,支持组合指标更能反映真实关注度。

3.6 表5 控制经济变量后的复合关注度预测(页码9)


  • 投资者关注度指标仍对市场回报保持预测力,回归系数明显,调整$R^2$广泛提升。

- 说明综合关注度指标包含除了经济基本面之外的重要信息。

3.7 表6 控制投资者情绪后的预测结果(页码10)


  • 关注度指标在大部分预测期仍显著,为投资者情绪信息的有益补充,表明二者捕获投资者行为的不同侧面。


3.8 表7 样本外预测能力(页码11)


  • 3个关注度综合指数样本外预测准确度显著优于历史均值模型,表明其实用性和稳健性。

- PLS指数样本外表现最佳。

3.9 表8 单个指标样本外表现(页码12)


  • 单一指标样本外表现较弱,少数指标略有良好表现,远不及综合指数。


3.10 表9 资产配置经济价值(页码13-14)


  • 不同预测 horizon 下,基于不同关注度指数的资产配置均带来明显正的CER增益和提升夏普比率,且对交易成本具有稳健性。

- PLS方法领先,综合关注度的运用明显优于买入持有策略。

3.11 图2 特征排序投资组合预测(页码17)




  • 左图为市场贝塔排序,右图为特征波动率排序组合的回归系数。

- 负预测效应在贝塔和波动率最高的股票分组中最为显著,随着时间延长系数绝对值减少但趋势保持。

---

4. 估值分析



本报告为学术实证文章的总结与延伸,未涉及具体公司估值模型或目标价。其“估值”部分主要体现在对投资者关注度的经济价值分析,尤其是基于样本外预测的资产组合确定性等价回报(CER)和夏普比率的计算,衡量预测信号在实战中的经济意义。采用的均值-方差投资模型基于预测的超额收益和方差,结合约束(不允许卖空,杠杆上限),属于经典资产配置框架,合理且清晰。

---

5. 风险因素评估


  • 市场环境差异风险: 文章基于美股市场数据,存在结论在中国A股或其他市场不能直接复制的风险。行为特征和市场结构差异可能影响关注度指标的构造及其预测能力。

- 经济基本面变化风险: 尽管控制了多项经济变量,但经济基本面或宏观政策的非线性变化可能影响关注度与股票回报的关系。
  • 代理变量数据有效性风险: 一些关注度代理的数据起始晚(如媒体报道、基金流入等),长期预测稳定性和覆盖率受限。

- 回归模型稳定性风险: 预测回归参数存在时间变异风险,本文通过多种方法和样本外稳健检验部分缓解该问题。
  • 行为假设风险: 经济机制基于投资者行为假设(如关注导致价格压力与反转),若行为模式变化或被主动套利,则预测能力或减弱。


---

6. 批判性视角与细微差别


  • 评价综合指标的构建方法科学严谨,PLS和sPCA分别兼顾监督信息和去噪,较PCA有实证优势。

- 投资者关注度对未来回报的负向预测符合现有行为金融理论,但也存在理论模型允许正向或混合效应的情况,报告中亦适当提及,显示态度中立。
  • 单一指标噪声巨大,综合指数提升效果明显,但是否捕获了所有相关信息尚待后续研究验证。

- 关注度指数在不同市场、不同时间区间的稳定性和实际可操作性需进一步探讨。
  • 样本外预测未包括高频市场事件或极端风险情境,需警惕模型的极端日表现。

- 与投资者情绪的低相关性表明二者信息互补,但在构造情绪指标的多样化方面,可能尚有改进空间。

---

7. 结论性综合



本报告系统梳理了基于Chen等(2022)学术成果构建的投资者综合关注度指数(PLS、sPCA、PCA三种方法)对美国股市超额收益的预测能力与经济价值。关键结论包括:
  • 投资者综合关注度能够显著且稳健地预测未来1至24个月的股市超额收益,呈现负向关系,即关注度越高,未来市场回报越低。

- 与单一关注度代理相比,综合指标拥有更强的预测力,成功去除了大量噪声,提炼了投资者实际关注度的核心信息。
  • 在控制包括宏观经济变量和投资者情绪指标后,投资者关注度依然具有显著的增量预测能力,体现其独立价值。

- 样本外预测表明综合关注度指数优于历史均值模型,具有实用的预测能力,且经济意义重大。
  • 资产配置模拟显示,基于关注度的择时策略在CER和夏普比率上显著提升投资者收益,说明预测成果可转化为投资利润,且对交易成本具有一定稳健性。

- 经济机制解释指出,关注度的负向预测主要源自个人投资者净买入导致的短期价格压力及后续反转,以及投资者对信息获取降低风险溢价的影响。
  • 横截面特征分析发现,关注度对高贝塔和高异质波动率股票的负预测更为显著,说明投资者更集中关注风险较大股。


综上,报告论证了投资者关注度在资产定价和市场动态中的关键作用,提出了全新的实证方法及有效的投资策略框架,拓展了行为金融和量化投资领域的研究视野与实务应用价值。

---

参考引用



文中所有结论均基于报告内容,具体页码标记如下,以供检索:[page::0-17]

---

总结



本报告不仅归纳整合学术研究,也深入剖析关注度构建方法和投资实证结果,兼顾理论经济解释与实际资产配置应用,数据充分且分析严谨,是投资研究领域关注行为金融和市场预测的重要参考。研究结果对于资产管理者、量化策略开发者和学术研究者均具有指导意义,但鉴于数据样本限定于美股,实际应用于其他市场时需结合本地市场特性进行调整。招商定量团队未来将在中国市场基于类似方法开展跟踪研究,有望为国内投资者提供更具针对性实用的关注度预测模型。

报告