自选股与点击量:投资者关注度的选股能力
创建于 更新于
摘要
本报告基于同花顺大数据,构建了投资者关注度三大因子:个股点击量占比、新闻点击量占比及自选股占比,均表现出稳定的负向选股能力。个股点击量因子在中证1000股票池中表现优异,年化RankICIR达到-3.1。基于该因子提出的指数增强策略,通过剔除空头分组股票,实现了稳健的超额收益,且在中证1000指数中累积超额收益率约32%,最大回撤仅4.4%。整体投资者关注度因子与传统风格因子关联较低,具备独特的alpha信号特征,低资金用户行为对负向选股贡献更突出。优化求解增强模型进一步提升超额收益,但波动与回撤有所提升。风险提示:历史表现不代表未来,市场可能变化。[page::0][page::3][page::6][page::11][page::12][page::13]
速读内容
投资者关注度因子构建及表现概览 [page::3][page::6][page::7]
- 三类关注度因子为:个股点击量占比、新闻点击量占比、自选股占比。
- 个股点击量占比反映投资者实时关注,单日最高占比可达8%。该因子分布右偏但经过对数变换趋于正态。各行业间点击量占比差异显著,非银金融、银行等行业点击量较高。
- 高点击量占比个股未来收益显著为负,验证“人多的地方勿去”谚语。低资金规模投资者行为负向选股能力更强。
- 自选股占比体现投资者主动关注度,因子表现同样负向,且低资金用户的负面预测性更明显。
- 因子差分/变化率衡量关注度边际变化,高新增操作负向效应更显著,说明关注度高低比变化方向影响绩效更大。
关注度因子绩效及关联度比较 [page::9][page::10]
| 指标名称 | 个股点击量占比 | 新闻点击量占比 | 自选股占比 |
|----------|----------------|----------------|------------|
| 多头年化收益率 | 11.6% | 11.4% | 11.1% |
| 空头年化收益率 | -8.7% | -0.1% | -6.0% |
| 多空对冲收益 | 19.8% | 9.7% | 16.5% |
| 夏普比率 | 1.76 | 1.14 | 1.94 |
| 最大回撤 | -9.8% | -10.2% | -8.8% |
- 个股点击量占比因子表现整体较优,RankIC均值约-10%,RankICIR最高达-3.2。
- 三因子间相关较强,个股点击量与自选股占比相关达0.8,但与主流风格因子关联度低,最高与市值相关约0.49。
指数增强策略实践及效果 [page::11][page::12][page::13]
- 以个股点击量占比因子的空头端分组股票为筛选标准,采用“空头个股剔除+权重再平衡”方法构建指数增强组合。
- 不同指数增强效果差异大,中证1000表现最好,年化超额收益4.7%,最大回撤4.4%,表现显著优于沪深300(年化超额约小幅正收益)及中证500。

- 引入约束条件下的优化求解后,沪深300增强组合超额收益提升至约20%,但波动上升;中证1000增强累计超额收益增至50%,年化6.8%,但最大回撤增至14.6%。

投资者资金量对因子效果的影响 [page::5][page::6][page::7]
- 资金量分别分为低(10~50万)、中(50~100万)、高(100万以上)。
- 低资金量用户的个股点击量高对应的负向收益特征更明显,低资金群体存在更强的错误定价行为。
- 自选股占比因子对于低资金用户同样呈现更显著的负面预测性。
深度阅读
报告元数据与概览
- 报告标题:自选股与点击量:投资者关注度的选股能力
- 作者团队:金融工程研究团队(首席分析师魏建榕,分析师张翔、傅开波、高鹏、苏俊豪、胡亮勇,研究员王志豪、盛少成、苏良)
- 发布日期:2022年3月27日
- 发布机构:开源证券
- 研究主题:基于投资者行为数据(个股点击量、新闻点击量、自选股数据)构建投资者关注度因子,研究其对个股未来表现的预测能力,进而探讨利用这些因子进行量化投资及指数增强的可行性。
核心论点:
投资者个股关注度因子具备稳定且显著的负向选股能力,即市场关注度越高的个股未来回报越低。三个主要因子——个股点击量占比、新闻点击量占比、自选股占比均表现出了这一特征。特别是个股点击量占比因子预测能力和稳定性最优。报告提出剔除空头端关注度高的股票,构建指数增强组合,可以显著提升超额收益,尤其在中证1000等小市值股票池中表现最佳。[page::0,3,6,9,10,11,12,13]
---
逐节深度解读
1、投资者关注度因子测试:具有稳定的负向选股能力
1.1 个股点击量占比(关注度综合映射)
- 说明:个股点击量占比定义为“某股当日点击量/全市场个股点击量总和”,反映投资者对个股即时的关注程度。
- 发现:个股点击量占比极值可达8%以上,数据呈现右偏分布,经过对数转换后近似正态。不同市值和行业之间的点击占比差异明显,大市值股票和非银金融、银行、有色金属等行业受到更多关注。
- 核心测试结果显示,个股点击量占比因子RankIC均值约-10%,表现出负向选股能力。高点击量占比的股票未来收益显著偏低,多空组合年化收益率达19.83%。高资金量用户与低资金用户的点击分布表现一致,但低资金用户负向指示效果更显著,表明低资金额投资者的关注更具误导性。
- 图表说明:
- 图1显示个股单日最大点击量占比时间序列最高为8%。
- 图2显示原始点击量占比高度右偏,转对数后近似正态。
- 图3显示不同行业点击量占比显著差异。
- 图5揭示市值和点击量占比正相关。
- 图6-8揭示点击量高个股未来回报为负,低资金投资者的点阅数据负向效应更明显。[page::3,4,5,6]
1.2 新闻点击量占比(外部驱动的关注度度量)
- 说明:新闻点击量占比因子定义为个股新闻点击量占全市场新闻点击量的比例。
- 发现:该因子的RankIC均值为约-6.1%,分组收益严格单调,呈现稳定负向预测能力,但在2021年3月后多空收益出现较大回撤。多头年化收益率和多空收益均不及个股点击量占比因子。
- 图9、10清晰展示了新闻点击量占比越高个股回报越低,分组收益单调递减,支持其负向选股的结论。[page::6]
1.3 自选股占比(内生关注度度量)
- 说明:自选股占比定义为个股被投资者加入自选股池的用户数占所有自选股用户数的比例,反映投资者主动关注偏好。
- 发现:自选股占比因子也呈稳定负向选股能力,RankIC均值约-7.58%,多空组合年化收益16.51%,且多空收益稳定。不同资金量用户分层结果与点击量占比类似,低资金用户的自选股池更偏离理性。
- 图11-13体现了这三个资金量层级的自选股占比负向效应。[page::7]
1.4 自选股占比变化(关注度边际变动)
- 说明:基于自选股占比的月度差分及变化率构建因子,考察投资者关注度的增减对个股表现的影响。
- 发现:无论新增还是剔除操作,均表现为负向选股效应,新增操作负效应更强,且分布均呈尖峰厚尾特征。
- 意义:推动个股未来表现的主因是关注度的高低,而非方向性变化,即关注度的大幅变化反而预示较差表现。
- 图14-17清楚展示了差分与变化率分布的尖峰、厚尾,以及不同分组的累计收益率曲线。[page::8,9]
---
2、投资者关注度因子比较
2.1 绩效对比
- 结论:个股点击量占比因子空头效应最强,年化空头收益为-8.7%,表现优于新闻点击量与自选股因子。自选股因子多空组合稳定性最高,夏普比率达1.94。三因子多头年化收益率相近,说明多头端投资价值相对有限。
- 表1详细列出了三因子在不同组合维度(多头、空头、多空对冲)上的年化收益率、波动率、夏普比率、最大回撤和胜率。
- 图18形象展示各因子RankIC均值、标准差与RankICIR指标,凸显个股点击量因子预测能力和稳定性的相对优势。[page::9]
2.2 因子相关性分析
- 结论:三个投资者关注度因子之间相关性较高(点击量占比与自选股占比相关达0.8),表明反映了类似投资者关注行为;
- 投资者关注度因子与主流风险风格因子关联度较低,最高约为市值因子的0.49,暗示关注度因子能够提供独立的、附加的alpha信息。
- 图19为因子间相关系数矩阵表。[page::10]
---
3、投资者关注度因子实践:指数增强应用
3.1 主流宽基指数表现
- 个股点击量占比因子在不同宽基指数(沪深300、中证500、中证1000)中均表现出负向选股能力。
- 中证1000中表现最佳,RankIC均值-0.11,年化RankICIR-3.10,其次为中证500,沪深300表现最弱。
- 图20、21显示了不同指数下因子值变化及指标表现。[page::10,11]
3.2 空头个股剔除实现负向因子增强
3.2.1 权重再平衡法
- 做法:每期调仓时,剔除空头组个股后,对剩余股票权重重新归一化。
- 结果:沪深300增强策略超额收益较小且不稳定,累计超额收益14%;中证500策略较稳健,年化超额收益3.1%;中证1000执行剔除表现最佳,累计超额收益32%,年化超额收益4.7%,最大回撤4.4%。
- 图22-24分别展示对应指数增强组合的超额收益情况。[page::11,12]
3.2.2 约束优化求解法
- 思路:采用约束优化模型控制风格及行业暴露,最大化预期超额收益(最小化因子暴露度,即选股负向因子最小值权重)。
- 限制条件细化风格暴露上下限±0.01,行业暴露上下限±0.01,成分股权重下限0.8,权重调整上下限±0.05。
- 结果:相比权重再平衡法,沪深300增强组合累计超额收益提升至约20%,但波动较大;中证1000组合累计超额收益达50%(提升17%),年化超额收益6.8%,但最大回撤增至14.6%。
- 图25、26展示优化后增强组合效果。[page::12,13]
---
4、风险提示
- 报告均基于历史数据的模型测试,未来市场可能出现变化导致模型失效。[page::0,13]
---
图表深度解读(仅选重点)
- 图1(个股单日最大点击量占比):展示2016-2021年间个股最大点击量占比,最大超过8%,且一般约1.1%,说明个别个股极度受关注,有出现过短期注意力异常集中期。
- 图6(点击量占比因子RankIC):RankIC绝大多数时间为负,累积RankIC呈持续下降趋势,表明关注度越高的个股后续表现越弱。
- 图11(自选股占比因子RankIC):与点击量占比因子类似,累积RankIC持续下降,表明主动选股关注度越高未来表现越差。
- 表1(投资者关注度因子绩效比较):全表说明三个关注度因子均具备负向选股能力,但个股点击量占比因子空头收益显著最强,夏普比率较高的为自选股因子多空组合。
- 图20、21(各指数中个股点击量占比因子表现):个股点击量因子在中证1000中表现最佳,表明中小市值股票池中投资者关注度信息更具选股价值。
- 图22-24(不同指数增强组合超额收益):显示剔除空头个股后的增强收益,尤其是中证1000组合收益显著且稳健。
- 图25、26(约束优化增强组合表现):优化模型进一步提升超额收益,尤其中证1000组合达到50%累计超额收益,但风险回撤也有所提高。
---
估值分析
- 报告核心不涉及传统估值模型,主要围绕行为数据构建的因子的预测能力和实证表现,结合综述的因子性能用于指数增强策略构建。
- 约束优化问题中运用因子暴露度作为最小化目标,借此最大化预期收益,这是一种典型的多因子优化策略方法。
- 主要假设包括:因子暴露与预期收益负相关;风格和行业暴露限制设定以保证策略行业与风格中性;权重调整限制控制交易成本和现实可操作性。[page::12,13]
---
风险因素评估
- 模型基于历史行为数据,假设投资者关注度对未来表现持续负向预测效果成立,若市场结构或行为发生本质改变,过往规律或将失效。
- 行为数据来源渠道、脱敏及数据质量亦影响因子构建的准确性。
- 组合构建和剔除操作导致权重集中度变化,可能增加跟踪误差及流动性风险。
- 约束条件设定可能受限,部分情况下存在无解风险,需调整分组粒度。
- 高频关注度突增突降导致的短期价格波动和情绪驱动风险也需关注。
- 报告无具体缓解方案,风险提示较为简要。[page::0,13]
---
批判性视角与细微差别
- 报告结论基于多个时间段和不同指数样本,验证了关注度因子负向选股能力的稳健性,但主要关注期为2016年至2021年11月,未来行情和数据结构可能变化。
- 投资者关注度因子与传统风格因子低相关性说明其独立alpha,但可能也牵涉到市场噪声和投资者非理性行为,过度依赖可能带来非系统风险。
- 因子表现的负向性质反映“人气高的股票回报差”,与一定程度的市场过热和羊群效应相关。该逻辑虽被广泛认可,但可能因市场不同阶段表现差异较大。
- 个股点击量和自选股均反映投资者关注的重叠内容,部分因子高度相关,未来合成因子或许更优。
- 空头端表现优于多头端意味着因子应用有限,仅依靠做多端难以实现有效超额收益,限制了策略构建灵活性。
- 优化模型的约束条件和求解细节尚需进一步披露,例如交易成本对策略净收益影响、持仓集中度管理等未明确。
- 从回撤数据看,优化策略回撤较权重再平衡明显升高,风险控制难题尚需关注。
- 报告对数据来源及处理方法保密,外部复现难度较大。
- 对低资金投资者的行为更偏激估计是有趣发现,但是否普遍适用于其他市场或时间段尚不明确。[page::3~13]
---
结论性综合
本报告通过对同花顺等平台的投资者行为数据(个股点击量、新闻点击量、自选股数据)进行分析,构建了三大核心关注度因子,这些因子均表现出显著且稳定的负向选股能力,即投资者高度关注的股票未来表现显著较差。个股点击量占比因子表现最佳,具有相对更强的预测稳定性和更高的超额收益潜力。
图表数据展示了关注度因子在不同维度的统计特征及预测效果,包括其厚尾分布、行业和市值差异、资金量划分差异等,说明投资者行为存在一定共性和异质性,尤其低资金用户的关注信息具有较强误导性特征。
利用关注度因子的负向选股能力,报告尝试通过指数增强模型提高主流指数的超额回报。以剔除空头端关注度高的股票为核心思路,结合权重再平衡和带约束的最优化方法,增强组合在中证1000等以小市值为主的股票池表现最佳,年化超额收益率最高接近7%。但策略的回撤及波动水平亦随之上升,风险管理需关注。
投资者关注度因子作为一种基于行为金融的大数据因子,整体表现出强有力的alpha信号,与传统风格因子低相关,具备补充价值及应用潜力。报告灵活利用大数据投资者行为信息,结合传统量化策略框架,揭示了市场中投资者关注过度往往映射着未来的相对劣势,这一点为量化选股和智能投研开辟了新方向。
然而,因关注度行为本质受投资者情绪及市场结构影响,未来依然面临市场环境变化的风险。报告的结论和模型有效性依赖于历史行为的稳定性,实际应用时需持续监控因子表现及市场状况。此外,投资者关注度因子的高负相关仅能通过剔除空头端实现超额收益,多头端本身的精准识别尚未解决,限制了策略的完整性和灵活性。
总体而言,报告展示了投资者关注度因子的系统构建、稳健回测结果及实现路径,提出了可操作的量化增强方案,对投资者行为数据在选股中的运用给予了有力支撑,并提供了有效的实证证据和策略构建示范。[page::0~13]
---
参考与溯源
本分析主要引用了报告中第0至13页的全部内容,尤其依赖于章节结构和具体图表数据进行剖析和论述,确保对报告的全方位、多角度解构和重构。
---
关键图表展示示例
(以下示例部分图表Markdown仅供格式示范,详细图见原报告图片)
- 图1:个股单日最大点击量最高可达8%

- 图6:高点击量占比个股潜在回报显著为负

- 表1:投资者关注度因子均表现出稳定的负向选股能力
(原报告html表格已解析详见正文)
- 图24:中证1000指数增强组合具有稳健超额收益,最大回撤仅4.4%

以上汇总图表佐证了报告核心论点,展示了因子的统计特性与策略实施效果。
---
总结
《自选股与点击量:投资者关注度的选股能力》报告通过精细的行为金融数据挖掘,建立了基于投资者关注度的负向选股因子模型体系,验证并揭示了投资者关注热点中的潜在投资风险,并首次系统展示了如何将这些信号集成至指数增强框架内取得超额收益的全过程。报告对市场参与者了解投资者行为偏差和构建量化策略提供了重要参考价值,具备较强的实操可行性及理论创新意义。[page::0~13]