雪球大V用户的选股行为alpha | 开源金工
创建于 更新于
摘要
本文基于雪球大V用户的自选股与模拟组合数据,构建多维度选股能力评价体系,分析粉丝数和用户类型对选股绩效影响,证明大V用户自选股信息含量显著优于模拟组合调仓信息,基于历史绩效改进事件组合策略,优选组合年化收益率显著提升至25.6%,为选股策略提供实证支持 [page::0][page::9][page::10]
速读内容
用户基本信息与分类特征概览 [page::1][page::2]


- 通过扩散方法筛选粉丝数量超过500的34882个雪球大V用户。
- 超过50%用户粉丝数在2000以下,20%用户粉丝数超过1万,4%为分析师、基金经理等专家类型。
- 用户分为分析师、自媒体、研究达人、官方账号、认证与未认证用户等多类别。
自选股与模拟组合数据特征及选股事件收益表现 [page::3][page::4]






- 保留A股自选股,月均加入自选股数量约2.5万个,持续增长。
- 自选股60日超额收益与用户粉丝数量正相关,粉丝数5万以上用户超额收益达3.9%。
- 研究达人、排行榜上榜用户、分析师等类型用户自选股选股事件表现优异。
- 模拟组合调仓月均样本约2.1万次,研究达人类型模拟组合买入事件收益最高(3%),增仓幅度和买入事件收益正相关。
雪球大V用户风格画像分析 [page::5][page::6][page::7]








- 熱門行业关注度高,医药生物13%、电子9%、化工8%、机械设备7%、计算机6%居前。
- 风格偏向中高市值,市值分位均值74%,估值分位均值47%。
- 五维评价:收益能力(自选股超额收益3.4%,组合年化收益8.7%),收益稳定性(自选股波动21.6%,组合年化波动33.6%),交易能力(调仓间隔34天,买卖超额收益差0.74%),黑马能力(0.35%),白马能力(3.9%)。
- 用户个体绩效表现差异显著,部分用户表现均衡,部分偏向白马或黑马能力突出。
雪球大V用户事件组合策略研究 [page::8][page::9][page::10][page::11]

| 组合 | 年化收益率 | 年化波动率 | 收益波动比 | 最大回撤 | 胜率 |
|--------------------|------------|------------|------------|----------|--------|
| 粉丝≥50000 | 21.0% | 23.3% | 0.90 | 30.9% | 56.4% |
| 20000≤粉丝<50000 | 17.8% | 23.5% | 0.76 | 31.2% | 55.1% |
| 10000≤粉丝<20000 | 11.1% | 23.8% | 0.47 | 33.4% | 54.8% |
| 沪深300 | 0.6% | 19.1% | 0.03 | 39.6% | 50.8% |
| 中证500 | -2.9% | 21.8% | -0.13 | 40.1% | 52.8% |

| 组合 | 年化收益率 | 年化波动率 | 收益波动比 | 最大回撤 | 胜率 |
|--------------|------------|------------|------------|----------|--------|
| 研究达人 | 8.4% | 22.3% | 0.38 | 32.4% | 54.6% |
| 排行榜上榜用户 | 6.8% | 22.2% | 0.30 | 32.6% | 53.7% |
| 沪深300 | 0.6% | 19.1% | 0.03 | 39.6% | 50.8% |
| 中证500 | -2.9% | 21.8% | -0.13 | 40.1% | 52.8% |
- 粉丝数量与自选股事件组合年化收益呈正相关,自选股事件组合显著跑赢沪深300与中证500指数。
- 模拟组合事件组合收益表现一般,研究达人及排行榜上榜用户略优于其他类别。
- 基于用户自选股超额收益波动比进行优选,Top20%组合年化收益高达25.6%,显著提升基础组合收益。
- 基于用户模拟组合绩效的改进组合年化收益达19.3%,优于基础自选股组合,但改进效果不及自选股优选。
量化因子构建与策略总结 [page::9][page::10]
- 利用用户自选股历史表现指标(超额收益均值与波动率构成收益波动比)与模拟组合收益波动比衡量用户选股能力。
- 严格基于过去历史数据动态评价用户绩效,避免未来数据泄露。
- 事件组合构建采用等权配置,持仓周期20交易日,交易成本设置双边千分之三。
- 绩效优选组合明显跑赢基准,说明用户历史选股信息可为未来选股提供Alpha信号。
- 但报告未涉及具体因子细节及多因子融合,提醒读者可基于量价因子等继续尝试改进。
深度阅读
报告标题与概览
- 标题:《雪球大V用户的选股行为alpha | 开源金工》
- 作者及机构:开源证券金融工程首席分析师 魏建榕团队
- 发布日期:2023年11月05日
- 主题:基于雪球平台上粉丝数量较多的“大V”用户数据,分析其选股行为,构建选股策略并评估其投资价值。
- 核心论点:
- 雪球大V(粉丝500以上用户)具有较为显著的选股alpha,尤其自选股的超额收益明显优于模拟组合。
- 用户粉丝数量越大,其自选股事件的收益表现越好,研究达人等专业用户群体表现尤为优异。
- 基于雪球大V用户数据构造的选股事件组合年化收益可达20%以上,明显超越主要市场指数表现。
- 利用用户历史自选股与模拟组合绩效指标,可进一步优化选股事件组合,显著提升收益表现。
- 报告主要信息传递:雪球平台明星用户行为中蕴含投资价值,粉丝数多、类别专业的大V选股信息可以构建高收益投资策略,且用户历史绩效指标对后续收益具有预测力。[page::0][page::1][page::8][page::9]
---
详细章节分析
1. 雪球大V用户数据概览
1.1 用户基本信息
- 结构化数据采集框架:用户数据分为四类:基本信息(ID、昵称、粉丝信息、分类标签等)、自选股信息(代码名称、加入时间)、模拟组合信息(组合调仓、净值数据)、发帖文本信息。
- 用户分类:雪球用户分为10大类,包括分析师、公号、研究达人、官方账号、实名认证用户等。大V定义为粉丝数≥500的用户,样本内共有34882名这样的用户。
- 用户粉丝数分布:
- 粉丝<2000占超50%
- 粉丝≥10000占约20%
- 粉丝≥20000占约10%
- 用户类型占比:
- 未认证用户占比57%
- 实名认证占31%
- 分析师和基金经理占4%
- 意义解读:大部分大V用户粉丝数处于中小规模,但存在一批拥有超过5万粉丝的顶级影响者。他们来自不同的投资群体,用户类型的多样性为后续绩效比较提供基础数据。[page::1][page::2]
图表分析
- 图2(粉丝数量分布饼图):
- 29%用户粉丝在500~1000
- 22%粉丝1000~2000
- 18%粉丝2000~5000,依次递减至2%粉丝大于5万。
- 说明粉丝数量呈明显右偏分布,少数顶级大V影响力更大。
- 图3(用户类别分布饼图):
- 未认证用户大多数,认证及专家占少数。
- 这体现了雪球社区结构特征,专业及权威信息相对稀缺但重要。[page::2]
---
1.2 自选股信息
- 数据选择:剔除港股、美股及基金,保留A股。
- 月度自选股数量:
- 总体呈现明显增加趋势,月均2.5万个左右自选股样本。
- 自选股收益表现:
- 粉丝数越多,自选股60交易日后相对中证800的累计超额收益越高。
- 粉丝≥5万用户超额收益达3.9%。
- 不同用户类型中,研究达人表现最好(4.1%),其次是排行榜用户、分析师(3.7%, 3.5%)。
- 逻辑与意义:
- 高关注度大V的选股决策更具有超额收益能力,符合其更专业的投资能力或信息优势。
- 用户类别与粉丝数均是判断选股alpha的重要维度。
- 图5&6分别展现粉丝数与用户类别与自选股事件收益的关系,均显示正相关趋势,支持上述观点。[page::3]
---
1.3 模拟组合信息
- 模拟组合构建:
- 包含用户不同模拟组合列表、调仓明细与净值。
- 样本丰富,月均调仓样本数量约2.1万次。
- 模拟组合事件收益:
- 研究达人模拟买入事件收益最高(3.0%),分析师和基金经理最低(1.2%)。
- 增仓幅度越大,事件后收益越高(高增仓幅度组收益明显优于低增仓组)。
- 与自选股事件收益对比:
- 模拟组合买入事件收益(2.5%)低于自选股事件收益(3.3%)。
- 图8展示了不同用户类型模拟买入的收益差异,图9展示增仓幅度与收益的正相关性,表明交易行为中的增仓力度是关键影响因素。
- 解读:模拟组合行为信息虽然有一定alpha,但不及自选股信息,说明用户真实关注标的更有投资参考价值。[page::4]
---
2. 雪球大V用户风格画像
2.1 选股行业与风格偏好
- 用户差异性明显,部分用户专注单一行业(如食品饮料占比95%),部分用户行业分布均衡,反映能力圈和投资风格差异。
- 市值分位均值为74%,偏好中高市值股。
- 估值分位均值为47%,估值中性偏中间区间。
- 用户在不同年份市值风格存在变化,显示出一定的风格切换能力。
- 图10-13详细呈现行业分布及市值风格的多样化与动态特征。
---
2.2 五维评价体系
- 构建指标:
- 收益能力(自选股超额收益与组合年化收益各占50%)
- 收益稳定性(自选股收益波动与组合波动率)
- 交易能力(调仓间隔天数、组合超额收益差)
- 黑马能力(小市值超额收益特征)
- 白马能力(大市值超额收益特征)
- 重要统计及分布:
- 自选股超额收益均值3.4%,组合年化收益均值8.7%。
- 自选股收益波动21.6%,组合年化波动率33.6%。
- 调仓间隔均值34天,组合买卖超额收益差0.74%。
- 黑马能力较弱(0.35%),白马能力较强(3.9%)。
- 雷达图(图22)展示不同用户五维指标的差异,例如用户A五维表现均衡,用户B强白马能力,用户C强黑马能力但稳定性较弱。
---
3. 雪球大V用户事件组合策略
3.1 基础事件组合表现
- 采用自选股事件构建事件驱动组合,均等权重持有事件次日开始20个交易日。
- 粉丝数分段比较:
- 粉丝≥5万组合年化收益21.0%,波动率23.3%,收益波动比0.90。
- 粉丝2万-5万组合年化收益17.8%。
- 粉丝1万-2万组合年化收益11.1%。
- 三个组合均显著优于沪深300及中证500指数。
- 模拟组合买入事件组合表现较弱:
- 研究达人组合年化收益8.4%。
- 排行榜用户组合6.8%。
- 对应图23、24及表6、7详尽展示组合净值走势与具体统计指标。[page::8][page::9]
---
3.2 基于用户风格画像的事件组合改进
- 利用用户历史自选股和模拟组合的“收益波动比”(收益均值/波动率)指标筛选高绩效用户。
- 将自选股历史绩效前20%、40%大V用户的自选股事件构建优选组合。
- 结果显示优选组合表现远优于基础组合:
- 自选股绩效Top20%组合年化收益25.6%,收益波动比1.07。
- Top40%组合年化收益21.1%,收益波动比0.88。
- 基础组合仅11.0%的年化收益,收益波动比0.46。
- 模拟组合优选效果也明显:
- 模拟组合绩效Top20%组合年化收益19.3%。
- Top40%组合16.9%。
- 更优于基础组合的11.0%。
- 图25、26及表8、9展示了优选组合相较基础组合的净值走势与关键指标对比。
---
图表深度解读
整体图表充分支撑了自选股优于模拟组合、粉丝数及用户类型关联选股alpha、用户绩效指标预测未来表现等核心观点。
---
估值分析
本报告主要聚焦于雪球用户投资行为与基于该行为的数据构建选股策略,未涉及传统的公司估值方法如DCF、市盈率等,因此无直接估值模型分析。
---
风险因素评估
报告末尾简要提及风险:
- 市场环境改变、数据更新延迟和行为模式变化皆可能影响策略效果。
- 报告未详细展开风险缓释策略及风险发生概率估计。
尽管风险提示简要,但其提醒用户对历史数据驱动模型的局限性做审慎评估是必要的。
---
批判性视角与细微差别
- 本报告较全面系统地梳理了雪球大V用户数据特征并构建相应投资策略,实证逻辑清晰。
- 然而,因数据来源为雪球公开用户行为,可能存在“行为偏差”与“幸存者偏差”,未完全考虑潜在的样本选择偏倚和信息交叉影响。
- 报告对“模拟组合”与“自选股”的优劣作清晰区分,但未对“发帖文本信息”等高价值非结构化数据深入挖掘,存在扩展空间。
- 用户粉丝数量为区分主体的重要维度,但粉丝数虽与影响力相关,未必完全等同于投资能力,且该维度某些极端值可能对结果产生过度权重,应警惕过拟合。
- 没有对策略的交易成本、流动性风险和市场冲击等现实交易限制条件做深入讨论,后续研究可包含。
- 多因子选股体系被说明为“较为成熟”,故未在本报告纳入,虽然实际应用中结合因子模型可能进一步增强策略表现。
- 综合来看,报告结论基于稳健的量化分析与丰富数据,但对未来模型稳健性和策略实盘可操作的再验证仍需关注。
---
结论性综合
该报告通过对雪球平台上粉丝数500以上的“雪球大V”用户的基础信息、自选股行为以及模拟组合交易数据,揭示了其选股行为中蕴含强烈alpha信号。用户粉丝数量越大,信息含量和投资收益能力越强,专业群体如研究达人表现更优。
利用多维度的五维评价体系,系统刻画了大V的投资能力和风格差异,发现其整体偏好中高市值白马股,收益能力和交易能力较强。研究进一步采用用户自选股及模拟组合历史绩效指标,针对事件组合构建的基础模型进行了绩效优选,显著提升了组合的年化收益率和风险调整表现,最高年化收益超过25%。
报告的关键洞察包括:
- 自选股选项比模拟组合更能反映用户选股信息,高收益偏好更加显著。
- 粉丝量和用户类别是投资收益的有效信号。
- 用户历史绩效指标(尤其是收益波动比)对未来选股表现具有较强预测性。
- 创新构建基于行为数据的选股事件组合策略,有效超越市场基准指数表现。
- 临近交易时间点的增仓力度与收益呈正相关,体现交易行为中的市场敏感度。
图表与表格完整呈现了用户分布特征、自选股与模拟组合数据结构、绩效统计和优化效果,数据全面且分析严谨。
尽管模型基于历史行为数据存在风险,且未充分融入非结构化信息,但报告已为行为金融和量化投资结合开拓了有力思路,具备较高的实践与理论价值。未来结合发帖文本信息、融入因子模型及完善风险管理将进一步提升选股策略的有效性和适用性。
总结而言,本报告为市场参与者利用社交投资平台行为数据发掘alpha提供了系统框架和成功示范,验证了大V投资风格和绩效在量化选股中的重要应用潜力。[page::0-11]
---
参考图表(部分重要图示)











