`

从北向资金持仓行为到股票关联网络

创建于 更新于

摘要

本报告基于北向资金中外资券商持仓数据,构建股票关联网络,提出关联网络牵引因子Traction-NS。该因子通过衡量股票间的关联强度,实现对股票涨跌的预判,表现稳健,多空组合年化收益达23.75%,IR为3.45,且因子在不同选股池均表现优异,显示出较强的独立Alpha信号,优于传统因子相关性低。[page::0][page::5][page::6][page::8]

速读内容

  • 北向资金托管机构主要分为外资券商和外资银行,外资券商数量约130家,交易活跃度和交易占比显著高于外资银行,故本报告主要基于外资券商持仓数据研究股票关联网络。[page::0][page::1]



  • 外资券商持仓股票数量约2300只,与基金持仓股票重叠率约50%,且覆盖沪深300、中证500、中证1000成分股达99%、95%及85%,显示出持仓的广泛覆盖。[page::1][page::2]



  • 关联网络构建方法主体为三步:选点(外资券商持仓股票池中所有股票)、连线(通过共同持仓确定关联关系)、定粗细(定义关联度指标强弱,即股票间的关联程度)[page::2][page::3]



  • 关联度通过外资券商持仓市值占流通市值比值衡量,取两只股票中较小值作为该托管机构对二者关联强度,所有机构关联强度累加得到最终关联度指标。此方法量化了股票间的持仓共性。[page::3]


  • 基于关联网络,提出关联网络牵引因子Traction-NS,体现股票本体涨幅相较关联股票群体涨幅是否不足,蕴含未来补涨潜力。因子构建采用对外资券商股票池关联网络作40%稀疏处理,结合20日累计涨跌幅的截面中位数,剔除行业和自身alpha影响,得到最终因子值。[page::5]


  • Traction-NS因子有效性依赖于网络稀疏度,40%留存比例对应RankIC峰值约6%,过低导致信息不足,过高引入噪声降低有效性。[page::5]


  • 因子5分组测试多空分化显著,多头组年化收益12.97%,空头组显著亏损,构建多空组合年化收益23.75%,IR达3.45,最大回撤5.33%,月度胜率约83%。[page::6]



  • 多空组合分年度保持稳健收益,2017-2021年均超14%,多个年份超20%,2021年达到29.58%,且IR较高,最大回撤低。[page::6]

| 年份 | 2017 | 2018 | 2019 | 2020 | 2021 | 2017-2021 |
|----------|----------|----------|----------|----------|----------|-----------|
| 年化收益率 | 26.85% | 14.94% | 26.75% | 22.26% | 29.58% | 23.72% |
| 年化 IR | 4.81 | 2.33 | 5.20 | 2.90 | 3.14 | 3.45 |
| 最大回撤 | 1.61% | 3.28% | 1.61% | 5.33% | 4.00% | 5.33% |
  • 因子在不同选股池表现均衡,沪深300、中证500、中证1000均有正收益且IR稳定,最大回撤中证1000和中证500较中证300低,显示其广泛适用性和稳定性。[page::8]


- 相关性测试显示,Traction-NS与传统因子(反转、市值、换手率、波动率、估值、成长、盈利)相关性均较低,表明其提供独立Alpha信息。
  • 三类北向托管机构构建因子对比显示,外资券商构建的Traction-NS因子有效性和表现优于所有外资和外资银行(Traction-N和Traction-NB),年化收益率最高,回撤最低,IR领先。[page::8][page::9]


- Traction-NS因子年化收益23.75%,IR3.45,最大回撤5.33%。
- Traction-N因子年化收益17.34%,IR2.10,最大回撤9.53%。
- Traction-NB因子年化收益10.77%,IR1.36,最大回撤13.08%。
  • 进一步剔除北向持仓占比因子影响后,Traction-NS因子仍保持高效能,多空年化收益20.95%,IR3.52,表现稳健。[page::9]


深度阅读

金融研究报告详细分析——《北向关联持仓中的Alpha | 开源金工》



---

一、元数据与报告概览


  • 报告标题:《北向关联持仓中的Alpha | 开源金工》

- 发布机构:开源证券金融工程团队
  • 主要作者:魏建榕(金融工程首席分析师)、王志豪(金融工程研究员)

- 发布日期:2021年11月7日
  • 研究主题:基于北向资金中的外资券商持仓,构建股票关联网络,并利用该网络开发选股因子Traction-NS,分析该因子的风险调整后收益表现和应用价值

- 核心论点
- 外资券商托管机构的股票持仓信息含量高于外资银行,且交易活跃度较高,是构建股票关联网络的理想数据来源;
- 基于外资券商共同持仓构建的股票关联网络反映了股票间的未来联动性;
- 以此关联网络为基础的牵引因子Traction-NS在多种股票池范围内均表现强劲,具备显著的alpha收益能力,具有良好稳健性和风险控制表现;
  • 报告目标和贡献:通过细致挖掘北向资金托管数据中蕴含的关联信息,提供一套基于关联网络的选股方法,为量化投资者识别潜在投资机会和管理风险提供新工具


---

二、逐章节深度解读



2.1 摘要与背景介绍


  • 关键内容

- 北向资金托管机构主要分为外资券商(约130家)和外资银行(约10家),外资券商成交占比约5%,外资银行约2%,券商更偏交易型资金,银行更偏配置型资金;
- 基于外资券商持仓数据构建股票关联网络较为合理,股票关联度通过共同持有且结合持仓市值占流通市值比例来衡量。
  • 逻辑依据

- 交易型资金(券商)日常调整持仓频次和风格更灵活,更能反映市场的动态关系;
- 将持仓规模对流通市值的比率作为定价权衡量,体现该资金对股票价格形成的影响力,强化关联关系的有效性。
  • 统计与定性数据

- 北向托管机构总量约150家,券商显著多于银行,支持以外资券商为重点研究对象;
- 外资券商持仓股票数约2300只,且持仓股票与基金重合度约50%,覆盖沪深300、中证500及中证1000等主要指数,保证研究对象代表性和广度。[page::0,1]

2.2 股票关联网络构建方法(“选点、连线、定粗细”)


  • 选点:外资券商持仓的所有股票作为网络节点。

- 连线:若两只股票被同一托管机构持仓,则两股票间建立连接,体现共同持仓关系。
  • 权重(定粗细)

- 使用持仓市值占流通市值比例衡量该机构对股票的定价权;
- 联合两股票中机构对定价权的较小值作为两股票关联强度;
- 在所有外资券商中同类关联强度累加,得到总体股票间关联度指标。
  • 示意图

- 图5为关联网络局部预览,如“贵州茅台”、“五粮液”等白酒龙头之间关联度明显。
- 图6、图7展示关联关系及强度计算示意,逻辑清晰,兼顾多机构共同持仓带来的累计影响。
  • 分析意义:此关联网络既反映资金对股票的组合管理偏好,也隐含了市场对股票联动性和风险传染路径的认知,基础扎实。[page::2,3]


2.3 关联网络牵引因子Traction-NS构建与表现


  • 构建步骤精解

- 网络稀疏处理(筛除低权重边)控制噪音,选40%留存比例为最优,兼顾信息量及干扰(图9);
- 计算股票A关联股票过去20日的alpha收益(排除整体市场中位数回报),结合关联度加权求平均,得到对A的alpha锚定值(详见表1及图8);
- 对结果做横截面回归剔除自身alpha及行业效应,获得纯粹的网络牵引因子。
  • 因子表现亮点

- 多空组合年化收益率达23.75%,年化信息比率(IR)3.45,最大回撤5.33%,月度胜率83%(图10、11);
- 分年度稳定表现,5年中各年均正收益,且多数年度年化收益超20%(表2);
- 不同指数范围均表现良好,尤其中证1000收益率高达21.02%,稳健而广泛(图12);
- 与传统因子(反转、市值、换手率、波动、估值、成长、盈利等)相关性低,说明其提供独立的选股信息(表3)。
  • 方法论的金融含义

- 关联网络反映资金组合的共识或潜在联动性,股票涨跌的“牵引效应”对应市场的连锁反应或风格轮动现象;
- 该因子在去除个股自身和行业影响后,本质体现的是网络中邻居的共振现象,为alpha挖掘提供了全新视角。[page::5,6,8]

2.4 外资银行与券商因子的表现比较


  • 对比测试

- 以不同数据来源构建因子,分别为所有外资(Traction-N)、外资券商(Traction-NS)、外资银行(Traction-NB);
- 40%-50%留存比例时,三个因子效能均达到峰值,但 Traction-NS 因子有效性最高,外资银行构建的因子表现最差(图13、14);
- 多空组合年化收益率分别为:券商23.75%、所有外资17.34%、银行10.77%,IR分别为3.45、2.10、1.36,最大回撤券商最小(5.33%),银行最大(13.08%)。
  • 推理及结论

- 交易型资金(券商)更及时反映信息和市场预期,持仓动态更丰富,因而更适合作为非线性网络的构建源;
- 配置型资金(银行)持仓变动缓慢,信息滞后,网络信息含量较低,导致因子表现弱。
  • 剔除持仓占比因子考察

- 尽管持仓占比与Traction-NS、Traction-NB有一定相关性(47%、56%),但剔除后,Traction-NS因子表现依旧坚挺,多空收益达20.95%,IR3.52,显示因子非完全依赖持仓市值比率(图15)。
- 而Traction-NB表现下降更明显,进一步确认券商数据优势。
  • 效果说明:该因子具有较强的独立信息价值和稳健性,具备良好实用性。[page::8,9]


2.5 风险提示


  • 报告明确指出,因子回测基于历史数据,未来市场环境可能变化带来因子表现改变风险;

- 作为量化策略辅助工具,应注意模型稳定性和风险管理,防止过度拟合和市场结构断裂风险。[page::9]

---

三、图表深度解读



| 图号 | 内容描述 | 主要数据及趋势 | 与文本结合的意义 | 潜在局限与备注 |
|-------|-----------|----------------|-------------------|----------------|
| 图1 | 北向托管机构数量走势 | 外资券商数量持续超过外资银行,保持约130家左右,银行约10家,整体约150家 | 确认研究数据量充足且券商为主体 | 只为数量题,未考量资金规模差异 |
| 图2 | 北向资金外资券商和银行成交占比 | 外资券商保持5%左右成交占比,银行约2%,券商更活跃 | 佐证券商数据更具交易性,更动态 | 成交占比波动细节没有深入讨论 |
| 图3 | 外资券商持仓股票数量及与基金持仓重合度 | 持仓股票2300只左右,约50%重合度 | 说明持仓股票池与基金重叠,增强数据有效性 | 影响因子信息源多样化未强调 |
| 图4 | 历年持仓股票覆盖沪深300、中证500及中证1000指数成分股比例 | 沪深300近乎全覆盖(99%),中证500全覆盖(95%),1000指数覆盖率逐年升至85% | 认定股票池具有广泛代表性 | 对较小盘股覆盖的具体影响尚需考察 |
| 图5 | 关联网络局部示意图 | 节点为股票,连线粗细表示关联强度 | 直观揭示股票间的关联关系 | 未展示全网络,可能样本中存在偏差 |
| 图6 & 图7 | 关联关系与关联强度计算示意 | 多托管机构股票持仓共线,关联度通过最小持仓比例计算并累加 | 明确了关联度指标的计算逻辑 | 该指标易受异常大持仓或持仓比例影响 |
| 图8 | Traction-NS因子构建公式示意 | 结合股票间关联度与关联股票alpha收益 | 说明因子源自关联网络的alpha传导 | 数学模型简化真实市场复杂性 |
| 图9 | 稀疏网络留存比例参数测试 | 40%留存比例时,因子RankIC与IR达到峰值 | 体现因子设计中对噪音与信息的权衡 | 留存比例的动态调整未涉及 |
| 图10 & 图11 | Traction-NS因子多空分组与累计净值表现 | 多空组收益23.75%,最大回撤5.33%,月度胜率83% | 实证因子有效性强且风险受控 | 历史数据表现不完全代表未来 |
| 图12 | 分不同选股域的Traction-NS多空表现 | 全样本最强,中证1000次之,沪深300相对较弱 | 确认因子跨市场的广泛适用性 | 表现差异原因未深入分析 |
| 图13 & 图14 | 外资券商、外资银行与所有外资因子表现对比 | 券商构建因子最高效,银行最低效 | 强调券商持仓数据是优质信号源 | 未来结构改变可能影响对比结果 |
| 图15 | 剔除持仓占比后因子表现 | Traction-NS仍有20.95%收益,表现依旧稳健 | 验证因子信息不完全依赖持仓规模 | 其他隐藏因子未排查,存在未知交互 |

---

四、估值分析


  • 本报告重点在于因子构建及表现评估,未涉及传统估值方法和目标价预测;

- 因子研究更多属于量化策略和投资组合构建工具范畴,不进行DCF等估值方法;
  • 因此不存在典型估值模型、折现率、永续增长率等参数讨论,没有相关敏感性分析。


---

五、风险因素评估


  • 模型风险:基于历史数据构建和回测,未来市场结构和资金行为变化可能使模型失效;

- 样本代表性风险:外资券商持仓虽覆盖广泛,但仍可能排除部分市场主体行为,忽视某些特殊股票群体;
  • 数据质量风险:持仓数据更新频次和准确度直接影响构建的关联网络有效性;

- 市场风险:因子虽然统计有效,但在极端市场或高波动期可能表现弱化;
  • 报告对风险提示简洁,未涉及具体缓解手段,需要投资者自行结合多因子模型和动态调仓策略进行风险控制。[page::9]


---

六、批判性视角与细微差别


  • 视角优点

- 报告基于真实且细粒度的北向资金持仓数据,创新性地构建关联网络及相应因子;
- 逻辑严密,数据充分,测试细致,实证结果令人信服;
- 关注交易型资金的动态性优势,体现了实证行为金融的使命感。
  • 潜在不足

- 对关联度指标构建中的持仓规模极端值的敏感性未详细论述,或存在异常数据影响因子稳定性风险;
- 关联网络构建缺乏动态演化分析,未来考虑网络时变性可能提升模型解释力;
- 缺少对因子在不同市场周期下表现深入探讨,尤其2018年回撤相对较大但未展开说明;
- 报告依赖外资券商持仓数据,未来若监管或市场结构变化,此数据来源可能受限;
- 关联网络与经典行业分类的重叠度及交叉验证有限,影响深层次理解。
  • 内部一致性

- 报告整体结构连贯,前后数据和结论逻辑吻合,无明显矛盾,但该因子与北向持仓占比因子相关性较高,需关注可能的信息重叠及因子多重共线问题。

---

七、结论性综合



本报告通过深入解析北向资金的外资券商持仓数据,巧妙构建了一张覆盖2300只股票的关联网络,利用机构共同持仓的定价权强度来衡量股票之间的关联度,有效揭示了股票间隐含的联动结构。基于该网络,报告设计了创新的股票关联网络牵引因子Traction-NS,结合关联股票的alpha收益实现对单只股票未来涨幅的预判锚定。

因子经过稀疏网络优化、行业因子剔除等多方严谨处理,在全股票样本池及中证1000、500、沪深300等多个指数范围内均表现出色。长期累计收益率稳定高达20%-24%区间,信息比率超过3,最大回撤控制在5%-10%左右,显著优于其他基于外资银行或全外资持仓构建的因子。

此外,Traction-NS因子与主流传统因子相关性偏低,揭示了其独特的信息价值;剔除持仓占比后的依旧优异表现进一步凸显因子的稳健性和创新性。报告展示了外资券商持仓数据的研究价值和因子设计新思路,为量化投资者提供了全面且实用的工具。

图表分析从机构数量、成交占比,股票持仓规模到关联网络示意,再到因子构建步骤及历史表现,全方位验证了研究逻辑的严谨和数据质量,确保结论可信。

总体而言,本报告提供了北向资金持仓新视角下的因子研究范式,构筑了基于资金共识的网络化选股因子空间,拓展了传统因子模型的边界,对投资策略的多样化和风险管理具有重要指导意义和应用前景。

---

(全文所有结论及数据均可追溯至报告对应页码标注页,确保准确性和可验证性)[page::0,1,2,3,5,6,8,9]

报告