`

从北向资金持仓行为到股票关联网络

创建于 更新于

摘要

本报告基于北向资金中外资券商持仓行为,构建股票关联网络并开发关联网络牵引因子Traction-NS。该因子通过衡量股票与其关联股票涨跌的锚定效应,表现出良好的多空收益和稳定性,年化收益最高达23.75%,最大回撤仅5.33%,并在不同选股域中均有稳健表现,且与主流传统因子相关性较低,显示其独特的选股能力和信息含量[page::0][page::2][page::6][page::7][page::8][page::9][page::10]。

速读内容


外资券商持仓股票具有较高的关联信息含量 [page::2][page::3]



  • 北向托管机构中外资券商数量约130家,较外资银行10家居多,且成交占比维持5%左右,表明其交易活跃度更高。

- 外资券商持仓股票数量接近2300只,持仓股票覆盖沪深300和中证500指数成分股比例高,基金持仓重合度近50%。



股票关联网络构建方法及关联度指标定义 [page::3][page::4][page::5]




  • 以外资券商共同持仓关系确定股票间关联性,构建关联网络。

- 股票关联系数基于两个股票在同一外资券商持仓市值与流通市值比值的最小值,归一化叠加而成。
  • 连线粗细表示关联强度,网络稀疏化处理以便于信息提取。


Traction-NS因子构建及表现 [page::5][page::6][page::7]




  • 基于关联网络构建涨跌锚定因子Traction-NS,通过关联度加权关联股票的超额收益求均值并剔除自有收益和行业因素。

- 网路稀疏化参数测试发现40%留存比例时RankIC峰值达6.09%,因子有效性优于其他比例。

因子多空组合回测绩效优异 [page::7][page::8][page::9]





| 年份 | 年化收益率 | 年化IR | 最大回撤 |
|--------|-----------|--------|-----------|
| 2017 | 26.85% | 4.81 | 1.61% |
| 2018 | 14.94% | 2.33 | 3.28% |
| 2019 | 26.75% | 5.20 | 1.61% |
| 2020 | 22.26% | 2.90 | 5.33% |
| 2021 | 29.58% | 3.14 | 4.00% |
| 全期2017-2021 | 23.72% | 3.45 | 5.33% |
  • Traction-NS因子多空组合月度调仓,等权再平衡,费率双边千三。

- 多空组合年化收益率稳定在23.75%左右,年化IR高达3.45,最大回撤较小,月度胜率83%。
  • 在沪深300、中证500、中证1000等不同选股域展现稳健表现,且因子与常见传统因子相关性低。


关联网络因子在不同托管机构中的表现对比及因子独立性验证 [page::8][page::9][page::10]


| 因子类型 | 年化收益率 | 年化IR | 最大回撤 |
|---------|---------|-------|---------|
| 所有北向持仓(唐1) | 17.34% | 2.10 | 9.53% |
| 外资券商持仓(Traction-NS) | 23.75% | 3.45 | 5.33% |
| 外资银行持仓(Traction-NB) | 10.77% | 1.36 | 13.08% |

  • Traction-NS因子显著优于外资银行及所有北向持仓构建的因子。

- 剔除北向持仓占比因子后,Traction-NS仍有较好的年化收益和夏普率,验证了因子的独立特征。

深度阅读

《从北向资金持仓行为到股票关联网络》——详尽分析报告



---

一、元数据与概览



报告标题:《从北向资金持仓行为到股票关联网络》
发布机构:开源证券研究所金融工程研究团队
发布日期:2021年11月7日
主要作者与联系方式:魏建榕(首席分析师,S0790519120001)、张翔、傅开波、高鹏、苏俊豪、胡亮勇、王志豪、盛少成、苏良
研究主题:利用北向资金(主要指外资券商)持仓数据构建股票关联网络,探究股票间的关联关系,并基于此开发股票选股因子——Traction-NS因子。

核心论点:
该报告创新地从外资券商持仓行为出发,通过构建股票间关联网络,提出股票涨跌的“牵引”关系,构造因子Traction-NS。文章发现外资券商的持仓行为对股价表现的关联信息量更大,通过关联网络能够有效捕捉股票之间的联动效应,从而提升选股策略的表现。报告通过细致的数据分析与因子测试,得出Traction-NS因子表现稳健,多空组合年化收益优异,且在多种股票池选股域均表现出较强的预测能力。

---

二、章节逐步精读与剖析



1. 外资券商持仓的股票关联信息含量更高


  • 关键论点:

北向资金中托管机构主要分为外资银行和外资券商。自陆股通开通以来,北向托管机构数量稳定在约150家,其中外资券商约130家,外资银行约10家。外资券商在北向资金中交易活跃,成交占比约为5%,而外资银行成交占比约为2%。因此,外资券商是更具代表性的交易资金来源,对股票的定价和市场动向影响更大;而外资银行则偏配置型资金。报告据此聚焦外资券商持仓数据,认为其持仓行为包含了更丰富的股票关联信息,是构建股票关联网络的理想对象。[page::0,2]
  • 数据与图表:

- 图1(北向托管机构数量)显示外资券商数量持续占绝对多数,远高于外资银行,体现数据稳定性和代表性。
- 图2(成交占比)直观反映外资券商交易活跃度显著高于外资银行,诉求即为注重“交易型”资金的关联信号。
- 外资券商常持仓股票约2300只,与基金持仓重合度约50%,且主要指数(沪深300、中证500、中证1000)的成分股均得到较高覆盖度(分别为99%、95%及85%),显示其投资范围广泛、代表性强。[page::2,3]

2. 关联网络构建三步走:选点、连线、定粗细


  • 关键论点与方法论:

关联网络由股票节点和节点间连线构成,连线粗细代表股票间关联强弱。构建流程包括:
- 选点:选取外资券商持仓股票池的所有股票作为节点。
- 连线:两只股票若被同一外资券商共同持仓,则两者之间存在关联关系。
- 定粗细:关联强度量化为“关联度指标”,衡量所有外资券商对两只股票共持仓的定价权,主张定价权最小值与所有外资券商关联强度加总计算得出。[page::0,3,4]
  • 构造逻辑细节:

- 定价权由持仓市值与流通市值之比(持仓比例)衡量。
- 单个外资券商对两只股票的关联强度为两者持仓比例的最小值,体现共同影响力。
- 将所有外资券商的相应指标求和,得到完整的关联度指标。
- 关联结构用图示清晰表达,实线代表存在关联关系,颜色粗细强调程度,便于理解关联网络结构。[page::4,5]

3. Traction-NS因子构建与表现


  • 因子构建逻辑:

基于股票关联网络,提出“牵引效应”假设:某股票的关联股票当月整体上涨会提高市场对该股票涨幅的预期,若该股票本月涨幅不足,则次月有望补涨。
具体构建流程(详见表1):
1. 按40%留存比例对关联网络进行稀疏化处理,去除噪音边。
2. 计算过去20日股票涨跌幅的截面中位数,代表市场基准。
3. 计算个股关联股票的超额收益(ch_g - med),赋予alpha收益。
4. 用关联度加权各关联股票的alpha,形成股票自身的“alpha锚定值”。
5. 对该指标做横截面回归,剔除个股自身alpha和行业因素,得到Traction-NS因子值。[page::5,6,图8]
  • 因子参数优化:

通过不同的网络“留存比例”参数测试,发现40%的稀疏比例令因子信息效用最大,RankIC达到6.09%,IR超过2.6,显示良好的因子预测能力。留存比例过低导致网络稀疏信号损失,过高引入过多噪音均不利于因子表现。[page::6,图9]
  • 因子实证表现:

2017年1月至2021年9月期间,Traction-NS因子等权月度调仓策略:
- 五组因子分组收益明显分化,多头组年化收益率达12.97%,空头组则亏损8.92%。
- 多空组合年化收益达23.75%,年化IR 3.45,最大回撤仅5.33%,月度胜率约为83%。
- 分年度表现稳定,除2018年收益14.94%稍低外,其余年份均在20%以上,2021年更是达到近30%年化收益率。
显示该因子具备稳定选股能力,风险可控。[page::6,7,图10,11,表2]

4. 重要讨论



4.1 因子在不同选股域的表现


  • 跨越全样本、沪深300、中证500、中证1000股票池均表现稳健:

- 全样本池收益最高(23.75%),中证1000次之(21.02%),中证500(15.7%),沪深300最低(13.96%)。
- IR随样本范围变化亦呈一致趋势,最大回撤范围6.5%-9.7%。
- 该因子与市值、换手、波动、估值、成长、盈利等主流选股因子相关性普遍较低,展示其在因子选股中具备独立的信息维度和增益。[page::7,8,表3,图12]

4.2 外资券商因子表现优于外资银行和整体北向资金


  • 构建的关联因子分为Traction-N(全部北向资金)、Traction-NS(外资券商)、Traction-NB(外资银行)三种。

- 外资券商相关因子表现显著优于其他两类,表现出最高的RankIC、IR和年化收益,且最大回撤最低。
  • 统计指标明确反映外资券商作为“交易型资金”持仓行为,包含更丰富的价格信息和市场信号。

- 剔除持仓占比因子后,Traction-NS依旧拥有极强的选股能力,显示其因子有效性并非单纯依赖持仓比例,展示较强的因子稳健性。[page::8,9,10,图13,14,15]

5. 风险提示


  • 本模型和因子均基于历史数据,市场环境和结构的重大变化可能对模型的有效性产生影响,投资者需警惕模型过拟合及市场结构突变风险。[page::0,10]


---

三、图表深度解读


  1. 图1(北向托管机构数量)

通过时间序列展示外资券商、外资银行和其他托管机构的数量构成,外资券商数量始终占据绝对优势,约130家,对比10家左右的外资银行,凸显分析重心合理性。图表体现数据样本的代表性保障为后续网络构建提供扎实基础。[page::2]
  1. 图2(成交占比)

以百分比形态反映外资券商成交占比普遍高于外资银行,长期维持在5%左右,外资银行仅2%左右。显示外资券商资金参与市场交易活跃度更高,作用更显著,支持其持仓行为更能反映市场动向和关联信息。[page::2]
  1. 图3(持仓股票池与基金重合度)

柱状与折线结合,蓝色柱为外资券商持仓股票数随时间增长趋势,折线代表与基金持仓重合比例约50%,显示外资券商持仓与主流基金持仓存在较大交集,增强网络分析对市场代表性。该重合度说明外资券商的持仓信息不孤立,融入主流资金视角。[page::3]
  1. 图4(股票池覆盖度)

曲线图显示外资券商持仓对沪深300、中证500、中证1000覆盖度,沪深300维持在99%以上,中证500约95%,中证1000提升至85%。覆盖范围广泛,充分体现外资券商持仓信息对大部分市场有体现,有利于构建广泛且有效的关联网络。[page::3]
  1. 图5(关联网络局部结构)

示意图形象地表现股票节点间通过连线连接,连线的粗细象征不同程度的关联强度,方便直观了解网络结构和核心股票的关联聚集情况。比如五粮液、贵州茅台等核心股票的密集连接体现其市场影响力和关联关系的强度。[page::3]
  1. 图6(关联关系示意)

用四个托管机构不同持仓的股票局部结构拼接,合并为综合网络,直观展示各托管机构间共有持仓带来股票间多重关联关系,凸显网络聚合过程。[page::4]
  1. 图7(关联强度计算示意)

细化联线的权重计算过程,体现持仓市值占比对关联强度的限定,通过最小值筛选两股票间共享定价权,最后跨机构求和体现多方影响累加,量化了不同股票间共持仓的强弱关系。[page::5]
  1. 图8(Traction-NS因子构建示意)

展示因子由关联度指标与关联股票Alpha收益的乘积求均值,经行业和自身收益中性化,统计形成因子值的流程图,图形化理解因子为何能反映股票的关联“牵引”效应,帮助理解背后逻辑。该图重要连接了关联网络与实际异动信号。[page::6]
  1. 图9(留存比例参数测试)

横轴为网络留存比例,纵轴为RankIC与IR。展示因子有效性随网络稀疏化程度变化规律,峰值在40%留存,指示关联网络保留信息与剔除噪声之间的最佳平衡点。[page::6]
  1. 图10-11(因子表现及多空表现)

分组净值曲线及多空净值趋势图显示因子分组盈利的分化性及多头空头策略长期盈利能力,图中收益率、IR及回撤均被清晰标注,显示因子对市场趋势和股票绩效的预测力。[page::6,7]
  1. 图12(选股域多空表现)

多选股域均表现良好,选股池规模与收益成正比,说明因子对不同市场层次均有适用性,多样性强。[page::8]
  1. 表3(因子相关性分析)

列出Traction-NS因子与主流选股因子的低相关性,体现其新颖的信息维度,具备与传统因子形成互补的潜力。[page::8]
  1. 图13-14(不同托管机构因子对比)

表格+图形对比外资券商、外资银行及所有托管机构因子表现,外资券商明显最强,数据真实体现资金性质与市场影响力的差异,强化报告核心结论。[page::9]
  1. 图15(剔除持仓占比因子表现)

显示剔除持仓占比因素后Traction-NS因子依旧表现稳健,支撑因子非单一因子叠加的复合指标,增强因子解释力。表现差异明显,凸显其选股alpha价值。[page::10]

---

四、估值与方法论分析



报告本身不涉及传统估值模型(如DCF、市盈率法等),而着重于通过量化构建股票间的关联网络与关联强度指标,进而以此开发选股因子,从复杂网络理论结合资本市场行为的视角,通过量化限制持仓比例、留存比例等关键参数,构造了创新的、多层次的资产定价信号。其方法论的核心在于:
  • 利用外资券商持仓对个股的“定价权”(持仓市值占流通市值的比率)作为关键权重指标,科学衡量资金影响力。

- 以“同一托管机构共同持仓”为桥梁定义股票的联动关系,与传统的基于财务或行业关联的研究不同,这一方法反映市场资金布局的现实情况。
  • 对网络连接进行稀疏化处理以提升噪声筛选能力,采用参数调优得到最大化有效性的留存比例(40%)。

- 协同使用横截面回归剔除行业效应和个股自身收益表现,确保因子独立反映关联网络信息。

整体设计论证严谨,创新性强,切合市场实际,所有关键假设(如资金持仓定价权的代表性、关联股票涨跌的锚定效应)均有背后数据支撑,并且通过多维度回测验证有效性。

---

五、风险因素评估


  • 历史数据风险:模型基于2017-2021年历史数据验证,未来市场结构或资金行为变动可能导致模型失效。

- 模型假设风险:关联度指标基于持仓比例假设资金定价贡献均衡,实际情况或受个体机构策略影响有所不同。
  • 网络稀疏化风险:稀疏网络处理去噪声的设定参数如调整不当,可能导致关键信息缺失。

- 持仓信息滞后风险:持仓数据的更新频率和延时可能影响因子时效性。
报告明确提出风险提示,体现研究谨慎性,提醒投资者防范过分依赖历史模型的风险。[page::0,10]

---

六、批判性视角与细微差别


  • 报告选取外资券商作为主要研究对象合理,但未深入讨论外资券商可能的战略行为异质性,如是否所有外资券商的持仓行为都具备同等代表性或定价能力。

- 关联度指标对持仓比例的依赖较大,虽然提出剔除持仓占比因子后因子仍表现稳健,但仍可能未完全剔除净值规模或流动性等其他共性因素的影响。
  • 多数图表未涉及因子与行业轮动、宏观因子联动的深入分析,可能对因子的市场时效性验证存在局限。

- 报告中最大回撤虽低,但2020年9月出现最大回撤依旧提醒投资者该策略并非无风险,未来仍需考虑极端市场情形下表现。[page::7,10]

---

七、结论性综合



本报告围绕北向资金中以交易型资金为主的外资券商持仓行为,创新构建了基于共同持仓关系的股票关联网络,提出了体现股票间牵引效应的Traction-NS因子。该因子基于资金定价权重加权关联股票的超额收益,剔除行业和自身表现后,能够稳健反映关联股票群体涨幅对个股未来表现的预测能力。实证结果显示:
  • 外资券商持仓股票覆盖度广,数量稳定,成交占比高,是关联信息的优质来源。

- 关联网络通过明确的定量方法,合理反映股票间资金共持仓导致的内在联系。
  • Traction-NS因子表现出显著的预测能力,年化多空收益率达23.75%,年化IR高达3.45,月度赢率超过83%,且历年收益稳定。

- 在沪深300、中证500、中证1000等多个样本空间均表现优异,并且与传统选股因子相关性较低,具备较强信息补充作用。
  • 与其他托管机构构建的因子相比,外资券商因子表现最佳,进一步印证交易型资金的关联信息价值。

- 因子经调整后依然稳健,体现了非单一因子叠加的卓越表现能力。
整体来看,报告充分利用量化大数据和网络分析方法,将资金行为和股票价格关联有机结合,提出的创新型选股因子具备较强的实用与理论价值。投资者可视为新兴的选股工具,但需警惕市场环境变化带来的潜在风险。[page::0-10]

---

参考图表示意(选部分)



-

-

-

---

综上,该报告是北向资金研究与关联网络结合领域的重要探索,定量逻辑清晰、实证分析详尽,为量化投资尤其是关联投资因子开发提供了有益参考。

报告