金融科技(Fintech)和数据挖掘研究(四)——FactSet 供应链数据的介绍和应用
创建于 更新于
摘要
报告详细介绍了FactSet的三大核心数据产品(RBICS深度行业分类、供应链数据和GeoRev公司营收地理分布)及其在全球尤其是A股市场的应用价值。数据通过自下而上的精细行业划分、全面的供应链关系构建及区域化营收拆分,为量化基本面研究、事件驱动策略及因子构建提供了重要支持,显著拓展了传统量价和财报数据的边界。FactSet供应链数据通过网络图算法衍生多种因子,实现了显著Alpha,且与传统因子相关性低,展示了强大的市场应用潜力[page::0][page::4][page::9][page::16][page::21][page::22][page::23]
速读内容
FactSet数据产品介绍及核心组成 [page::4][page::7]

- FactSet提供包括RBICS深度行业分类、供应链关系和GeoRev地理营收分布三种另类数据,为投资和研究提供支持。
- RBICS基于公司产品及服务细分为6层自下而上的行业结构,覆盖近5万家全球上市公司。
- 供应链数据涵盖供应商、客户、竞争对手、战略合作4类13种关系,全球供应链网络覆盖A股95%以上中证800成分股。
- GeoRev数据披露各公司在全球多个国家和地区的营收贡献及分布,帮助评估地域风险和增长潜力。
RBICS深度行业分类及实证应用 [page::5][page::6][page::12][page::15]

- RBICS分类层次清晰,将苹果公司iPhone等产品对应的业务营收占比明确归属,支持自下而上的细粒度行业划分。
- 应用示例:金风科技主营业务风机制造细分至L6层,全球风力设备市场份额分析显示其排名全球第三,市场空间明晰。
- 基于RBICS的业务线主营收入可构建主题指数,FactSet已与多家指数公司合作开发100+主题指数,支持ETF产品发行。
- 利用RBICS分组构建PE均值回复策略,结合行业中性构造的组合显著提升收益和风险调整表现。

- PE(Sector Neutral)策略年化收益16.4%,显著优于不分行业的传统PE均值回复策略11.4%。
供应链数据应用与事件驱动策略示例 [page::9][page::17][page::18]

- 事件影响不仅局限于事件公司,基于供应链关系的上下游公司也会出现滞后反应,形成投资切入点。
- 华为供应链事件显示,美国主要供应商受限制导致股价大幅下滑,A股相关供应商也受到波及,供应链竞争对手或受益。
- 供应链关系揭示了复杂关联,允许构建针对竞争对手、合作方等多维度的事件驱动策略和投资组合。
供应链因子构建与Alpha表现 [page::18][page::19][page::20]

- 德银研究基于供应链网络构建“度”“中心性”“溢出效应”三类因子,测算显示月均多空收益达0.6%,年化Alpha约7.8%。
- 供应链因子与传统基本面因子相关性极低,丰富了量化模型信息,提高了多因子策略的稳健性。
- RavenPack因子结合供应链特征提高盈利敏感指标(ESI)选股效果,信息比率提升55%,容量扩大6倍。

A股市场相关实证及因子应用 [page::21][page::22][page::23]

- 构造股价相关性网络、主营业务交叉网络及FactSet供应链数据,提取多个网络因子验证其对A股具有显著的选股能力。
- 供应链溢出效应因子基于下游客户营收增速加权构建,多空组合自2015年以来累计收益28%,权重优化后累计收益升至38%。
- 该供应链因子与ROE、PE、营收增速等传统基本面因子相关度低(相关系数均低于0.1),提供增量信息。

主题指数及ETF产品发展 [page::13][page::14][page::15]
| 指数名称 | 起始时间 | 主题 | 主要子主题 |
|----------------------------------|-------------|----------------|----------------------------------------------|
| iSTOXX FactSet Ageing | 2011.06.20 | 人口老龄化 | 医疗护理、老年人护理、旅游休闲、养老金等 |
| iSTOXX FactSet Automation & Robotics | 2011.06.21 | 自动化和机器人 | 产管理、汽车工业、视觉技术、人工智能等 |
| iSTOXX FactSet Breakthrough Healthcare | 2011.06.20 | 突破性医疗 | 生物技术、医疗设备、医疗软件 |
| iSTOXX FactSet Digitalisation | 2011.06.20 | 数字化技术 | 社交媒体、云计算、金融科技、电商 |
- 主题指数自2016年以来规模从1.3亿增至30亿美元,自动化与机器人主题指数表现优异,带动ETF发行快速增长。
- 黑石发行的iShares Automation & Robotics ETF规模达17.95亿美元,是全球规模最大的机器人主题ETF之一。

深度阅读
金融科技(Fintech)和数据挖掘研究(四)——FactSet供应链数据的介绍和应用
---
1. 元数据与概览
- 报告标题:金融科技(Fintech)和数据挖掘研究(四)——FactSet供应链数据的介绍和应用
- 作者:冯佳睿、余浩淼、张振岗(海通证券研究所金融工程团队)
- 发布日期:2019年7月
- 发布机构:海通证券研究所
- 主题:介绍FactSet三大供应链相关另类数据产品(RBICS深度行业分类、供应链数据、GeoRev地域营收数据),及其在投资分析、量化策略和事件驱动中的应用与实证。
- 核心论点:
- FactSet提供基于公司产品线、供应链关系及地域营收数据的结构化另类数据,在传统行业分类和财报数据基础上提供更丰富、更动态、更详尽的视角。
- 这些数据已广泛应用于主题指数构建、被动投资产品开发及量化投资策略中,具有显著实用价值和投资意义。
- 特别是供应链数据为事件驱动策略和因子投资开辟新方向,能捕捉传播效应和Alpha,且与传统因子相关性低。
- 风险提示:数据挖掘基于历史数据和模型,存在模型失效风险。[page::0,23]
---
2. 逐节深度解读
2.1 FactSet数据产品介绍
2.1.1 FactSet公司简介
FactSet是总部位于美国的金融信息服务供应商,具备38年的行业经验,拥有覆盖全球24个国家的60个办公室和9600多名员工,服务用户超过11.5万人,提供公司比较、产业分析、投资分析、风险评估等多维度数据和技术服务,业务持续创新发展。图1数字展示FactSet客户保留率、用户量、员工数及覆盖国家数量,彰显其行业地位和业务规模。[page::4]
2.1.2 FactSet深度行业分类(RBICS)
RBICS是FactSet独家开发的基于公司产品和服务的自下而上的分层行业分类体系,构建了6级固定层次行业结构,弥补传统自上而下行业分类(如标准行业分类SIC、NAICS等)粗略、信息量有限的不足。三大子产品:
- RBICS Focus:主营业务线识别(营收占比>50%);
- RBICS with Revenue:财报期各细分业务营收拆分;
- RBICS with Tradenames:产品及服务完整映射到行业分类。
利用系统+人工复核确保数据准确性,以苹果为例(图3、图4、图5),传统行业归类只体现在科技硬件等大类,难以反映公司多岛链、多样化产品线。RBICS能细分到iPhone智能手机制造等具体业务,明确业务线营收占比(iPhone占63%),极大丰富了行业认知的深度和精准度。该体系突破单一行业限制,支持公司在不同维度的多业务展示,适应经济全球化的产业动态。[page::4-7]
2.1.3 FactSet供应链数据
供应链数据建立公司间多维度关联关系,包含四类关系共13种,例如上游供应商(制造、授权等)、下游客户、竞争对手及战略伙伴(合作研发、合资、股权投资等)。它依托大数据技术和人工核验,从公司年报、公告、新闻、官网等公开渠道挖掘,力求覆盖全球市场,形成全视角关系网络。
以华为供应链为例(图9、图10),涵盖一级、二级供应商的全链条,列举重要客户地域及行业分布,供应链环节的深度和广度使得投资者能洞察供应链传导机制、发现潜在影响,利于风险管理和投资机会挖掘。该数据覆盖A股80%以上企业和中证800成分股95%以上,具有极大的研究价值和广泛应用前景。[page::7-10]
2.1.4 FactSet GeoRev 地域营收数据
GeoRev数据通过汇集和算法处理公司不同国家及地区的营收信息,为投资者提供公司在全球地理范围的营收分布视角。示例中三星的全球营收有大范围地域分布(图11),富时海峡时报指数公司也普遍如此(图12),仅本土营收占比约45.8%。
FactSet利用GDP加权等方法将不同公司的多维地域信息统一为标准区域分类,比较华为、苹果、三星等公司的区域收入差异(图13)。该信息对于分析公司地域风险敞口、理解宏观经济和地缘政治影响、评估未来增长潜力均极为重要。[page::10-11]
---
2.2 FactSet数据的应用
2.2.1 RBICS在资产管理和量化策略中的应用
- 行业细分与业务分析:A股金风科技例子(图14),通过RBICS识别其风机制造主营业务,同时检测出电力服务相关的多行业暴露。基于RBICS,可进行全球行业市场份额分析,如风力能源设备制造行业中,西门子、维斯塔斯和金风科技全球市场份额分布(图15)。
- 指数产品构建:FactSet与斯托克(Stoxx)、富时罗素、标普道琼斯等多家国际指数公司合作开发100+专题指数,资产管理巨头贝莱德(BlackRock)等以此为基础发行主题ETF(图16)。如4大主题人口老龄化、自动化机器人、突破性医疗、数字化技术,并细分子主题(表1)。索引构建流程标准严格,包括股票池范围、主营业务营收要求(>50%),市值流动性筛选及等权配置,确保主题暴露,个股分散。
基金产品自2016年以来飞速增长,截至2019年5月管理规模达30亿美元(表2-图19),其中自动化机器人主题ETF最受青睐(图18)。量化策略中基于RBICS的细分行业PE均值回复策略表现优于不设行业,统计显著性强(图20-21),表明细分行业归集有利于消除估值差异误差,提高策略效益。[page::11-16]
2.2.2 供应链数据的事件驱动策略
传统事件驱动研究关注直接事件影响,且冲击多在短期释放;基于供应链,事件影响可传播至上下游公司,且时间滞后,提供新的交易时机和Alpha空间。以A股应收账款关系分析发绩预增事件为例,受益公司股价滞后上涨(图22)。
华为遭受美国限制事件,导致其美系一级供应商股价大跌,A股中相关供应商亦受冲击(图23);反之,竞争对手公司成为潜在受益对象。供应链网络为事件驱动策略提供及时、有效的补充与延伸空间。[page::16-18]
2.2.3 供应链数据的因子投资策略
基于图论方法,提取供应链网络特征形成因子,如“度”(供应商/客户数量)、“中心性”(供应链中的节点重要性)和“溢出效应”(上游下游公司业绩动量传递),可显著产生Alpha收益(图24-25),且与传统财务因子相关性低(图26),有效增强多因子选股模型。
衍生因子如结合竞争对手信息、分析师盈利预期提升表现(图27),并延伸至ESG与信用风险因子构建。A股方面,基于股价相关性和主营业务收入构造的关系网因子均表现良好(表3-4),FactSet供应链数据因子基于下游客户营收增速的溢出效应收益显著,多空组合累计收益达28%,利用下游客户重要性的加权改进后收益提升至38%,与传统因子相关极低(图28-30),显示中国市场供应链因子潜力巨大。[page::18-23]
---
2.3 风险提示
- 数据挖掘基于历史先验数据和经验模型,模型本身可能失效,存在预测误差风险。
- 供应链关系和业务分类数据对企业披露依赖较大,数据质量和时效性对效果有一定影响。
- 量化策略需关注模型稳定性和市场环境变化带来的影响。[page::0,23]
---
3. 图表深度解读
- 图1 FactSet相关信息:公司客户保留率为95%、用户11.5万、员工9600+,覆盖24国家,表明客户规模大且全球服务能力强。[page::4]
- 图3-6 苹果公司RBICS分类示意及营收拆分:展示RBICS由顶层科技(Technology)至底层智能手机制造(Smartphone Manufacturing)6级结构,细粒度展示苹果主营及业务分布的清晰框架,iPhone业务为主,贡献63%营收,反映细致的主营业务划分及营收重要度。[page::5-7]
- 图7-10 供应链数据示意与华为供应链结构:供应链细化为供应商、客户、竞争对手及合作伙伴四类,涵盖多种实际业务关系。华为示例囊括了一级、二级供应商以及重要客户群,显示供应链网络的丰富性和层次性,有助于捕获供应链传导影响。[page::7-10]
- 图11-13 GeoRev营收地域分布:以三星、富时海峡时报指数及华为、苹果为例,揭示企业跨地区营收分布差异,反映产业全球化和收入来源多元化趋势,对评估区域风险暴露极为重要。[page::10-11]
- 图15 风力能源设备制造行业市场份额:西门子30%、维斯塔斯28%、金风8%,各自业务在公司营收占比差异显著,体现单一业务线市场地位与公司整体的复杂关系。[page::12]
- 图17-19 iStoxx FactSet主题指数净值与产品规模:主题指数整体跑赢MSCI全球指数,尤以自动化机器人为显著表现。基金规模从1.3亿增至30亿美元,表明投资者对主题化投资的关注和基金产品快速增长的趋势。[page::14-15]
- 图20-21 RBICS引导的PE均值回复策略:行业分类能提升估值均值回复策略的稳定性和收益,细分行业与公司数量权衡分析保证策略有效性,体现RBICS在量化选股中的重要作用。[page::16]
- 图22 业绩事件对供应链公司影响滞后:关联公司股价滞后反映事件影响,为事件驱动策略提供了时序空间,开展右侧策略交易的依据。[page::17]
- 图23 华为供应链事件驱动示例:显示上游美国供应商股价受限政策影响下跌,相关A股同业公司亦受影响,现场体现供应链数据的实际指导意义。[page::18]
- 图24-26 供应链因子设计与收益表现及相关性:度、中心性、溢出效应因子与传统因子相关度低,且具备持续Alpha能力,说明供应链网络特征挖掘为量化提供新信息源。[page::18-20]
- 图27 RavenPack供应链因子+ESI综合策略:结合供应链网络信息提升盈利敏感性,策略表现明显优于单一因子,支持融合型多因子模型的有效性。[page::20]
- 图28-29 FactSet A股供应链溢出效应因子表现:基于下游客户营收增速的因子多空组合累计收益达到28%,加权中心性后的因子累计收益提升至38%,具有显著的选股能力和投资价值。[page::22]
- 图30 供应链因子与传统指标相关矩阵:相关性极低,最大不超过0.1,进一步表明供应链因子提供独特的投资信号。[page::23]
---
4. 估值分析
报告未明确涉及估值模型,但在量化策略部分详述基于RBICS和供应链因子的多因子股价均值回复及Alpha生成逻辑。通过细分行业分类和供应链网络构建投资组合,实现对估值的行业中枢调整和关系网传播效应利用,提升估值判断的精度和收益。[page::15-16,18-23]
---
5. 风险因素评估
- 模型失效风险:数据挖掘和量化模型依赖历史先验,面对市场结构调整及政策变化风险。
- 数据质量限制:FactSet数据虽覆盖广泛,仍受限于上市公司信息披露完整性与时效性。
- 假设敏感性:供应链传播效应假设股价存在环节传导,实际市场波动可能存有非系统性因素。
- 策略执行风险:事件驱动和因子策略依赖高频数据和灵敏反应,实际操作中可能受交易成本、流动性影响。
报告明确提出风险提示,整体呈谨慎态度。[page::0,23]
---
6. 批判性视角与细微差别
- 报告强调FactSet数据优势和应用成果,虽未明显表现出强烈偏向,但作为FactSet数据推广文档,论述自然偏重于展示积极面,潜在的局限和不足略显低调。
- 供应链因子在中证800及A股表现良好,但IC和效果指标仍有限,例如IC值较低,表明信号强度有限,实际操作中需要更多验证。
- 对于RBICS行业分类的细化,过细的类别中公司数量可能不足,存在样本选择偏差,报告中的分层归并方法合理但实际应用需谨慎权衡。
- 供应链数据的时效性、更新频率对事件驱动策略表现影响较大,报告未详述数据更新机制,仍需关注实时性要求。
- 海通报告中对量化策略的实证多基于国外成熟市场,美股实证较为充分,针对中国市场的供应链因子研究仍为初步探索阶段,未来需更多实证和验证。
- 财务数据拆分和区域营收分布标准化的算法细节缺失,可能造成估计误差,投资者应读报时持谨慎态度。
概括来看,报告系统详实、论据丰富,但作为推广类研究,需结合实际市场策略验证和数据质量进一步判断应用价值。[page::4-23]
---
7. 结论性综合
本报告充分介绍了FactSet三大供应链相关另类数据产品——RBICS行业分类、供应链关系数据库和GeoRev地域收入拆分数据,详细讲解了其结构、数据来源及处理流程。
通过苹果、华为及韩国三星等案例,深刻阐释了RBICS如何实现自下而上的6层业务细分,为投资者剖析企业业务现状及行业布局提供精准工具;供应链数据覆盖全球多个关联维度(供应商、客户、竞争对手、合作伙伴),揭示企业经济关系网络;GeoRev数据则构建企业地域收入全景,便于识别地区风险和掌握增长动力。
基于这些数据,报告结合实证分析展示了多个应用方向:
- 行业研究与主题指数构建:RBICS支持按主营业务筛选公司,优化主题指数成分股,推动被动管理及ETF产品开发。
- 事件驱动策略:供应链数据揭示事件传播路径,赋予交易者时间优势,开拓传统事件驱动之外的新alpha来源。
- 因子投资:利用图论分析提取供应链网络特征因子,能获得与传统财务因子低相关、持续显著的收益提升。基于下游客户销售增长的溢出效应,验证了A股中供应链数据的强选股能力。
- 风险管理:GeoRev数据帮助全面评估企业区域暴露,提升地缘风险定价与投资组合构建的科学性。
整体而言,FactSet基于结构化供应链的另类数据极大丰富了投资者分析工具箱,连接传统财报和量价数据之外的信息盲区。海通证券报告深入浅出地展示了这些数据在全球及中国市场的实际应用和潜力。虽然存在模型依赖、数据质量、市场适用性等风险,供应链数据的广泛覆盖和科学构建为证券研究注入了新的研究活力,成为量化基本面探讨的重要素材。
建议投资者关注FactSet数据产品在中国市场的持续验证与拓展,结合传统因子及风控指标,利用供应链因子和业务细分数据,提升选股决策的全面性和预测精度,为实现Alpha提供多元数据支持和策略创新路径。[page::0-23]
---
附录
- 报告结构详见目录(页1),图表目录(页2-3),以及丰富的图示和表格文本说明均已涵盖上述内容。
- 风险声明及法律声明详见报告后部(页24-26),保证研究报告合规发布。
- 报告中涉及的联系人列表详尽,反映证券研究机构专业分工。[page::1-3,24-26]
---
总结
本报告对FactSet三大供应链相关数据的介绍和运用进行了全面细致的分析,重点剖析每类数据产品的结构及处理逻辑,结合丰富图示和案例展现应用价值。引申出行业分类和供应链网络对资产配置、量化策略的优化,并指出其模型风险与适用边界。整体立足实证和行业发展前沿,内容翔实且具有开创性,适用于专业投资人、量化研究员及机构策略开发人员深度参考。[page::全篇]