专利数据中有哪些 Alpha?——多因子系列报告之三十一
创建于 更新于
摘要
本报告围绕专利数据构建多种因子,尤其聚焦发明授权专利数量及关联人总数因子的选股能力。发明授权专利因子在制造业、TMT等板块表现优异,1年期发明授权专利数量因子年化超额收益达9.84%,信息比1.13,并成功应用于中证500指数增强策略,实现年化超额收益4.20%。结合研发费用的研发效率因子稳定性较弱。报告明确不同专利类型、统计时长对因子表现的影响,为量化投资提供有效alpha来源。[page::0][page::3][page::5][page::11][page::18]
速读内容
专利数据背景及类型介绍 [page::3][page::4]

- 2010-2019年间A股公布专利数量大幅提升,研发费用公布公司数量同步增长,反映研发重要性抬升。
- 主要专利类型包括发明专利(含发明授权与发明公布)、实用新型专利及外观设计专利。
- 发明授权专利为含金量最高的专利类型,法律效力强,关注度最高。
专利覆盖度与行业分布 [page::5][page::6][page::7]


| 行业 | 发明公布覆盖度 | 发明授权覆盖度 | 实用新型覆盖度 | 外观设计覆盖度 |
|------|----------------|----------------|----------------|----------------|
| 机械 | 73.16% | 63.84% | 75.71% | 33.62% |
| 电子 | 70.95% | 63.49% | 67.63% | 24.90% |
| 汽车 | 65.82% | 53.16% | 69.62% | 30.38% |
| 家电 | 65.71% | 57.14% | 71.43% | 58.57% |
- 制造业及TMT板块专利覆盖度较高,发明授权专利覆盖较广,金融板块等覆盖较低。
- 广东、北京省份专利数量领先,部分中西部省份覆盖率较高。
量化因子构造与回测框架 [page::8][page::9][page::10]
- 构建90个专利因子,维度涵盖专利数量、摘要字数、IPC号总数、关联人总数等,统计时长包含1年、2年、3年。
- 测试股票池涵盖16个专利覆盖高的中信一级行业,行业和市值中性化处理月度调仓。
- 主要IC指标和多头超额收益率用于因子有效性检验。
主要专利因子表现总结 [page::11][page::12][page::13]


| 因子名称 | IC均值 | ICIR | 多头年化超额收益 | 信息比 |
|--------------------------|---------|-------|-----------------|--------|
| Factorfmsq1Ynum | 3.39% | 0.29 | 9.84% | 1.13 |
| Factorfmsq1YrelatedCompanies | 3.50% | 0.29 | 12.7% | 1.08 |
- 1年期发明授权专利数量因子表现优于其他专利类型,稳定且换手率低。
- 关联人总数因子超额收益略高但稳定性较弱。
- 不同行业表现有差异,基础化工、机械、电子、汽车等行业优异。
研发效率因子表现 [page::14][page::15]


- 以研发费用/发明授权专利数构建的研发效率因子为负向因子,体现研发投入产出效率。
- IC和ICIR较低且近年表现波动,稳定性不如前两类因子。
- 该因子在医药、机械、建筑等行业表现较好。
专利因子应用于中证500指数增强 [page::16][page::17][page::18]

| 年份 | 月度胜率 | 年化收益率 | 年化波动率 | 年化超额收益率 | 信息比 |
|------|----------|------------|------------|----------------|--------|
| 2013 | 75.0% | 30.02% | 24.21% | 11.01% | 2.19 |
| 2015 | 66.7% | 50.96% | 51.97% | 8.50% | 0.90 |
| 2017 | 75.0% | 7.01% | 16.88% | 12.03% | 3.22 |
| 总计 | 61.47% | 5.66% | 29.14% | 4.20% | 0.83 |
- 利用1年期发明授权专利数量因子进行中证500增强,取得稳定超额收益,信息比0.83。
- 因子覆盖度达到62%,在制造业及TMT行业表现尤佳。
- 大部分年份实现跑赢基准,证明专利数据因子可作为有效alpha来源。
风险提示 [page::0][page::19]
- 报告基于历史数据和模型,存在模型失效风险,历史表现不代表未来。
- 专利数据覆盖度及行业差异需关注,因子表现存在波动性。
深度阅读
报告详细剖析:《专利数据中有哪些 Alpha?——多因子系列报告之三十一》
---
1. 元数据与概览
- 标题:《专利数据中有哪些 Alpha?——多因子系列报告之三十一》
- 作者与发布机构:周萧潇、刘均伟,光大证券研究所
- 发布日期:2020年(具体日期未明确,但回测数据截止至2020年3月31日)
- 研究主题:通过企业专利数据构建多种专利因子,评估其在特定股票池中的预测能力和选股能力,探索专利数据能否为股票投资提供Alpha(超额收益)
- 报告核心观点:
- 利用发明授权专利数量及关联人等专利指标能有效预测相关制造业、TMT等板块股票回报
- 构造的因子在中证500增强策略中实现年化4.20%的超额收益,信息比0.83,表明专利数据具有一定的Alpha能力
- 结合研发费用构造的研发效率因子虽然逻辑合理,但其表现和稳定性相对较弱
- 主要结论:发明授权专利相关的因子尤其是数量因子及关联人数量因子预测能力较强,可实际用于投资组合构造,专利数据因子是一个有效的基本面强化工具[page::0,3,10,18]
---
2. 逐节深度解读
2.1 研究背景与专利数据现状(第3-7页)
- 核心论点:
- 企业研发能力是判断公司“硬实力”的关键因素,专利作为研发成果的核心体现,其数量和质量是企业技术创新能力的关键衡量指标
- 近年来中国在专利申请及研发投入上增长迅速,数据显示2010年到2019年间A股专利总数增至近4倍,公布研发费用公司数也几乎翻倍,反映出上市公司科研投入持续加码
- 专利数据来自通联数据库,分为发明专利(授权、公布)、实用新型和外观设计三种类型,其中发明授权专利代表最高含金量
- 制造业和TMT板块拥有较高的专利覆盖度,尤其是机械、电子、通信、电力设备、新能源、汽车、家电、计算机、基础化工等行业覆盖度超过70%,金融及部分行业覆盖度极低
- 关键数据及含义:
- 图1显示专利数量及研发费用公布公司数的年度增长趋势,强调研发和专利作为创新与成长引擎的重要性
- 图3及表1展现行业专利覆盖度差异,反映专利因子应用的行业适用性必须有筛选,聚焦专利覆盖率高的行业为后续因子测试数据池提供基础
- 各省份图(图4)反映广东、北京等经济科技发达地区大量专利积累,地域创新分布不均
- 表2列出专利累计数量最多的40家公司,行业集中体现在石油石化、家电、汽车、电子等,体现行业研发投入强度和创新领先度[page::3-7]
2.2 专利因子构造(第8-9页)
- 构造维度与方法:
- 主要因子维度包括:专利数量(num)、专利摘要字数(briefnum)、IPC号数量(IPCnum)、关联人数量(relatedCompanies)、审查期总长度(reviewDate)、独权专利数量(ownPatent)
- 维度设计旨在全面评估专利的数量、技术复杂度、引用广度及研发投入资源
- 因子统计采用不同时间窗口(1年、2年、3年)平衡长短期信息价值
- 命名规则详尽,方便因子系统化编码和测试,如Factorfmsq1Ynum表示1年内发明授权专利数量因子
- 逻辑支撑:
- 研发投入的产出以专利体现,摘要字数及IPC数量体现专利技术含量和多面性
- 关联人数量反映研发资源广度,审查期长短体现专利技术审核难度,独权专利说明技术的专属性,有助于捕捉研发效率和独特竞争优势
- 因子数量丰富,涵盖了专利数据的多个面向,为捕捉潜在Alpha创造条件[page::8-9]
2.3 因子预测能力分析(第10-16页)
- 发明授权专利数量因子(Factor
- 在16个重点制造业及科技行业内测试,IC均值约3.39%,ICIR为0.29,显著高于实用新型和外观设计专利因子
- 1年期统计窗口略优于2年和3年,表明市场对近期研发成果更敏感
- IC序列显示2011-2016表现较强,2017-2018有波动,但整体仍保持预测能力
- 多头超额年化收益达9.84%,信息比1.13,低换手率表明策略成本较低
- 分行业优势集中在基础化工、机械、电子和汽车行业,ICIR均大于0.3,代表较好预测稳定性[图5、6,表5、6、7,page::10-11]
- 发明授权专利关联人数因子(Factorfmsq1YrelatedCompanies)
- 预测能力稍优于数量因子,IC均值3.50%,ICIR同样为0.29,年化超额收益12.7%,尽管超额收益波动较数量因子高
- 反映研发投入人力规模,可视作企业研发资源投入强度的衡量
- 行业表现与数量因子相似,基础化工、机械、电子、汽车行业表现最强[图7、8,表8、9,page::12-13]
- 研发效率因子(FactorRDfmsq1Y,研发费用/发明授权专利数)
- 理论上此因子应为负向因子,即研发费用花费较少表明效率较高
- 测试结果表现不佳,IC均值为-1.23%,ICIR仅-0.20,且IC序列自2017年后显著回撤,稳定性较差
- 多头超额收益年化12.0%,不过波动性也较高,信息比仅为0.71
- 分行业表现不均衡,医药、机械、建筑等行业较好,新能源、通信等行业表现平淡
- 表明单靠投入产出比对研发效率定量评价缺乏稳定的市场认可度[图9、10,表10、11、12,page::13-16]
2.4 中证500增强策略应用(第16-19页)
- 行业覆盖度说明:
- 截止2019年底,中证500股票中约62%公司拥有专利信息,专利数据主要覆盖计算机、电子、通信、建筑、汽车、钢铁等制造业及TMT行业
- 增强策略设计:
- 应用1年期发明授权专利数量单因子,按光大证券既定指数增强框架构建优化模型,支持行业中性及风格因子暴露限制,个股权重上限1.5%
- 回测周期2011年至2019年,手续费设为双边0.3%
- 策略表现:
- 年化超额收益4.20%,信息比0.83,相对波动5.08%,风险控制良好
- 策略大多数年份跑赢基准,特别是2013、2015、2017年表现突出
- 最大回撤概览,策略最大回撤-54.47%,相较基准优势明显
- 结论:
- 切实验证专利数据因子能为投资组合带来稳定Alpha贡献,尤其适合制造业及科技板块强化投资[图11,表13-15,page::16-19]
2.5 风险提示(第19页)
- 报告明确表述所有因子和增强策略均建立在模型及历史数据基础上,存在失效风险
- 历史表现不代表未来,还需关注模型更新和市场环境变化可能导致策略表现波动[page::19]
---
3. 图表深度解读
- 图1(第3页):
- 展示2010-2019年A股市场专利数量(左轴)及研发费用公布公司数(右轴)逐年增长,整体趋势向上,体现研发和创新成为市场关注核心。
- 图2(第4页):
- 专利类型结构图,分为发明专利(授权和公布)、实用新型、外观设计,发明授权专利权重最高。
- 图3(第5页):
- 行业专利数与行业专利覆盖度,机械、通信、电子领先,高覆盖行业专利创新活跃度高。
- 表1(第5-6页):
- 行业专利覆盖度细分,提供不同类别专利(发明授权、公示、实用新型、外观设计)覆盖率,支持分行业筛选。
- 图4(第7页):
- 各省份专利数量及覆盖率,北京、广东遥遥领先。
- 表2(第7页):
- 前40家专利量公司集中于石油石化、家电、汽车、电子等热点行业,反映行业创新领先公司名单。
- 表3(第9页):
- 专利因子命名规则及含义,帮助理解后续因子体系。
- 表4(第9页):
- 因子回测框架细节,数据区间、股票池、调仓频率及分组方法。
- 表5与表6(第10页):
- 各专利类型因子统计表现,发明授权专利因子IC均值最高;不同统计周期指标表现略有差异。
- 图5与图6(第11页):
- 发明授权专利数量因子IC序列波动及多头收益累计曲线,说明因子稳定性及高alpha表现。
- 表7(第11页):
- 按行业划分的ICIR,彰显因子在重点行业尤其基础化工、机械、电子等表现最优。
- 表8(第12页):
- 发明授权衍生因子预测指标,关联人数量因子表现突出。
- 图7、8(第12页):
- 关联人数量因子IC序列及多头超额收益曲线,走势与发明授权数量因子类似。
- 表9(第13页):
- 行业ICIR分布,关联人因子在基础化工、机械、电子行业效果最好。
- 表10与表11(第14-15页):
- 研发效率因子的回测框架及性能指标,表现不佳但有参考价值。
- 图9与图10(第15页):
- 研发效率因子IC值及多头收益,体现该因子负向预测力量及尾部疲软。
- 表12(第15页):
- 研发效率因子行业表现多为负值,需谨慎使用。
- 表13(第16页):
- 中证500成分股各行业专利覆盖度,说明专利因子可应用范围。
- 表14(第18页):
- 指数增强模型参数设置,保障应用有序风险受控。
- 图11(第18页):
- 增强组合净值对比基准,中证500增强效果显著。
- 表15(第18页):
- 年度收益明细,多数年份超额收益正向,验证策略有效性。
- 表16至21(第19-21页):
- 90个专利因子详细IC、IR及胜率参数,展示多样因子表现,做因子选择基础。
---
4. 估值分析
- 报告并未直接涉及传统估值方法(如DCF、市盈率等),主要聚焦专利数据因子的预测能力及回测收益表现
- 因子回测框架中运用收益率秩相关(IC)、ICIR(信息比率)、超额收益等指标评估因子和策略有效性
- 中证500增强采用目标函数最大化因子收益、结合多因子暴露、行业和成分股权重限制的组合优化模型(约束包括权重上下限、风格暴露限制、行业暴露范围等)
- 该模型主要输入为个股因子评分,将因子信号转化为组合权重,实现收益最大化
- 优化模型参数具体化(如个股权重上限1.5%,手续费双边0.3%等)增强模型实操指导性[page::17-18]
---
5. 风险因素评估
- 因子测试和组合回测依赖历史数据和回测模型,存在模型过拟合、数据偏差导致未来失效风险
- 专利数据覆盖行业有限,尤其金融、服务行业专利数据匮乏,因子适用范围有限
- 研发效率因子表现不稳,结合研发费用的测算复杂,对数据披露完整性依赖较大,可能受到财务数据延迟或调整影响
- 市场环境变化及专利政策法规调整可能影响专利技术价值体现
- 报告未详述缓解策略,提示模型失效风险需持续跟踪调整[page::0,19]
---
6. 批判性视角与细微差别
- 报告聚焦专利因子内部回测表现,未结合外部宏观变量、竞争态势等多维度分析,存在单因子过度依赖风险
- 研发效率因子回撤明显,提示研发费用对专利数量的简单线性关系可能不足以反映真实效率,应结合更多质量维度或动态调整
- 分行业因子表现差异显著,尤其国防军工等部分细分行业表现欠佳,提示行业异质性对因子适用性的限制
- 报告假设专利“含金量”等价于技术价值,但未深入讨论专利惯用策略、专利重复申请及专利生命周期影响,影响因子稳定性
- 组合回测中以等权加权、无交易费用假设简化计算,实际操作中成本和流动性影响有待进一步量化分析
- 缺少对因子多因子融合、去相关化和风险调整的深入探讨,未来研究方向可拓展[page::0,13,19]
---
7. 结论性综合
本报告基于通联专利数据库,深入挖掘和构建了90多种专利因子,首次系统评估了专利数据因子在制造业及TMT等专利覆盖度较高的行业内的预测能力,并测试了因子在中证500增强策略中的应用价值。
- 专利类型揭秘:发明授权专利作为含金量最高的专利类型,数量因子(Factor
- 数据的时间窗口优选:1年统计周期优于2年和3年,说明投资者更关注公司最新的研发成果,历史过旧专利贡献减少
- 研发效率因子表现逊色:将研发费用与发明授权专利数量比值构成的效率因子虽有逻辑合理之处,但在预测能力和稳定性方面均表现弱势,表明研发效率难以通过简单财务数据量化,无需作为主要因子
- 行业适用范围界定:专利因子在基础化工、机械、电子、汽车等行业表现突出,行业内ICIR多在0.3以上,行业细分显著,金融及消费品行业覆盖和表现有限
- 策略应用验证:将1年期发明授权专利数量因子应用于中证500的指数增强策略,回测期(2011-2019)取得年化4.20%超额收益,信息比0.83,验证专利因子作为Alpha来源的有效性
- 风险提示及建议:模型依赖历史数据存在风险,专利质量及政策变化影响不确定,研发效率等指标波动大,需结合实际交易成本进一步优化
综上,报告清晰地展示了专利数据,尤其是发明授权专利的数量及衍生数据为构建股票投资因子带来可观的Alpha潜力。以发明授权专利数量因子为核心的专利因子体系,已在主要制造业和高科技行业中显示出良好的预测能力和选股效果,且能稳定地增强指数型投资组合表现。未来研究可在因子融合、多因子模型优化及专利质量衡量上持续深化,进一步提升专利数据在投资决策中的价值[page::0-21]。
---
附:报告中关键图表示例展示
图1 全市场A股每年公布的专利数量及年报中研发费用公布公司数(单位:例、家)

图示技术研发热情逐年提升,专利申请总量稳步增长伴随研发费用披露公司数逐年攀升。
图5 Factorfmsq1Ynum 因子IC序列

该因子IC值呈波动态势,体现了其在不同历史时间的预测能力起伏。
图11 Factorfmsq_1Y 因子中证500增强组合表现

该增强策略净值明显跑赢基准指数,验证专利因子应用落地效果。
---
参考文献与数据来源
- 通联数据,光大证券研究所
- 报告正文与附录数据、图表详情[page::0-21]