专利因子在量化选股中的运用
由hxgre创建,最终由qxiao 被浏览 423 用户
旧版声明
本文为旧版实现,仅供学习参考。
https://bigquant.com/wiki/doc/demos-ecdRvuM1TU
近年来,随着市场对专利的关注度逐渐上升,基于专利数据的指数与基金产品逐渐增多。使用了专利数据的相关指数包括专利领先、创业专利、深创100 、央企创新驱动指数000861等,相关基金总规模超 100 亿元。本文将基于平台的专利数据库进行深入研究。
Bigquant平台共计收录了486个专利因子。专利数据可分为发明专利、实用新型专利、外观设计专利三大类;专利状态包括:专利申请、专利公开、实质审查、专利授权几个流程;专利数据指标包括数量、说明书总字数、权利要求总项数、独权总项数、附图总数、摘要总字数、IPC 分类号总数、寿命加总、专利审查期加总、前引、后引、非专利方面引用、同族专利共计 13 种指标。从上述三个维度,共计构建了82个基础数据,再结合时间维度,衍生出共计486个专利因子。
专利数据具有较强的行业和市值属性。在申万31个一级行业上,本文统计了专利数据的覆盖度,剔除“非专利属性”的行业,包括:银行、传媒、综合、交通运输、非银行金融、房地产、商贸零售、社会服务。同时,行业龙头凭借其优势会发布更多的专利,市值越大的公司,专利数据普遍更多。因此,单因子选股可能有失公允,会使投资组合暴露在其他相关因子下。
不同的专利数据蕴含的价值信息不同。由于专利数据,尤其是基础专利类型,具有较强的行业和市值属性,其并不能反映公司真正的创新能力。但是,对于部分专利类型来说,比如海外同族专利,由于其申请更难、费用更多,企业只有将真正有价值的创造发明在海外二次申请专利,也能反映公司真实的创新能力,其回测效果在整个486个因子中表现也更好。
本篇作为“专利因子研究”系列的开篇之作,将重点放在专利数据的分析上,对全部486个因子进行排序回测检验。后续,我们会对专利因子进行更加深入的研究,包括:中性化后处理、大类因子合成、结合其他因子、机器学习模型的应用等。