`

基本面量化视角下的大健康板块选股研究

创建于 更新于

摘要

本报告基于广义大健康板块,构建医药服务和医药制造与高科技两个子行业的量化选股因子,形成了Service_Sig和Tech_Sig复合因子。结合分析师研报标题的情绪因子,推出多层次选股策略。策略从2011年初至2020年中,年化收益率最高达37.5%,相对中信医药超额收益23%以上,且表现稳定突出。绩效归因显示大部分收益源自Alpha选股能力,文本情绪因子帮助策略优化持仓[page::0][page::6][page::15][page::20][page::21][page::33]

速读内容


1. 大健康板块构建与行业重构 [page::4][page::6][page::9][page::10]



  • 采用中信医药与申万医药行业分类成分股并集,增加67个相关大健康公司构成股票池,数量明显大于单一医药分类。

- 大健康板块指数表现与中信及申万医药行业极为接近,行业表现高度一致。
  • 医药行业细分复杂,按对创新研发重视,将板块拆分为医药服务及医药制造与高科技两大子行业,便于因子差异化开发。

- 补充细分行业特点与投资逻辑,考虑研发投入、专利、估值趋势偏离等关键维度。

2. 量化Alpha因子构建及有效性验证 [page::10][page::11][page::13][page::14][page::15][page::16][page::17]




  • 研发费用和专利数量作为创新投入和产出重要因子,结合误差修正模型构建的估值趋势偏离因子(基于市净率和市销率)。

- 结合传统选股因子(成长、情绪、价值等),在医药服务和医药制造与高科技板块分别筛选有效因子,构建两个复合因子ServiceSig和TechSig。
  • ServiceSig在医药服务行业因子IC均值0.08,分位多头年化收益34.1%,月胜率71.1%。

- Tech
Sig在制造与高科技板块因子IC均值0.062,分位多头年化收益28.1%,月胜率76.3%。
  • 因子跨行业验证支持行业差异化构建方法合理性。


3. 分析师研报文本情绪因子构建及作用 [page::17][page::18][page::20][page::21]




  • 通过人工提取正面和负面关键词,统计分析师研报标题情绪对标的未来收益影响,正面情绪对应未来正收益,负面情绪对应未来负收益。

- 情绪因子构建采用过去10-20天研报负面/正面关键词占比,经过离散化处理,正负情绪因子表现稳健。
  • 情绪因子覆盖股票数量有限,多用于筛选条件辅助优化选股池。


4. 量化选股策略设计及回测表现 [page::21][page::22][page::24][page::25][page::26][page::27][page::29]




  • 股票池涵盖重构后的大健康子行业,月度调仓,排除负面文本股票,主要对比加入文本筛选和不加入的策略表现。

- 定比选股策略(选取双行业因子排名前20%的股票)年化超额收益13.9%-13.5%,风险收益比1.49和1.61,超额稳健,表现优异。
  • 精选10只个股策略年化收益最高37.5%,超额收益23.4%,换手率59.5%,文本筛选略优。

- 精选20只股票策略更稳定,非文本策略年化收益31.8%,超额18.3%,加权策略(70%权重分配于头部5只)进一步提升风险收益比至1.71。
  • 持股数目减少时,策略收益和风险收益比均上升,表明因子Alpha信号在头部股票中更强。


5. 策略持仓行业及绩效归因分析 [page::30][page::31][page::32][page::33]




  • 持仓分布较为均匀,医疗器械占比近年提升,中成药占比下降,行业分布契合基本面与市场表现。

- Barra风格因子归因显示策略超额收益主要由残差贡献,市值和动量贡献较多,流动性等因素部分抵消。
  • Brinson绩效归因表明个股选择能力远超行业配置能力,是Alpha因子驱动效果良好的证据。

深度阅读

基本面量化视角下的大健康板块选股研究——深度分析报告



---

1. 元数据与报告概览


  • 报告标题: 基本面量化视角下的大健康板块选股研究

- 分析师: 徐寅
  • 发布机构: 兴业证券经济与金融研究院

- 报告时间: 2020年7月22日
  • 研究主题: 聚焦大健康板块,通过基本面量化选股方法,从广义大健康行业构建股票池,研发创新驱动因子,结合分析师研报文本情绪,构建高效量化选股策略。


报告核心论点:
  • 以中信医药 + 申万医药生物 + 其他相关公司构建大健康股票池。

- 细分为医药服务和医药制造与高科技两个子板块,构建差异化的因子体系。
  • 构建复合选股因子 ServiceSig 和 TechSig,分别对应两个板块,选股信号力强,年化多头收益均超28%。

- 融合分析师研报的正负面文本情绪信息,进一步优化策略。
  • 从2011年1月至2020年6月,策略年化绝对收益率37.5%,超越中信医药行业23.4%,表现稳健[page::0,4,15,16,17,20,21].


---

2. 逐节深度解读



2.1 引言与行业重构


  • 大健康被定义为广义的医疗健康体系,包括医疗服务及相关IT支持服务。核心基于中信和申万医药行业分类,加入其他相关公司,总计构成大健康板块股票池。

- 研究涵盖2011年1月-2020年6月,为期近十年,内容涵盖板块重构、因子构建、文本信息提取、量化策略搭建与性能分析。
  • 对比中信和申万医药行业成分股,两者重合度高但分类仍有差异,进一步拓展标的67家公司(其中部分归属食品饮料、农林牧渔等领域但业务涉及医药)。

- 股票池拓展后,大健康板块股票数目大于中信和申万医药,股价走势和收益统计指标均差异不大,说明大健康板块和传统医药行业走势高度一致,市场风险收益特征未发生本质改变(图表2、3、4)[page::4-6].

重点图表分析:


  • 图表1(申万医药326家公司、中信医药320家公司,其中311家重合,细小差异导致行业分类偏差,拓展67家公司以补充)

- 图表2(股票数随时间推移,申万和中信基本同步增长,大健康股票数量领先约50至70只,体现扩容)
  • 图表3(三个板块指数净值走势高度重叠,波动与回撤类似,板块扩容并未带来特征上的改变)

- 图表4(年化收益均约12%,波动率29%左右,风险收益比接近0.4)

2.2 医药行业特征与板块细分


  • 医药行业是一个极其复杂的行业集合,内部细分差异大,例如医药流通和创新药的商业模式和估值体系截然不同。

- 创新云研发驱动为核心,研发费用与专利构成衡量创新能力的主要维度,但研发投入大同时行业销售费用率极高。
  • 估值困难,故采用了时序估值因子策略而非单纯截面对比,规避估值多样化带来的偏差。

- 政策高度敏感,结合分析师研报情绪信号辅助选股[page::7,8].

行业细分:


  • 包含大宗原料药、CMO特色原料药、OTC、仿制药、创新药、医疗器械、医药流通、医疗服务、生物医药、中成药等七个细分子板块,分别具有差异化投资逻辑和指标体系。

- 例如仿制药通过一致性评价关键,创新药估值策略基于研发产出和投入效率,医疗器械侧重研发与品牌黏性,医药流通强调规模和高毛利率。
  • 针对各个特点设计解决方案,例如重构行业分类强调创新对研发的依赖,构建估值趋势偏离因子拓展估值信息维度[page::8,9].


2.3 行业重构及因子构建


  • 依据创新驱动差异,将大健康板块细分为“医药服务”和“医药制造与高科技”两块,前者包含原料药、医疗服务、医药流通(CXO、ICL业务划至后者),后者覆盖化学制剂、医疗器械、生物医药、中成药。

- 股票数目上医药制造与高科技板块明显更多。
  • 研发费用覆盖率上医药行业显著高于全市场,年报数据显示2011年以来覆盖率稳定在70%以上,有效支撑因子构建。研发费用除以市值作为创新投入指标。

- 专利作为研发产出指标,用最近三年授权的发明专利数除以营业收入,较好反映研发效率。
  • 估值维度,基于误差修正模型构建市销率、市净率倒数的估值趋势偏离度因子。

- 四个特异性因子构成本报告核心选股信号:研发投入、创新产出、市净率偏离、市销率偏离(见图表10)。
  • 传统选股因子中筛选价值、成长、质量、分析师情绪等93个因子,与特异性因子结合进行筛选(共计97因子备用)[page::9-13].


2.4 选股模型构建及因子有效性


  • 两个板块分别筛选有效因子并形成复合因子:医药服务板块的 ServiceSig 由7个因子组成,医药制造与高科技板块的 TechSig 由6个因子组成,两板块复合因子IC均值分别为0.081和0.062,说明具有效果显著的预测能力。

- 分位测试显示,ServiceSig最高分组年化收益达34.1%,月胜率71.1%;TechSig最高分组年化收益达28.1%,月胜率76.3%。
  • 复合因子在对应行业IC表现突出,跨行业应用时效果较弱,验证了行业重构与差异化选股因子设计的科学性(图表18-23)[page::13-16].


2.5 研报文本情绪因子


  • 医药行业政策敏感,新产品审批等事件能显著影响股价,且分析师研报标题作为快速反应的事件载体成为抓取情绪信息的窗口。

- 人工筛选分析超过5000篇研报标题,整理正面与负面词汇库,扩大负面词汇覆盖业绩滑坡等维度。
  • 样本回测显示,含负面词汇研报的股票未来短中期表现显著下跌,正面词汇对应股票呈正向收益趋势(图表24-28)。

- 研报文本情绪因子因形成与持有期设置,正负面因子经过四舍五入打分,形成标准情绪因子,成功捕捉投资胜率[page::17-20].

2.6 量化策略构建与效果测试


  • 策略基于重构后的大健康股票池,采用月度调仓,排除ST及涨跌停股票,上述复合因子进行选股票信号排序,搭配负面文本筛选剔除负面情绪偏股表现,在固定交易成本下进行回测。

- 策略分为定比例选股(选取20%排名最高的股票)及精选个股(分别选10只和20只股票,均等和部分权重配置方式)两类。
  • 定比选股策略下,加入文本筛选的年化超额收益13.9%,信息比1.49,明显优于基准12.1%收益;非文本版本13.5%,风险收益比更高。表现稳健且换手率适中(图表32-36)。

- 精选10只股票策略中,加入文本筛选策略年化收益高达37.5%,超额23.4%,夏普比率1.29,换手率59.5%,并稳定超越基准每年收益约10%,且波动和回撤相对可控(图表37-40)。
  • 精选20只股票策略表现同样亮眼,文本选股年化收益约30.4%,超额16.8%,非文本略优,文本因子在持股规模扩大时边际效应变弱(图表41-49)。

- 权重方案方面,前5大持仓给予7%权重、余下3%权重配置,提升风险收益特征。
  • 持股数量敏感性分析显示,随着精简股票数量,收益与风险收益比均提升,显示头部因子信息沉淀雄厚(图表50-51)[page::21-29].


2.7 持仓行业分布与归因分析


  • 策略持仓股票跨中信三级行业分布,分散但集中于医疗器械增长,传统中成药比例下降,与市场走势呼应(图表52-53)。

- Barra风格因子归因显示,策略收益主要来源于alpha因子,即复合选股因子贡献的剩余收益,动量与市值因素也贡献部分正超额收益,流动性等因素略带头寸负贡献(图表54-55)。
  • Brinson模型归因显示,策略主要超额收益来源为精准主动股票选择能力,行业配置能力较弱(图表56-57)。[page::30-33].


2.8 结论总结


  • 大健康板块涵盖医药服务与医药制造及高科技两个子行业,因板块差异建立差异化选股因子体系,研发创新是关键驱动力。

- 结合传统因子及情绪因子,构建了强选股能力的复合因子 ServiceSig 与 TechSig。
  • 量化选股策略具备优秀且稳定的收益表现,均优于行业基准,年化超额收益超20%。

- 选股表现源自有效的基本面信息捕捉和情绪动态融合,兼具市场敏感度和稳健性。
  • 后续将继续拓展至大科技、大消费板块提供量化研究成果[page::33].


---

3. 重要图表深度解读



图表1、中信医药与申万医药行业公司数量重合情况


  • 展示申万医药(326家公司)与中信医药(320家公司)股票组成的交集(311家)、两侧独家覆盖15+9家。

- 包含67家新拓展公司,用以补充两者未覆盖的关联医药业务公司,保证广义大健康覆盖[page::5].

图表2、三个行业股票数目时间序列


  • 大健康板块股票数量自2011以来持续增长且领先中信和申万医药,体现广义定义与扩容影响。

- 增长平稳,无异常波动,凸显数据完整性,表明策略覆盖范围稳健[page::6].

图表3、三个板块等权合成指数净值


  • 三个指数走势高度一致,说明扩容对整体市场表现影响有限。

- 大健康指数并未偏离传统医药指数趋势,进一步验证策略有效性空间在个股层次而非整体板块[page::6].

图表4、三个板块指标比较


  • 年化收益率均维持12%左右,波动30%范围内,最大回撤达50%。

- 风险收益比相近,进一步说明股票池增大并未带来整体回报率提升或降低风险特征[page::6].

图表9、医药行业研发费用数据覆盖度


  • 医药行业研发覆盖率自2009年50%起步,2011年后超过70%,明显优于全市场。

- 高覆盖率保证研发费用因子数据完整,适合作为创新驱动核心因子。
  • 物料数据显示研发费用对企业的重要战略地位[page::11].


图表10、特异性因子总结


  • 汇总四个特异性因子,从研发费用、专利产出到误差校正模型下的估值因子(BPDR、SPDR),形成创新与估值双轮驱动框架。

- 突出市值与营业收入规模剔除,保证因子对跨公司、跨行业的可比性[page::12].

图表18、ServiceSig和TechSig因子IC及统计量


  • ServiceSig在医药服务板块平均IC为0.081,T值5.57,表明因子稳定显著,能够有效捕获股票收益。

- Tech
Sig平均IC为0.062,T值6.19,同样表现优异。
  • 统计学验证复合因子显著性与不可随意获得性[page::16].


图表19、ServiceSig分位数多头年化收益


  • Top分位数组合年化收益高达34.1%,夏普比率1.06,换手率91%,最大回撤32.7%。

- 显示最高因子分组收益稳健且波动特征良好,选股信号强。多头胜率71.1%反映策略准确率高[page::16].

图表20、TechSig分位数多头年化收益


  • Top组合年化收益28.1%,夏普0.91,换手率77.1%,最大回撤39.2%,与ServiceSig差异体现两个板块选股策略差异。

- 胜率76.3%说明医疗制造与高科技行业内因子稳定且选股效果更均衡。
  • 净值曲线(图表22)平滑升高体现策略持续价值创造[page::16-17].


图表24、正负面词汇举例


  • 正面词汇多为“获批”、“审批”、“批准”等新药或政策利好关键词。

- 负面词汇包括“下滑”、“风险增加”等,多涉及业绩恶化、市场风险。
  • 词汇库覆盖广泛并侧重针对主题事件和市场情绪两大方面[page::18].


图表25-30、情绪词汇对股价表现影响(短中长期)


  • 负面研报数量越多,未来股价表现越差,正面研报相反。

- 效应在不同持有期(1、5、10、20日)均有效,表明研报情绪对股价影响存在持续效应。
  • 事件驱动框架有效捕获政策与业绩驱动的投资机会[page::18-20].


图表31、过去20天有正负面研报公司数及趋势


  • 正负面情绪覆盖股票均约20-40只波动,覆盖率较低,适合作为筛选条件而非核心持仓因子,避免因覆盖率不足导致样本偏差。

- 数目变化对应行业事件波动,反映市场对研报情绪敏感度[page::21].

图表32-36、定比选股策略表现和持仓数目


  • 加入文本筛选的策略与不加入均显著优于基准,月度多头收益超24%,超额收益13%以上。

- 加入文本筛选策略持仓股票少约5只,换手率略升,说明文本筛选起到过滤劣质标的的作用,策略更“精致”[page::22-23].

图表37-40、精选10只个股策略表现


  • 基于文本筛选的10只股票策略年化收益37.5%,超额收益23.4%,表现优异且时序稳健。

- 回撤与波动率水平适中,换手率59.5%,说明组合风险控制良好。
  • 净值曲线显示强劲趋势性上涨,且显著跑赢基准[page::24-25].


图表41-49、精选20只个股策略敏感性及策略表现


  • 文本筛选优势随着持股数扩大而减弱,因覆盖率限制,实证中非文本筛选表现更优。

- 等权和加权73权重方案均表现佳,加权前5权重7%,后5权重3%,纳入关注度差异,提升风险调整收益比。
  • 精选20只股票非文本策略年化收益31.8%,超额收益18.3%,风险收益比1.70,稳健且具吸引力[page::26-28].


图表50-51、持股数目敏感性分析


  • 随着每个子行业精选股票数量下降,年化收益与夏普比均提升,最大选择性收益集中在头部因子。

- 说明Alpha因子稳定性强,可在更小的股票池深度挖掘亮点[page::29].

图表52-53、持仓行业分布及表现


  • 策略持仓行业均匀覆盖医药细分板块,但近年医疗器械比重上升,中成药权重下降。

- 净值曲线中医疗器械表现最强,符合行业成长性与创新空间[page::30-31].

图表54-57、Barra及Brinson归因


  • Barra模型超额收益解释中,残差部分占据主导,说明选股模型提供了大量“独立alpha”,而非市场或行业风格暴露。

- 动量与市值因子对策略收益贡献正面,而流动性与波动率贡献负面。
  • Brinson分解显示,行业配置贡献有限,选股贡献为超额收益主力,验证选股因子有效性[page::31-33].


---

4. 估值方法与风险因素



本报告虽未详述DCF等估值模型,但引入创新性的时序估值因子(BP
DR、SPDR),基于误差修正模型衡量估值偏离度和趋势,实现相对估值的动态调整。此法规避了医药行业传统估值模型难适用的问题,增强估值信息的有效性和稳定性[page::12]。

风险方面,报告最后附录明确提醒存在模型基于历史数据、市场环境变化可能导致失效风险,政策敏感性依旧是医药行业显著风险点。此外,文本信息覆盖率有限,信息捕捉存在时滞与不完全风险。模型风险依赖于历史数据完整性与因子稳定性,策略换手率及交易成本也可能影响净表现[page::35]。

---

5. 批判性视角与细微差别


  • 报告创新点在于结合医药行业创新特征构建差异化的选股因子及利用分析师文本情绪作为辅助筛选,整体逻辑清晰且建立在扎实基础上。

- 文本情绪因子覆盖率不足,导致其作为筛选条件时效用有限,在样本不足情况下可能存在过拟合风险。
  • 医药行业政策不确定性突出,且估值波动大,时序估值因子的有效性虽被实证支持,但长期稳定性仍待进一步验证。

- 细分行业划分“两大板块”较为粗放,部分子行业内部差异仍显著,未来细分及层级分类可能提升模型精度。
  • 估值风险与研发投入风险未深入单独剖析,虽然有因子覆盖但可能忽略中长期策略风险。

- 无提及对宏观经济变化、突发公共卫生事件的敏感性,如2020年疫情对医药板块影响[page::7-9,35].

---

6. 结论性综合



本报告系统构建了大健康板块量化选股体系,基于中信医药及申万医药行业基础股票池扩容,创新地拆分医药服务与制造高科技两大子行业,针对性开发以研发费用、市值调整研发产出和创新估值偏离度为核心的差异化特异性因子。综合传统价值成长类因子构成复合选股因子Service
Sig与Tech_Sig,展示出极强的预测力量及稳健的投资表现。

融合分析师研报标题的正负面文本情绪因子,为选股策略注入政策与业绩信息的增量解读能力,通过文本筛选进一步优化组合,减少潜在风控事件持仓。定比例选股和精选小盘股票策略均表现出年化超额收益10%-23%以上的卓越能力,换手率适中,风险收益比优于行业基准。

策略持仓行业分布合理,医疗器械占比提升符合板块成长逻辑。绩效归因结果表明核心Alpha形成于精选股票的主动选股能力,行业风格配置作用有限。整体而言,该量化策略具备扎实基本面驱动力,结合信息加工,风险控制符合行业特征,适合长期追踪与持续优化。

后续研究可加强对文本覆盖率的突破,深化多层级行业细分,完善对宏观和系统风险响应的模型集成,以提升策略适应性和多因子稳定性。作为兴业证券金融工程对大健康板块量化研究的首篇,此报告为系列后续发展奠定坚实基础,具有高度实用价值及行业前瞻洞察力[page::0,33].

---

参考文献及溯源页码标注


  • [page::0,4,5,6,7,8,9,10,11,12,13,15,16,17,18,20,21,22,23,24,25,26,27,28,29,30,31,32,33,35]


---

整体来看,本报告内容详尽,逻辑严谨,数据真实可信,方法创新性强,为大健康板块提供了一套具有显著优异绩效的基于基本面和文本情绪融合的量化选股框架,具备较高的投资和研究参考价值。

报告