【研报分享】东北证券:基本面因子研究:一种分析方法

基本面因子
标签: #<Tag:0x00007fc0677d5788>

(chau) #1

基本面因子研究:一种分析方法

摘要

在本报告中,通过设定因子生成规则而非具体指标逻辑,以三张财务报表科目指标作为输入变量,批量构建了基本面因子。

对于基本面因子选股,通常的思路是基于经济理论和财务指标进行因子构建,然而这种方法得到的指标是比较少的。且在因子库已经比较庞大的情况下,思路往往会受现有信息的影响。在此种情况下,如果更多关注因子生成规则,而非单个因子的生成逻辑或指标之间的关联,或能得到一定的增量信息。

基于此,我们以19个资产负债表指标、10个利润表指标和9个现金流量表指标作为输入变量,构建了7种因子生成规则:X、%D(X)、X/Y、D(X)/Y、%D(X/Y)、%D(X)-%D(Y)和(X-Y)/Z,批量进行了基本面因子的构建。

对于第一种因子生成规则X,所得38个因子的IC均值为5.83%,最大值为7.37%,且均是显著异于0的。从年化收益来看,表现最好的5个因子是支付的各项税费、所得税、营业利润、资产总计和净利润因子,相对中证500年化超额收益分别为24.56%、24.08%、23.78%、23.44%和23.35%,Sharpe分别为2.236、2.303、2.274、2.056和2.227,整体表现较好。单边月均换手率为20%左右,整体较低,交易费用对组合收益影响较小。

对于后6种剔除量纲影响的指标,部分因子也有较好的表现,不过整体收益走势较为一致:2017年之前,相对基准可以取得较为明显的超额收益,2017年回撤较大,近期有所回升。从走势来看,这几类因子与小市值有较为密切的联系。

在本报告中,通过设定因子生成规则而非具体因子逻辑,我们对基本面因子进行了批量研究分析。

1 研究出发点

对于基本面因子,我们更关注其是否有经济含义,与股票未来表现是否存在逻辑上的关联。为此,从方法论上来看,是基于相同的问题,生成一种或多种有效的解。一般来说,生成一个问题的解是比较困难的。例如,给定一个数13717421,判断其是否能写成两个数的积,与验证3607乘以3803是否可以得到该值,难易程度是差别比较大的。与此类似,先生成一个逻辑,然后进行验证,逻辑的构思相比于验证更为困难。

对于基本面因子选股,通常的思路是基于经济理论和财务指标进行因子构建,然而这种方法得到的指标是比较少的。在没有先验信息的情况下,往往不会将两个变量联系起来。在学术界,对于异常收益现象,也通常是在观测到某一现象之后,开始寻找其逻辑来源,并对其进行持续跟踪或样本外检验。

在现有因子库已经比较庞大的情况下,我们的思路往往会受现有信息的影响。在此种情况下,如果更多关注因子生成规则,而非单个因子的生成逻辑或指标之间的关联,或能得到一定的增量信息。在这种分析方法下,对生成的指标进行回测,然后从中筛选出表现较好的指标,对其逻辑及样本外表现进行分析和观测。如果一些因子在样本外也有较好的表现,且可以发掘其本身的经济含义,则可以将其纳入现有模型中。

在后面的部分中,我们将对因子生成规则和涉及指标进行介绍,并给出回测结果。

2 研究方法

在这一部分,我们对使用到的指标和因子生成规则进行说明。具体来说,我们从资产负债表、利润表和现金流量表中筛选出覆盖度较高的指标,然后通过有较强逻辑含义的计算规则,批量得到基本面因子。

2.1 财务指标

在本报告中,我们使用到的指标来源于资产负债表、利润表和现金流量表的基础科目指标,未使用衍生数据。在选取指标时,以覆盖度作为标准,共筛选得到19个资产负债表指标、10个利润表指标和9个现金流量表指标,具体如下:

资产负债表:资产总计(asset)、所有者权益合计(equity)、固定资产(fasset)、应交税费(taxpay)、负债合计(tot_liab)、未分配利润(undpro)、应付职工薪酬(empay)、无形资产(intasset)、货币资金(monecap)、流动资产合计(tcasset)、非流动资产合计(tncasset)、流动负债合计(tcliab)、应付账款(acctpay)、预付账款(prepay)、应收账款(acctrcv)、递延所得税资产(defasset)、预收账款(advcust)、存货(invent)、非流动负债合计(tncliab)。

利润表:营业总收入(operrev)、营业总成本(opercost)、营业利润(opprofit)、净利润(nprofit)、管理费用(gaexp)、营业外支出(nonoperexp)、所得税(tax)、营业外收入(noperrev)、财务费用(finexp)、销售费用(sdexp)。

现金流量表:销售商品、提供劳务收到的现金(cashrs)、收到的税费返还(recptax)、购买商品、接受劳务支付的现金(cashrec)、支付给职工以及职工支付的现金(cashempl)、支付的各项税(payalltax)、经营活动产生的现金流量净额(ncashact)、取得投资收益收到的现金(cashinv)、投资活动现金流入小计(tininv)、购建固定资产、无形资产和其他长期资产支付的现金(capx)。

表1中给出的是2018年中报指标覆盖度情况,基本在90%以上。三张报表中的指标较多,如果仅考虑部分行业或板块,可以筛选出更多的指标。

1 指标覆盖度-20180630

image

2.2 因子生成规则

在本报告中,我们考虑了7种因子生成规则,具体说明如下:

1. X

即单个指标值,不涉及多个指标之间的运算。从逻辑上来讲,可将该值作为公司价值的代表变量。

2. %D(X)

仅涉及单个指标,计算其同比增长率。增长率和股票收益相关性与指标本身含义关系较大,例如净利润增速与总负债增速便存在较大差别。

3. X/Y

涉及两个指标,计算其比率值。例如ROE,反映财务指标之间的比例关系。

4. D(X)/Y

涉及两个指标,首先计算X的同比变动值,然后计算其与Y的比率值。

5. %D(X/Y)

涉及两个指标,首先计算比率值X/Y,然后计算其同比增长率。

6. %D(X)-%D(Y)

涉及两个指标,分别计算X和Y的同比增长率,然后计算二者之差。财务指标增速之差,比如净利润增速与总资产增速,可以反映公司盈利能力的变动。

7. (X-Y)/Z

涉及三个指标,X-Y得到新的指标,然后计算与Z的比率值。例如,营业收入与营业成本之差是营业利润,与总资产之比反映了公司的盈利能力。

以000002.SZ为例进行说明。X,营业总收入:105974537269.94(2018/6/30), 69810477567.49(2017/6/30);Y,营业总成本:87131631791.63(2018/6/30),57668666741.88(2017/6/30);Z,总资产:1345151635212.87(2018/6/30)。计算结果见表2。

2.3 回测方法

在这一部分,我们对回测流程进行说明。所涉及的股票池为全部A股,回测区间为2010年1月至2019年2月。回测流程如下:

(1) T时刻,提取所需数据,基于生成规则,计算得到因子值F;

(2) 将因子值F对总市值对数和中信一级行业虚拟变量进行截面回归,以残差值作为选股因子F0;

(3) T+1时刻,剔除停牌和涨停股票,剔除上市不满60日的次新股;

(4) 基于剩余股票因子值,升序排列,等分为10组。因子值最大一组记为G10,最小一组记为G1;

(5) 按月调仓,等权配置。

基于上述生成规则,共可得到54207个因子(对于比率值,不区分指标作为分子和分母的差异;对于增长率之差,不区分顺序),具体见表3。在实际计算中可以发现,每一类因子整体回测表现较为接近。因此对于后5种类型,我们仅给出各类中部分因子的回测结果。对于每一因子回测,我们统计了如下结果:因子IC序列;因子分组净值表现;组合换手率。

3 因子回测

前文我们对使用到的财务指标及因子生成方法进行了详细说明,此部分我们首先按类型对生成因子的回测结果进行说明,然后对整体结果进行分析。

3.1 结果汇总

在这一部分,我们给出每一类因子的回测结果:因子IC值、结果描述性统计、因子净值曲线、组合换手率情况。

3.1.1. X

图1中给出了因子多头组合的单边月均换手率情况;表4给出了38个因子的IC均值及对应T值。下面分别进行说明。

对于换手率,单边月均最小值为acctpay(应付账款)17.79%,最大值为cashinv(取得投资收益收到的现金)26.48%,整体均处于较低水平,交易费用对因子组合收益影响较小。

对于因子IC,均值最高的为净利润nprofit、营业利润opprofit和未分配利润undpro,分别为7.37%、7.33%和7.18%,且均是显著的。对于其余因子,IC均值最小的是财务费用finexp,为3.99%,且是显著异于0的。由此可以看出,这38个因子均较为有效。

1 因子月均单边换手率(G10)

表5中给出的是相对中证500年化超额最高的5个因子,分别是支付的各项税费payalltax、所得税tax、营业利润opprofit、资产总计asset、净利润nprofit;图2至图7给出的是前3个因子的分组净值走势和超额收益及最大回撤情况。下面进行分别说明。

这5个因子的年化收益相差较小,且波动率也较为接近。tax最大回撤最小,为7.30%,Sharpe比为2.303;其余4个因子也处于相似水平。从分组净值走势来看,表现最好的3个因子整体收益也较为接近,整体分组效果较好,且多头表现远优于其他组。例如opprofit因子G1-G10组年化收益分别为-6.45%、-3.03%、-0.38%、-0.11%、1.15%、4.29%、4.79%、9.21%、16.42%、25.32%,具有非常好的线性关系。

相对中证500,多头组合能够持续取得超额收益,且最大回撤相对较小;3个因子的超额收益走势及最大回撤时点保持很高的相关性。

2. %D(X)

图8中给出了因子多头组合的单边月均换手率情况;表6给出了38个因子的IC均值及对应T值。下面分别进行说明。

对于换手率,单边月均最小值为gaexp(管理费用),21.12%,最大值为tax(所得税),37.96%,整体均处于较低水平,交易费用对因子组合收益影响较小。

对于因子IC,均值最高的为营业总成本opercost、营业利润opprofit和销售费用sdexp,分别为4.18%、3.61%、3.57%,且均是显著的;反向因子中表现最好的是营业外支出nonoperexp,为-2.09%,基本是显著的。其中部分因子IC均值较小,且未通过显著性检验。

8 因子月均单边换手率(G10)

表7中给出的是相对中证500年化超额最高的5个因子,分别是支付的无形资产intasset、非流动负债合计tncliab、营业利润opprofit、销售费用sdexp、营业总收入operrev;图9至图14给出的是前3个因子的分组净值走势和超额收益及最大回撤情况。下面进行分别说明。

这5个因子的年化收益相差较小,不过整体表现不佳。opprofit波动率最小,其次是intasset。opprofit最大回撤最小,为9.28%,Sharpe比为1.324;其余4个因子也整体处于相似水平。从分组净值走势来看,表现最好的3个因子整体收益也较为接近,整体分组效果较好。例如intasset因子,G1-G10组年化收益分别为0.27%、1.62%、4.29%、2.06%、4.35%、4.17%、4.46%、6.18%、9.92%、12.27%,整体线性关系较好。

相对中证500,2017年之前多头组合多数时间可以获取超额收益,2017年持续跑输,2018年之后有所回升,整体回撤较大。3个因子的超额收益走势及最大回撤时点保持很高的相关性。

3. X/Y

图15和图16中给出了因子多头和空头组合的单边月均换手率情况;图17给出了因子IC均值的分布情况;表8给出了部分因子的IC均值及对应T值。下面分别进行说明。

对于换手率,G1组单边月均最小值为fassettcasset(固定资产/流动资产合计),10.01%;最大值为fassetcashinv(固定资产/取得投资收益收到的现金),34.43%。G10组单边月均最小值为fassettcasset(固定资产/流动资产合计),9.52%,最大值为taxpaynonoperexp(应交税费/营业外支出),36.11%,整体均处于较低水平,交易费用对因子组合收益影响较小。

对于因子IC,均值最高的为undpromonecap(未分配利润/货币资金)、undprocashrec(未分配利润/购买商品、接受劳务支付的现金)、undprosdexp(未分配利润/销售费用),分别为4.743%、4.591%、4.479%,且均是显著的;负向因子中表现最好的是empaymonecap(应付职工薪酬/货币资金)、fassetinvent(固定资产/存货)、totliabcashrec(负债合计/购买商品、接受劳务支付的现金),IC均值分别为-4.285%、-4.065%、-4.002%。部分因子IC均值较低,有效性较差;整体呈正态分布特征。

17 因子月均单边换手率(G10)

表9中给出的是相对中证500年化超额最高的5个因子,分别是fassetsdexp(固定资产/销售费用)、assetsdexp(资产总计/销售费用)、totliabsdexp(负债合计/销售费用)、undpronoperrev(未分配利润/营业外收入)、equitysdexp(所有者权益合计/销售费用);图18至图23给出的是前3个因子的分组净值走势和超额收益及最大回撤情况。下面进行分别说明。

fassetsdexp年化收益最高,为17.73%。undpronoperrev波动率最小,其次是equitysdexp。undpronoperrev最大回撤最小,为19.70%,整体均处于较高水平;fassetsdexp因子Sharpe比最高,为1.351;其余4个因子也整体处于相似水平。

从分组净值走势来看,表现最好的3个因子整体收益也较为接近,多头收益表现较好。例如fassetsdexp因子G1-G10组年化收益分别为0.98%、-0.56%、-1.08%、1.13%、0.87%、3.90%、3.97%、7.92%、13.08%、19.20%,整体线性关系较好。

相对中证500,2017年之前多头组合多数时间可以获取超额收益,最大回撤也较小;2017年持续跑输,最大回撤持续处于高位;2018年之后组合表现有所回升。3个因子的超额收益走势及最大回撤时点也保持很高的相关性。

4. D(X)/Y

图24和图25中给出了因子多头和空头组合的单边月均换手率情况;图26给出了因子IC均值的分布情况;表10给出了部分因子的IC均值及对应T值。下面分别进行说明。

对于换手率,G1组单边月均最小值为fassettcasset(固定资产/流动资产合计),10.01%;最大值为fassetcashinv(固定资产/取得投资收益收到的现金),34.43%。G10组单边月均最小值为fassettcasset(固定资产/流动资产合计),9.52%,最大值为taxpaynonoperexp(应交税费/营业外支出),36.11%,整体均处于较低水平,交易费用对因子组合收益影响较小。

对于因子IC,均值最高的为undpromonecap(未分配利润/货币资金)、undprocashrec(未分配利润/购买商品、接受劳务支付的现金)、undprosdexp(未分配利润/销售费用),分别为4.743%、4.591%、4.479%,且均是显著的;负向因子中表现最好的是empaymonecap(应付职工薪酬/货币资金)、fassetinvent(固定资产/存货)、totliabcashrec(负债合计/购买商品、接受劳务支付的现金),IC均值分别为-4.285%、-4.065%、-4.002%。部分因子IC均值较低,有效性较差。

26 因子IC分布

表11中给出的是相对中证500年化超额最高的5个因子,分别是fassetsdexp(固定资产/销售费用)、assetsdexp(资产总计/销售费用)、totliabsdexp(负债合计/销售费用)、undpronoperrev(未分配利润/营业外收入)、equitysdexp(所有者权益合计/销售费用);图27至图32给出的是前3个因子的分组净值走势和超额收益及最大回撤情况。下面进行分别说明。

fassetsdexp年化收益最高,为17.73%。undpronoperrev波动率最小,其次是equitysdexp。undpronoperrev最大回撤最小,为19.70%,整体均处于较高水平;fassetsdexp因子Sharpe比最高,为1.351;其余4个因子也整体处于相似水平。从分组净值走势来看,表现最好的3个因子整体收益也较为接近,多头收益表现较好。例如fassetsdexp因子G1-G10组年化收益分别为0.98%、-0.56%、-1.08%、1.13%、0.87%、3.90%、3.97%、7.92%、13.08%、19.20%,整体线性关系较好。

相对中证500,2017年之前多头组合多数时间可以获取超额收益,最大回撤也较小;2017年持续跑输,最大回撤持续保持高位;2018年之后组合表现有所回升。3个因子的超额收益走势及最大回撤时点也保持很高的相关性。

5. %D(X/Y)

图33和图34中给出了因子多头和空头组合的单边月均换手率情况;图25给出了因子IC均值的分布情况;表12给出了部分因子的IC均值及对应T值。下面分别进行说明。

对于换手率,G1组单边月均最小值为fassettcasset(固定资产/流动资产合计),10.01%;最大值为fassetcashinv(固定资产/取得投资收益收到的现金),34.43%。G10组单边月均最小值为fassettcasset(固定资产/流动资产合计),9.52%,最大值为taxpaynonoperexp(应交税费/营业外支出),36.11%,整体均处于较低水平,交易费用对因子组合收益影响较小。

对于因子IC,均值最高的为undpromonecap(未分配利润/货币资金)、undprocashrec(未分配利润/购买商品、接受劳务支付的现金)、undprosdexp(未分配利润/销售费用),分别为4.743%、4.591%、4.479%,且均是显著的;负向因子中表现最好的是empaymonecap(应付职工薪酬/货币资金)、fassetinvent(固定资产/存货)、totliabcashrec(负债合计/购买商品、接受劳务支付的现金),IC均值分别为-4.285%、-4.065%、-4.002%。部分因子IC均值较低,有效性较差。

35 因子IC分布

表13中给出的是相对中证500年化超额最高的5个因子,分别是fassetsdexp(固定资产/销售费用)、assetsdexp(资产总计/销售费用)、totliabsdexp(负债合计/销售费用)、undpronoperrev(未分配利润/营业外收入)、equitysdexp(所有者权益合计/销售费用);图36至图41给出的是前3个因子的分组净值走势和超额收益及最大回撤情况。下面进行分别说明。

fassetsdexp年化收益最高,为17.73%。undpronoperrev波动率最小,其次是equitysdexp。undpronoperrev最大回撤最小,为19.70%,整体均处于较高水平;fassetsdexp因子Sharpe比最高,为1.351;其余4个因子也整体处于相似水平。从分组净值走势来看,表现最好的3个因子整体收益也较为接近,多头收益表现较好。例如fassetsdexp因子G1-G10组年化收益分别为0.98%、-0.56%、-1.08%、1.13%、0.87%、3.90%、3.97%、7.92%、13.08%、19.20%,整体线性关系较好。

相对中证500,2017年之前多头组合多数时间可以获取超额收益,最大回撤也较小;2017年持续跑输,最大回撤持续保持高位;2018年之后组合表现有所回升。3个因子的超额收益走势及最大回撤时点也保持很高的相关性。

6. %D(X)-%D(Y)

图42和图43中给出了因子多头和空头组合的单边月均换手率情况;图44给出了因子IC均值的分布情况;表14给出了部分因子的IC均值及对应T值。下面分别进行说明。

对于换手率,G1组单边月均最小值为fassettcasset(固定资产/流动资产合计),10.01%;最大值为fassetcashinv(固定资产/取得投资收益收到的现金),34.43%。G10组单边月均最小值为fassettcasset(固定资产/流动资产合计),9.52%,最大值为taxpaynonoperexp(应交税费/营业外支出),36.11%,整体均处于较低水平,交易费用对因子组合收益影响较小。

对于因子IC,均值最高的为undpromonecap(未分配利润/货币资金)、undprocashrec(未分配利润/购买商品、接受劳务支付的现金)、undprosdexp(未分配利润/销售费用),分别为4.743%、4.591%、4.479%,且均是显著的;负向因子中表现最好的是empaymonecap(应付职工薪酬/货币资金)、fassetinvent(固定资产/存货)、totliabcashrec(负债合计/购买商品、接受劳务支付的现金),IC均值分别为-4.285%、-4.065%、-4.002%。部分因子IC均值较低,有效性较差。

44 因子IC分布

表15中给出的是相对中证500年化超额最高的5个因子,分别是fassetsdexp(固定资产/销售费用)、assetsdexp(资产总计/销售费用)、totliabsdexp(负债合计/销售费用)、undpronoperrev(未分配利润/营业外收入)、equitysdexp(所有者权益合计/销售费用);图45至图50给出的是前3个因子的分组净值走势和超额收益及最大回撤情况。下面进行分别说明。

fassetsdexp年化收益最高,为17.73%。undpronoperrev波动率最小,其次是equitysdexp。undpronoperrev最大回撤最小,为19.70%,整体均处于较高水平;fassetsdexp因子Sharpe比最高,为1.351;其余4个因子也整体处于相似水平。从分组净值走势来看,表现最好的3个因子整体收益也较为接近,多头收益表现较好。例如fassetsdexp因子G1-G10组年化收益分别为0.98%、-0.56%、-1.08%、1.13%、0.87%、3.90%、3.97%、7.92%、13.08%、19.20%,整体线性关系较好。

相对中证500,2017年之前多头组合多数时间可以获取超额收益,最大回撤也较小;2017年持续跑输,最大回撤持续保持高位;2018年之后组合表现有所回升。3个因子的超额收益走势及最大回撤时点也保持很高的相关性。

7. (X-Y)/Z

图51和图52中给出了因子多头和空头组合的单边月均换手率情况;图53给出了因子IC均值的分布情况;表16给出了部分因子的IC均值及对应T值。下面分别进行说明。

对于换手率,单边月均最小值为assetintassettcasset ((资产总计-无形资产)/流动资产合计),10.30%,最大值为assetmonecapncashact((资产总计-货币资金)/ 经营活动产生的现金流量净额),32.60%,整体均处于较低水平,交易费用对因子组合收益影响较小。

对于因子IC,均值最高的为assetintassetsdexp((资产总计-无形资产)/销售费用)、assettaxpaysdexp((资产总计-应交税费)/销售费用)、assetempaysdexp((资产总计-应付职工薪酬)/销售费用),分别为3.26%、2.82%、2.81%,且均是显著的;负向因子中表现最好的是assetundprocashrec((资产总计-未分配利润)/ 购买商品、接受劳务支付的现金)、assetundpromonecap((资产总计-未分配利润)/ 货币资金)、assetequitycashrec((资产总计-所有者权益合计)/ 购买商品、接受劳务支付的现金),IC均值分别是-4.62%、-4.21%、-4.00%。从分布来看,整体呈现正态特征。

53 因子IC分布

表17中给出的是相对中证500年化超额最高的5个因子,分别是assetintassetsdexp((资产总计-无形资产)/销售费用)、assetmonecapsdexp((资产总计-货币资金)/销售费用)、assettaxpaysdexp((资产总计-应交税费)/所得税费用)、assetempaysdexp((资产总计-应付职工薪酬)/销售费用)、assetequitysdexp((资产总计-所有者权益合计)/销售费用);图54至图59给出的是前3个因子的分组净值走势和超额收益及最大回撤情况。下面进行分别说明。

assetintassetsdexp年化收益最高,为15.02%;其波动率也最小,其次是equitysdexp。assetequitysdexp最大回撤最小,为24.40%,整体均处于较高水平;assetintassetsdexp因子Sharpe比最高,为1.225;其余4个因子也整体处于相似水平。从分组净值走势来看,表现最好的3个因子整体收益也较为接近,多头收益表现较好。例如assetintassetsdexp因子G1-G10组年化收益分别为1.04%、-3.81%、1.87%、4.55%、2.70%、3.36%、5.42%、6.59%、11.23%、16.45%,整体线性关系较好。

相对中证500,2017年之前多头组合多数时间可以获取超额收益,最大回撤也较小;2017年持续跑输,最大回撤持续保持高位;2018年之后组合表现有所回升。3个因子的超额收益走势及最大回撤时点也保持很高的相关性。

3.2 小结

在这一部分,基于7种因子生成规则,以及38个资产负债表、利润表和现金流量表指标,我们批量对基本面因子表现进行了回测。对于回测结果,总结如下:一,在相同的因子生成规则下,尽管表现存在差异,但因子收益曲线相关性较高;二,多头整体换手率较低;三,剔除量纲影响的比率类指标整体表现会存在一定的相似性;四,基于类似于数据挖掘的因子生成方式,因子IC和组合收益均呈现正态分布的特征。

基于因子生成规则而非具体指标进行因子构建,能够一定程度上跳出指标逻辑导向的框架,得到包含增量信息的因子。在报告中,我们介绍了7种简单易计算的因子生成规则,并据此进行因子构建和回测,部分新的因子有较好表现。当然,除上述生成规则之外,还有很多可用的指标构建方法;除逻辑简单的方法之外,还可以尝试其他更为复杂的规则;在财报指标之外,还可以融入其他指标。

4 一些思考

前文基于7类因子生成规则,我们进行了基本面因子构建,并进行了回测研究。所得因子中有一些因子由较为持续稳定的超额收益,也有一些在部分年份经历了较大的回撤。对于X/Y和D(X) /Y等比率指标,尽管在收益率上存在一定差别,但在累计收益上相似性很高,然而其因子相关性有些却很低。

在进行因子选股时,我们希望尽量降低其相关性,提升选股表现。为此,通常会进行因子正交化处理,或者仅将经济逻辑上相关性较低的因子纳入模型中。进行这种处理,我们认为在一定程度上能够提升因子整体表现。但是,我们可能会忽视一个问题,即因子相关性与因子收益相关性是否是一个概念?

以总市值、动量(过去3月累计收益,对市值和行业进行中性化处理)和估值因子为例进行说明,回测区间为2007-2019.2,将全市场股票等分为10组,等权配置,月度调仓。结果见图60和图61。

动量和估值进行了市值正交化处理,与其相关系数为0;动量与估值因子相关系数为-1.68%(2019年2月)。对于因子收益,我们对其相对中证500的超额收益及对应最大回撤进行分析。从相对收益来看,动量和市值在17年之前均较为有效,17年之后开始出现回撤;估值因子在整个区间相对基准均表现较好。市值因子在2018年2月之后开始走强,动量因子则与基准基本持平。从最大回撤来看,动量和市值回撤时点也基本一致,尤其是2017年出现较大回撤时;估值因子回撤整体相对较小。

对于更细化的结果,我们计算了因子IC相关性以及因子收益(超额收益)相关性。具体来说,动量与市值和估值IC序列相关系数分别为19.10%和-22.59%,市值与估值IC序列相关系数为-73.24%;对于收益序列,动量与市值和估值收益相关系数分别为56.92%和55.40%,市值与估值收益相关系数为55.22%。

对于因子选股,需要关注三个概念:因子值、因子有效性(IC)和对应的因子组合收益。从上面的例子可以看出,这三个值的大小并没有必然的联系:因子值不相关,IC序列相关性可能很高;IC相关性较低,但因子组合收益相关性也可能较高。因子IC是连接因子值与因子组合收益的桥梁。

在现有分析框架中,进行因子合成,通常是以最大化合成因子预测能力为目标,例如IC加权、ICIR加权和最大化ICIR。在这种思路下,当涉及因子整体较为有效时,可以最大化组合收益表现。而当其中部分或全部因子失效时,所得组合便会出现较大的回撤。因子选股的关键在于使用的因子,而最终所需结果则是因子收益。从这三者的区别与联系出发进行分析,或可得到一些有价值的结果,后续我们会对此进行研究。

5 总结

在本报告中,通过设定因子生成规则而非具体指标逻辑,以三张财务报表科目指标作为输入变量,批量构建了基本面因子。

对于基本面因子选股,通常的思路是基于经济理论和财务指标进行因子构建,然而这种方法得到的指标是比较少的。且在因子库已经比较庞大的情况下,思路往往会受现有信息的影响。在此种情况下,如果更多关注因子生成规则,而非单个因子的生成逻辑或指标之间的关联,或能得到一定的增量信息。

基于此,我们以19个资产负债表指标、10个利润表指标和9个现金流量表指标作为输入变量,构建了7种因子生成规则:X、%D(X)、X/Y、D(X)/Y、%D(X/Y)、%D(X)-%D(Y)和(X-Y)/Z,批量进行了基本面因子的构建。

对于第一种因子生成规则X,所得38个因子的IC均值为5.83%,最大值为7.37%,且均是显著异于0的。从年化收益来看,表现最好的5个因子是支付的各项税费、所得税、营业利润、资产总计和净利润因子,相对中证500年化超额收益分别为24.56%、24.08%、23.78%、23.44%和23.35%,Sharpe分别为2.236、2.303、2.274、2.056和2.227,整体表现较好。单边月均换手率为20%左右,整体较低,交易费用对组合收益影响较小。

对于后6种剔除量纲影响的指标,部分因子也有较好的表现,不过整体收益走势较为一致:2017年之前,相对基准可以取得较为明显的超额收益,2017年回撤较大,近期有所回升。从走势来看,这几类因子与小市值有较为密切的联系。

此外,我们还发现在生成的因子中,虽然因子值相关性较低,但是收益走势相关性很高。通过分析我们发现因子值、IC和组合收益之间并没有必然的联系。因子之间的分散化并不能带来组合收益的分散化。由此,对于多因子合成,或可从风险分散化视角进行相关分析。

作者:东北证券金工团队