上周多个因子表现出色——因子周报20211121
由crisvalentine创建,最终由crisvalentine 被浏览 56 用户
林晓明 S0570516010001
SFC No. BPY421 研究员
何 康 S0570520080004
SFC No. BRB318 研究员
王晨宇 S0570119110038 联系人
陈 伟 S0570121070169 联系人
报告发布时间:2021年11月21日
摘要
上周多个因子表现出色,成长与beta因子分化较明显
上周多个因子表现出色,估值、盈利、小市值、反转、波动率、技术等因子均呈现全面正收益,其中小市值和反转因子在所有股票池中Rank IC均接近或超过10%,技术因子Rank IC全部超过5%。财务因子在中证1000以外的股票池均呈现正收益,其中在中证500成分股票池中Rank IC超过10%;换手率因子在沪深300和中证500成分股票池中表现平庸,在其余股票池表现较为出色。成长因子上周在中证500成分股票池取得一定的正收益,但在其余股票池回撤,其中在沪深300成分股票池回撤超过10%;beta因子在中证1000成分股票池中Rank IC超过5%,在其余股票池中回撤。
主动型量化基金近期表现弱于非量化基金
上周主动型、指数型、对冲三个类别的量化基金收益率中位数分别为0.13%、0.17%、-0.06%,所有股票及偏股型公募基金收益率中位数为0.23%;近1个月主动型量化基金收益率中位数为-0.12%,所有股票及偏股型公募基金收益率中位数为1.36%;主动型量化基金近期表现弱于非量化基金。我们基于三种方法对偏股混合型基金仓位变化情况进行测算,结合上期持仓的二次规划法显示基金仓位预测值较前一周基本持平,Lasso回归和逐步回归方法显示基金仓位预测值较前一周有所下降。
上周市场小幅震荡,表现最好的指数是中证1000
上周市场小幅震荡,上证综指一周涨幅0.60%相对较强,创业板指一周跌幅0.33%相对较弱;观察市场重要规模指数发现,中证1000指数一周涨幅1.38%相对较强,上证50指数一周跌幅0.24%相对较弱;上周表现最好的指数是中证1000。在30个中信一级行业中,上周有19个行业处于上涨状态;纺织服装、食品饮料、钢铁行业表现相对较好,涨跌幅分别为3.24%、3.07%、2.58%;综合金融、农林牧渔、汽车行业表现相对较差,涨跌幅分别为-2.70%、-1.80%、-1.22%;电力设备及新能源行业一周成交额领跑其它行业。
风险提示:风格因子的效果与宏观环境和大盘走势密切相关,历史结果不能预测未来;量化与非量化基金的业绩受到多种因素影响,包括环境、政策、基金管理人变化等,过去业绩好的基金不代表未来依然业绩好,投资需谨慎。本报告所采用的基金仓位测算方法仅基于日频基金净值数据和行业数据,没有利用基金报告中公布的重仓股、行业分布等信息,存在一定局限性,敬请注意。
上周市场行业回顾
上周(2021/11/15~2021/11/19)A股市场重要指数和一级行业指数涨跌幅如下所示。
上周市场上行。在四个重要的板块指数(上证综指、深证成指、中小板指、创业板指)中,上证综指一周涨幅0.60%相对较强,创业板指一周跌幅0.33%相对较弱;在五个重要的规模指数(中证全指、上证50、沪深300、中证500、中证1000)中,中证1000指数一周涨幅1.38%相对较强,上证50指数一周跌幅0.24%相对较弱;上周表现最好的指数是中证1000。在30个中信一级行业中,上周有19个行业处于上涨状态;纺织服装、食品饮料、钢铁行业表现相对较好,涨跌幅分别为3.24%、3.07%、2.58%;综合金融、农林牧渔、汽车行业表现相对较差,涨跌幅分别为-2.70%、-1.80%、-1.22%;电力设备及新能源行业一周成交额领跑其它行业。
上周因子表现
我们针对估值、成长、盈利、财务质量、小市值、反转、波动率、换手率、beta、技术共十个风格因子,在沪深300成份股、中证500成份股、中证1000成份股、全A股市场四种股票池内计算行业中性及市值中性的Rank IC值、IC_IR比率,并展示在下面七个图表中。这一计算过程可以简要描述为:
- 计算附录一表格中所有细分因子的值;
- 对每个细分因子,用其自身作因变量,用对数总市值和30个一级行业哑变量作自变量进行OLS线性回归,取回归残差替代原始计算的因子值;
- 对新因子值用中位数法去极值,再标准化,然后将属于同一个风格大类(比如估值)的细分因子直接等权相加作为风格因子的值,与个股下期收益率计算Spearman秩相关系数,即得到该风格因子的Rank IC值;
上周、本月初至今(或指定月份的)Rank IC值分别是用前一周五、上个月(或指定月份前推一个月)的月底作为截面期计算因子值,经过前3步处理后与个股上周、本月初至今(或指定月份的)收益计算相关系数,指定时间区间内Rank IC均值是以自然月为频率计算的月度Rank IC的平均值(本月的Rank IC值即为本月初至今Rank IC值),IC_IR是月度Rank IC的均值除以标准差。
十个风格大类共包含34个细分因子,它们的详细计算方式参见附录一,风格因子合成与IC值计算方法参见附录二,细分因子IC值详表参见附录三。
上周量化基金表现
我们以Wind收集的量化概念类基金(包括主动型、指数型、对冲三个子类)为基础,针对以下几种情形进行调整:
- 同一只基金可能存在A类、C类或其它类别份额,不同类别份额可以各自对应于独立的基金代码,我们在统计时只考虑成立最久的那一个基金代码(若成立日相同则选A类份额)对应的业绩表现;
- 去除债券型基金、偏债混合型基金、封闭式基金、非主要投资于A股市场的基金,去除成立三个月之内的基金;
- 去除明显不是量化型的基金(主要通过基金经理背景、经历和其它信息综合判断);
- 我们将所有开放式公募基金中普通股票型和偏股混合型合并作为参照组,因为基金数目众多,细微调整对分位数计算的影响较小,所以对参照组没有进行上述3条处理。
考虑到Wind收集的量化基金可能不全,所以此处讨论的量化基金可以认为是全市场量化基金的一个有代表性的子集。近期量化基金表现如下面图表所示。
基金仓位测算观察
正文基于结合上期持仓的二次规划法、Lasso回归和逐步回归三种回归方法,对偏股混合型基金2018年初至今仓位变化情况进行了测算。这一计算过程可以简要描述为:
- 选取Wind分类下的偏股混合型基金,剔除沪港深基金等非完全投资于A股市场的基金,剔除数据方面有缺失值或存在疑问的基金,剔除2017年以后成立的基金,共保留480只偏股混合型基金。
- 以过去90个交易日基金的日频收益率作为因变量,30个中信一级行业指数日收益率作为自变量,样本按时间衰减赋权,通过不同的回归方式对各行业变量前的回归系数进行拟合,再求所有回归系数之和,即得基金仓位预测值。
- 对于结合上期持仓的二次规划法,我们对目标函数进行最优化求解,需要求解的目标向量为仓位向量。目标函数包含两项,第一项是基金日收益率预测值与真实值的均方误差,第二项是基金在各指数的预测仓位与上期真实仓位的误差平方和,λ是第二项损失项前的系数,此处将λ设为10。
- 对于Lasso回归,其基本原理是在普通最小二乘的损失函数基础上添加L1正则化项,使原本较为病态的回归问题可以正常求解。Lasso回归将某些行业前面的回归系数压缩成0,提取出一组“回归效果最好”的行业组作为解释变量组。Lasso回归具有一个可调参数λ,我们采用10折交叉验证从1e-3至1的范围内搜索最优λ值。
- 对于逐步回归,我们采用逐步进入方法,每次引入或剔除自变量,都对原模型和新模型进行F检验。如果新自变量的引入能够显著提升模型的解释能力,那么引入该自变量;如果原自变量的剔除不会显著降低模型的解释能力,那么剔除该自变量。直到不再有变量被选入或剔除为止。变量被保留的p值为0.05,被剔除的p值为0.1。
关于回归法进行基金仓位测算的具体方法,感兴趣的投资人可以参阅华泰金工研报《再探回归法测算基金持股仓位》(2018.12.24)了解更多详情。我们使用过去90个交易日的数据进行回归计算,按日滚动回归,得到偏股混合型基金仓位预测值均值变化曲线,如下图所示。结合上期持仓的二次规划法显示上周偏股混合型基金仓位预测值较前一周基本持平,Lasso回归和逐步回归方法均显示上周偏股混合型基金仓位预测值较前一周下降。
附录一:所有细分因子计算方法
上表第三列因子方向解释:取值为1代表因子值越大越好,-1代表因子值越小越好。当采用等权法合成风格因子时,需将因子值乘以因子方向之后再相加。
附录二:风格因子合成与IC值计算方法
我们以某一截面期T估值类风格因子的合成为例,具体说明风格因子合成过程:
\1. 因子原始值计算:设第T期指定股票池(全A股、沪深300成份股、中证500成份股、中证1000成份股)内共存在N只股票,首先根据附录一表格计算细分因子EP、BP、SP、股息率在第T期的值,均为N×1维向量;
\2. 因子的行业与市值中性化处理:用OLS线性回归拟合
取上述回归方程的残差向量替代原始计算的因子值X^T作为第T期因子X的新值,仍记为,这里的X指代EP、BP、SP、股息率等细分因子(特别地,若因子X为‘对数总市值’因子,则它只对行业哑变量回归,亦即对该因子只进行行业中性化处理);
\3. 因子去极值、标准化:
a) 中位数去极值:对于经过中性化处理之后的因子值X^T(N×1维向量),先计算其中位数D_M,再计算|X^T-D_M |的中位数D_M1,接下来将向量X^T中所有大于D_M+5D_M1的元素重设为D_M+5D_M1,将向量X^T中所有小于D_M-5D_M1的元素重设为D_M-5D_M1;
b) 标准化:将去极值处理后的因子值X^T(N×1维向量)减去其现在的均值、再除以其现在的标准差,就得到了标准化后的新因子值,仍记为X^T;
\4. 风格因子合成与Rank IC计算:将属于估值类的四个细分因子值(经过以上所有处理之后)乘以各自的因子方向(1或-1)之后直接等权相加,就得到了估值风格因子的值,与个股下期收益率向量r^(T+1)计算Spearman秩相关系数,即得到估值风格因子的Rank IC值;
\5. 上周、本月初至今(或指定月份的)的风格因子Rank IC值分别是用前一周五、上个月(或指定月份前推一个月)的月底作为截面期计算因子值,经过前4步处理后与个股上周、本月初至今(或指定月份的)收益向量计算Spearman秩相关系数而得的,指定时间区间内Rank IC均值是以自然月为频率计算的月度Rank IC的平均值(若指定时间区间中最末一天不是月底,则用最后一个月的月初至区间最末一天的Rank IC值作为最后一个月的Rank IC值),IC_IR是月度Rank IC的均值除以标准差(不年化);
\6. 细分因子的Rank IC值即用第2步处理结束后得到的因子值X^T乘以因子方向(1或-1)再与个股下期收益率向量r^(T+1)计算Spearman秩相关系数。
附录三:所有细分因子IC值表现
所有细分因子在不同票池(全A股、沪深300成份股、中证500成份股、中证1000成份股)内的IC值表现如以下四张图表所示:
风险提示
风格因子的效果与宏观环境和大盘走势密切相关,历史结果不能预测未来。量化与非量化基金的业绩受到多种因素影响,包括环境、政策、基金管理人变化等,过去业绩好的基金不代表未来依然业绩好,投资需谨慎;基金业绩排名不构成对基金的投资建议。本报告所采用的基金仓位测算方法仅基于日频基金净值数据和行业数据,没有利用基金报告中公布的重仓股、行业分布等信息,存在一定测算误差,敬请注意;基金仓位测算结果不构成对择时的投资建议。