技术类新 Alpha 因子的批量测试——《因子选股系列研究之二十》
创建于 更新于
摘要
本报告基于Harvey(2016)提出的16个技术类新Alpha因子,在A股市场进行批量测试,发现其中5个因子(DOWNILLIQ、UPILLIQ、NCSKEW、DUVOL和IVmonthly)表现较优,rankIC绝对值均大于0.05,IR绝对值均大于2.5。进一步Fama-MacBeth回归验证,DOWNILLIQ、UPILLIQ及IVmonthly因子具有显著增量信息。报告展示了3个核心因子在A股的业绩表现及其与已有因子库的相关性,并提出将部分新因子纳入因子库精简体系,为多因子模型提供有力支持 [page::0][page::8][page::11][page::12]。
速读内容
核心新Alpha因子筛选与表现 [page::0][page::6][page::12]
- 依据Harvey(2016)统计的16个技术类因子,在A股市场2006-2016年区间测试,5个因子表现突出:DOWNILLIQ、UPILLIQ、NCSKEW、DUVOL和IVmonthly。
- 这5个因子rankIC绝对值均大于0.05,IR绝对值均超过2.5,显著优于其他因子。
- 相关性分析显示DOWNILLIQ与UPILLIQ高度负相关(约-82%),反映A股不存在美股买卖非流动性非对称现象;NCSKEW和DUVOL高度正相关(85%),均衡量股票暴跌风险。
- 结合相关性,选择DOWNILLIQ、DUVOL和IVmonthly进行深入分析。
DOWNILLIQ 因子绩效与特征 [page::8]

- DOWNILLIQ基于过去一个月5分钟买卖金额与涨跌幅回归分离卖单非流动性,消除了买卖效应干扰,提升因子信号有效性。
- 2009-2016年多空组合年化收益29.7%,最大回撤9.9%,夏普比率0.838,月胜率84.3%,收益单调性好。
- 与传统ILLIQ因子相关性中等(约-31%),因子独立性较强。
DUVOL 因子特性与回测结果 [page::9]

- DUVOL衡量低于与高于历史60日复合收益波动的比值,反映下行波动风险。
- 多空组合年化收益22.8%,最大回撤8.6%,夏普比率0.53,月胜率83.2%。
- 与反转类因子相关性高,增量信息有限。
IVmonthly 因子定义与表现 [page::10]

- IVmonthly基于过去24个月Fama-French三因子残差收益的指数加权平方和,测量相对长期投机波动性。
- 多空组合年化收益18.4%,最大回撤16%,夏普比率0.49,月胜率68.5%。
- 与其他因子相关性较低,提供一定维度增量信息。
因子增量信息与因子库优化 [page::11]

- 经Fama-MacBeth回归剔除12个主要因子影响后,DOWNILLIQ与UPILLIQ依然存在显著增量信息,IVmonthly减弱但仍部分有效,DUVOL信息显著降低。
- 新因子加入因子库精简,替换部分原反转因子Ret1M,增加IVmonthly和EIVOL。
- 因数据长度限制,精简过程中暂未加入DOWNILLIQ和UPILLIQ,但建议人工补充纳入因子库以提升多因子模型表现。
研究结论及风险提示 [page::12]
- A股市场技术类新Alpha因子表现整体弱于美股,但部分因子仍具重要应用价值。
- 推荐多因子模型中加入DOWNILLIQ因子以提升选股能力。
- 模型基于历史数据,存在未来失效风险,极端市场环境可能影响因子表现。
深度阅读
技术类新 Alpha 因子的批量测试——《因子选股系列研究之二十》详尽分析报告
---
一、元数据与报告概览
报告标题: 技术类新 Alpha 因子的批量测试——《因子选股系列研究之二十》
作者: 朱剑涛、张惠澍
发布机构: 东方证券股份有限公司
发布日期: 2017年2月17日
研究主题: 技术类股票多因子选股,重点验证Harvey(2016)统计的16个技术因子在A股市场的表现及增量信息。
报告核心论点及结论概述:
报告旨在验证Harvey (2016)中,自2002年以来显著且相互独立的16个技术类Alpha因子在中国A股市场的效果。检验结果发现大多数因子在A股表现不佳,唯有DOWNILLIQ(卖单非流动性)、UPILLIQ(买单非流动性)、NCSKEW(负偏度)、DUVOL(上下行波动率)及IVmonthly(月度特质波动率)5个因子表现较为显著,rankIC绝对值均超0.05,IR绝对值均超2.5,显示具有良好预测能力。值得关注的是,DOWNILLIQ与UPILLIQ高度负相关,揭示A股市场中不存在美股常见的买卖非流动性非对称现象,即A股亏损厌恶行为较弱。同时,NCSKEW与DUVOL正相关性极高,均作为衡量股票暴跌风险的指标。
报告还通过Fama-MacBeth回归检验,剔除既有12个原因子库因子后,DOWNILLIQ、UPILLIQ和IVmonthly三因子仍表现出较强的信息增量。最终提出加入IVmonthly和EIVOL新因子替代原有ILLIQ和Ret1M等反转因子,构建14因子因子库,建议多因子模型重点考虑DOWNILLIQ因子,因其与其他因子相关性低且表现优于UPILLIQ。
风险提示涵盖量化模型在历史数据上的局限与极端市场环境可能带来的冲击。[page::0,12]
---
二、逐章深度解读
2.1 新因子介绍
报告从Harvey (2016)整理的316个因子中筛选出2002年后显著且独立的16个技术因子,涵盖以下几类:
- 流动性类因子:DOWNILLIQ(卖单非流动性)、UPILLIQ(买单非流动性)、ILLIQ、NEGILLIQ;
- 偏态与波动风险因子:NCSKEW(负偏度系数)、DUVOL(上下行波动率)、COSKEW(协偏度)、Dbeta(下行beta);
- 成交与换手率波动因子:CVTURN(换手率变异系数)、CVILLIQ(非流动性变异系数);
- 动量与反转类因子:Ret1M、TSMON(时间序列动量)、Ret3M、EDR(极端下行风险)等;
- 特质波动率因子:EIVOL(期望特质波动率)、IVmonthly(月度特质波动率)、IVlong(长期特质波动率)、IVshort(短期特质波动率);
- 市场行为指标:BSI(散户买卖非平衡性)。
每个因子的定义和计算方式详尽描述,如用EGarch模型估计期望特质波动率、使用Fama-French三因子残差计算特质波动率分解、或者用5分钟高频数据回归计算买卖单非流动性[page::2-5]。
该节阐述的核心推理是,因子设计皆基于市场微观结构或风险溢价理论,反映投资者行为、风险厌恶、信息不对称以及流动性等多维度对未来股票收益的影响。
---
2.2 因子测试结果
样本与方法
- 测试时间:2006年1月25日至2016年12月30日。
- 样本:中证全指成分股。
- 因子处理:采用中位数去极值法,行业中性化(对行业哑变量回归残差),风格中性化(对市值对数回归残差),最后标准化处理。
绩效指标
- 主要观察因子Rank IC(排序相关系数)、信息比率(IR)、t统计量及正负显著比例。
- 结果显示5个因子有效性显著:DOWNILLIQ(rankIC=-0.074, IR=-3.383),UPILLIQ(0.075,3.229),NCSKEW(0.068,3.034),DUVOL(0.062,3.029),IVmonthly(-0.053,-2.871),均满足绝对Rank IC>0.05且IR大于2.5,这表明这5个因子对未来收益有较强的预测力。
- 另外,如EIVOL、COSKEW等因子表现较弱,IC与IR均不足以显示显著性。
相关性分析
- DOWNILLIQ与UPILLIQ之间高度负相关(-82%),表明A股中买卖非流动性无显著非对称性。此现象与美股不同,美股中亏损厌恶严重,卖单非流动性对收益预测更有效。
- NCSKEW与DUVOL高度正相关(85%),两者均衡量波动性偏向下跌的风险,效果类似。
- IVmonthly与3个月与1年波动率相关性分别为34%和39%,属于反转类因子,且与其他因子相关性较低,提供了较独立信息。
该节系统呈现了因子表现的统计数据支撑与因子间关系的结构性洞见[page::6-7]。
---
2.3 下游三个关键因子详解
2.3.1 DOWNILLIQ
- 该因子利用过去一个月所有5分钟收益率与主动买卖金额回归系数得出,区分买入与卖出对价格的非流动性影响。
- 在2009年9月至2016年9月间测试,因子分组收益呈单调性,年化多空组合收益为29.7%,夏普比率0.838,最大回撤9.9%,月度胜率84.3%,表现稳健。
- 同时与换手率和传统非流动性因子相关性分别为34%和-31%。
- 强于传统ILLIQ因子的原因是后者未区分买卖单的非流动性效应,而DOWNILLIQ通过回归剥离买卖影响,效果更精准。
图2展示了DOWNILLIQ分组收益率、多空净值增长以及月度收益波动,显示其在月度维度获得正向超额收益的连续性。
2.3.2 DUVOL
- DUVOL计算低于历史60日复合收益率的下行波动率对比高于平均的上行波动率的对数,反映下行风险非对称性。
- 其与已知反转类因子相关度较高,归入该类。
- 2006年1月25日至2016年12月30日测试周期,年化收益22.8%,夏普比0.53,最大回撤8.6%,月度胜率83.2%。
- 图3反映了该因子多空收益与净值增长较为稳健,但多空收益侧较明显。
2.3.3 IVmonthly
- 利用过去24个月Fama-French三因子回归残差指数加权平方和计算的月度特质波动率,突出近期数据权重。
- 测试周期2008年1月至2016年12月,主要衡量股票投机程度。
- 与3个月和1年波动率相关性34%和39%,相关性低,属于反转因子。
- 多空组合年化收益18.4%,最大回撤16%,夏普比0.49,月胜率68.5%。
- 无限值图4展示了分组收益率与多空净值涨幅,表现波动但整体具备负向收益联动。
以上三因子表现凸显了市场微观结构对A股未来收益的切实影响,且因子内在逻辑严谨,数据充分支撑其有效性。[page::8-10]
---
2.4 因子增量信息检验
为了验证新因子的独立预测信息,研究选取了基于年初因子库精简选出的12个因子,包含基本面和技术面主要因子(CGO3M、TO、Momentumlast12M、EP2TTM、ILLIQ、AmountVol1M12M、IRFF、Ret1M、GP2Asset、CFPTTM、SalesGrowthQrYOY、ProfitGrowthQr_YOY),并对新因子做Fama-MacBeth截面回归剔除其效应。
- 结果显示,剔除12因子后,DOWNILLIQ依然拥有rankIC=-0.037,IR接近2;UPILLIQ rankIC为0.041,同样呈现显著信息增量。
- IVmonthly剔除后效果减弱,但仍保留一定IC和IR。
- DUVOL与已有反转因子重叠性高,剔除后信息增量不足。
- 综合考虑,增加IVmonthly与EIVOL因子替代原ILLIQ与Ret1M,从而将因子库扩展至14个。
- DOWNILLIQ与UPILLIQ因数据时间跨度短,未直接纳入精简,但鉴于其与其他因子低相关且信息含量显著,建议至少纳入其中一个因子,用以提升模型解释力。
图7展示了新因子加入因子库后各因子权重及组合绩效的提升,强调因子库结构优化的实效性。[page::11]
---
2.5 总结与风险提示
报告总结了对Harvey (2016)16个技术类因子的验证:
- 绝大多数因子在A股中表现不佳,仅5个表现较好且具备经济学及统计学意义。
- A股市场亏损厌恶弱于美股,导致买卖非流动性因子表现差异,反映市场结构和投资者行为差异。
- Fama-MacBeth检验结果表明新因子能在剔除已有因子后提供显著信息增量,尤其是DOWNILLIQ因子。
- 因子库微调后纳入IVmonthly和EIVOL,替代旧反转与流动性因子,表现优于原因子库。
- 推荐在实际多因子模型中优先考虑DOWNILLIQ,因其表现稳健且样本表现优于UPILLIQ。
风险方面,强调量化模型基于历史数据,存在未来失效风险,极端市场情况下模型效果可能不稳,建议投资者动态跟踪与适时调整模型设置。[page::12]
---
三、图表深度解读
3.1 表1:新因子名称与计算方法
该表梳理16个新因子的名称和简要计算定义,涵盖了技术因子中流动性、风险、动量和投机特质的多个维度,凸显了报告对因子基础的完整交代。例如,DOWNILLIQ和UPILLIQ基于高频交易的买卖回归系数计算,NCSKEW基于收益率的负偏度三阶矩,IVmonthly基于Fama-French残差波动率加权平方和。该表为理解后续因子表现提供详细计算背景。[page::6]
3.2 表2:因子绩效指标(因子显著性)
展示了16个新因子的Rank IC、IR、t值及显著性比例数据。5个因子(DOWNILLIQ、UPILLIQ、NCSKEW、DUVOL、IVmonthly)均满足统计显著性且具有良好排序能力,特备是DOWNILLIQ和UPILLIQ表现尤为突出。
负Rank IC的DOWNILLIQ与IVmonthly表明预测方向为收益率的负相关,符合其作为风险指标的市场预期。其中夏普比和月度胜率等指标间接反映因子预测的稳定性和有效性。[page::6-7]
3.3 图1:因子rankIC相关性矩阵
图表清晰呈现DOWNILLIQ与UPILLIQ的高度负相关(-82%),说明买卖非流动性效应在A股市场呈对称分布,与美股亏损厌恶假设不同。NCSKEW与DUVOL高度正相关(85%),均为衡量暴跌风险的指标,反映二者本质同质。
IVmonthly与3个月和1年波动率分别有34%与39%的相关性,提示其涵盖的投机信息较为独立。该相关矩阵对报告因子选择与去重提供了直观科学支撑。[page::7]
3.4 图2:DOWNILLIQ因子收益情况
- 分组月均超额收益率表现出明显单调变化,1档收益率最高,10档最低,说明该因子有效区分了盈利能力。
- 多空组合净值稳步上升,月度多空收益多数为正,表明因子稳定带来正回报。
- 月度rank IC呈持续为负的波动,符合因子负相关的预期效果。
此图量化了因子测试阶段的重要绩效指标,证明该因子的投资应用价值。[page::8]
3.5 图3:DUVOL因子收益情况
- 分组月均超额收益单调性良好,多头端收益明显优于空头端,显示因子具有方向性预测能力。
- 多空组合净值曲线稳健增长,月度收益波动较小,显示该因子适用于风险调整的投资策略。
- 月度多空收益大部分为正,支持因子作为反转策略的有效指标。
此图与图2互补,共同说明技术类暴跌风险因子在A股的稳定性。[page::9]
3.6 图4:IVmonthly因子收益情况
- 分组超额收益存在单调性,但多头收益明显大于空头端,反映投机程度与未来收益的负相关关系。
- 多空组合净值稳健增长,但最大回撤较大(16%),夏普比相对较低,月胜率68.5%,波动性高于其他两个因子。
- 月度多空收益分布呈现一定负向偏斜,反映该因子波动受到市场环境影响较大。
该图揭示了IVmonthly因子适用于中长期投资组合但需关注风险管理。[page::10]
3.7 图5与图6:原因子库与Fama-MacBeth检验结果
图5列出基准12因子说明,图6展示这些因子在剔除新因子后的IC表现。其中,新因子中DOWNILLIQ和UPILLIQ仍保持IC和IR显著性,表现增量明显。DUVOL则因与反转类因子相关性高,剔除后贡献信息有限。
该对比验证了新因子与既有因子的独立性和增量价值。[page::11]
3.8 图7:加入新因子的因子库精简结果
图表显示加入IVmonthly、EIVOL等新因子后,因子库综合解释能力提升,整体因子权重和选入比例显著增加,表明因子库结构得到优化,模型收益稳定性提升。
该图为因子库优化提供了定量支撑。[page::11]
---
四、估值分析
本报告主要定位为因子测试及策略构建研究,未涉及具体估值模型的深入讨论,亦无明确目标价或推荐评级,研究重点在于因子有效性验证、信息增量分析及因子库优化指导。报告明确对因子IC、IR等统计量强调因子强度与预测能力,而非传统企业估值分析或目标价设定。
---
五、风险因素评估
报告明确量化模型基于历史回测数据,存在以下风险:
- 模型失效风险: 市场环境、结构、行为模式变化可能导致因子预测能力下降,历史有效性不保证未来持续有效。
- 极端市场风险: 大幅波动或市场异常情况下,因子表现可能剧烈偏离,造成策略回撤增大。
- 数据时效性限制: 部分因子如DOWNILLIQ与UPILLIQ因数据时间跨度较短,应用时需谨慎权衡样本代表性。
报告建议投资者紧密跟踪模型表现,结合实际调整配置,避免盲目依赖单一因素产生系统性风险。[page::0,12]
---
六、批判性视角与细微差别
- 时间样本长度限制: DOWNILLIQ和UPILLIQ因子使用的高频数据计算周期较短(2009年后),时间窗口不足可能影响因子稳定性和普适性。报告中建议“人为”加入因子,表明数据局限对模型构建的影响。
- 市场结构差异: A股市场买卖非流动性无显著非对称性与美股市场不同,提醒我们因子在不同市场的跨市场应用应慎重。不同市场亏损厌恶特征不同,因子表现结构差异较大。
- 反转类因子重叠问题: DUVOL剔除12因子后信息增量不显著,强调因子间相关性对因子库优化的重要性,建议在构建多因子模型时避免多因子高度相关带来的冗余。
- IVmonthly趋势与噪音分解的特殊性: A股中IVmonthly趋势与噪音因子均同方向负相关,区别于美股市场趋势项正相关情况,揭示A股投机波动特性或行为异质性,提示行为金融假说在不同市场的表现差异。
以上细节显示作者对因子选取及解释保持了较为谨慎和逻辑自洽的态度,趋向实证结果而非盲目推断[page::7,12]。
---
七、结论性综合
该报告系统批量测试了Harvey (2016)界定的16个技术类Alpha因子在A股市场的适用性和信息增量。
- 表现优秀因子: DOWNILLIQ、UPILLIQ、NCSKEW、DUVOL和IVmonthly是表现最为突出的5个因子,具备统计学显著性(|Rank IC|>0.05,IR>2.5),且各自代表独特风险维度,包括流动性非对称、暴跌风险及投机波动性。
- 市场特征揭示: A股亏损厌恶与美股迥异,买卖非流动性的非对称现象不显著,凸显中国市场的独特投资者行为。
- 因子相关与精简: DOWNILLIQ与UPILLIQ高度负相关,建议优先选入DOWNILLIQ因子,因其与其他因子相关性更低、也是美股市场表现更优因子。NCSKEW与DUVOL高度正相关且均衡量暴跌风险,推荐选用DUVOL进行替代。IVmonthly因子虽表现略弱,但依然具备信息增量,纳入因子库优化。
- 多因子模型建议: 基于因子精简方法,构建包括新加入IVmonthly和EIVOL的14因子模型,取代传统反转因子Ret1M和非流动性ILLIQ,提升因子库多样性和预测能力。
- 投资策略潜力: 该因子组别覆盖量化投资中的流动性风险、极端风险及投机等多角度,构建的多空组合均呈现较稳定的年化收益率(以DOWNILLIQ为例达29.7%)和良好夏普比,显示强投资应用价值。
综上,报告以严谨的统计检验结合经济学理论,对技术类新Alpha因子的有效性进行了全面验证,提供了切实可行的因子选股建议,尤其推荐关注DOWNILLIQ因子作为多因子模型核心之一。
本分析尊重报告原意,注重因子理论和实证表现的结合,提醒投资者注意模型历史局限和极端风险可能变化,以理性态度采纳本报告研究成果。
---
参考文献
报告依据多篇金融学经典论文,如Harvey (2016)、Fu (2009)、Brennan et al. (2012)、Chen et al. (2001)、Chordia et al. (2001)等,充分吸收国外成熟理论与实证研究成果,增强因子定义科学性。
---
图片引用
- 图2 DOWNILLIQ因子收益情况

- 图3 DUVOL因子收益情况

- 图4 IVmonthly因子收益情况

- 图7 因子库精简结果

---
综上所述,报告为A股技术类因子研究提供了详实、科学、实用的框架与结论,尤其突出强调了市场特性差异对因子表现的影响及因子增量信息的合理筛选,为量化投资策略的构建和优化提供了重要参考。