`

基于 K 线最短路径构造的非流动性因子——多因子系列报告之七

创建于 更新于

摘要

本报告提出基于K线最短路径的新型非流动性因子,充分利用高频数据提升非流动性代理的精度,显著增强因子预测能力。选股回测显示TS非流动性因子多空收益达17.3%,夏普比率1.405,优于经典定义。中性化处理后仍具较强选股能力。该因子在A股市场历史表现稳健,适合构建量化选股策略 [page::0][page::8][page::15][page::16][page::19]

速读内容


经典非流动性因子定义及其缺陷 [page::4][page::5]

  • 经典因子用日收益率绝对值除以成交量,度量单位成交量下市场冲击。

- 日内震荡行情时,因子易低估非流动性,导致代理不准确。
  • 平安银行9/21与9/22数据显示震荡行情下经典定义失效。




K线最短路径非流动性因子构造及高频数据应用 [page::6][page::8][page::9]

  • 创新定义以K线最短路径长度替代收益率绝对值,构造无向叠加路径长度代理非流动性。

- 高频K线(5分钟、15分钟等)下路径更接近实际交易路径,提升代理精度。
  • 使用5日移动平均平滑效果最佳。



因子效果评估与高频优势显著 [page::9][page::10][page::11][page::13]

  • 低频(日线)下K线最短路径因子与经典因子差异不大,5日MA下经典因子略优。

- 高频数据提升因子表现,IR与IC均随频率提升显著增强。
  • 在小时及更高频率数据下,K线最短路径因子超越经典定义。





非流动性因子变形与选股表现 [page::13][page::14][page::15]

  • 变形定义(先日内求和后比值)IC均值提升但IR略低。

- 变形定义未经移动平均的因子选股表现最佳,多空组合年化收益17.3%,夏普比率1.405。
  • 最终确定选用变形定义未平滑的TS非流动性因子作为主因子。

| 因子类型 | 年化收益 | 年化波动率 | 夏普比率 | 最大回撤 |
|------------|--------|----------|--------|--------|
| 原始定义(MA5) | 10.4% | 12.3% | 0.867 | -25.5% |
| 变形定义(MA5) | 14.4% | 12.4% | 1.147 | -24.7% |
| 变形定义(无MA) | 17.3% | 11.8% | 1.405 | -20.3% |



TS 非流动性因子选股组合表现 [page::16][page::17]

  • TS非流动性因子前组股票年化收益达18.2%,夏普比率0.8,最大回撤48.3%,明显优于中证全指。

- 前100支等权组合经过交易成本调整后仍有13.2%年化收益,具备可操作性。



剔除相关因子后TS非流动性因子依旧有效 [page::19][page::20]

  • 与市值、换手、动量等因子存在一定相关性,但剔除后因子仍具选股能力。

- 中性化后多空组合年化收益10.1%,夏普比率0.5,表现有所下降但仍显著。



深度阅读

金融工程报告详尽分析报告


报告标题: 基于 K 线最短路径构造的非流动性因子 ——多因子系列报告之七
作者及机构: 刘均伟,光大证券研究所,金融工程首席分析师
发布日期: 2017年11月22日
主题: 提出并验证一种基于高频K线最短路径构造的非流动性因子(简称TS非流动性因子),并对其有效性、预测能力及选股表现进行深度研究。
---

1. 报告概览



报告核心论点聚焦于传统非流动性因子定义存在的缺陷,尤其在日内震荡行情中的失效。作者创新性地提出了基于K线最短路径的非流动性代理变量,以更好地捕捉价格路径的真实波动,利用高频数据极大增强该因子对非流动性的代理能力和预测效果。最终提出名为TS非流动性因子的变形定义,选股表现优异,多空组合年化收益高,风险调整后回报(夏普比率)良好,且在剔除其他因子影响后依然保持显著的选股能力。

报告采用大量的统计检验指标(IC、IR、t统计量等)及分组回测方法对因子进行测试与验证。主要研究了日频及高频数据下不同定义下非流动性因子的表现差异,尤其强调高频K线数据下,最短路径定义显著超越经典定义,该结论具有重要的实证意义和应用价值。

风险提示明确指出,所有结果均基于历史数据和模型,存在失效风险。

---

2. 报告结构逐节详解



2.1 非流动性因子的经典定义(第4-6页)


  • 关键论点:

流动性定义为市场中买卖价格合理、快速成交的能力,影响因素包括市场冲击、价差、等待时间与交易成本。流动性不好会增加风险,因此理论上流动性差股票未来收益率应该更高。由于非流动性难以直接度量,经典非流动性代理因子是Amihud (2002)提出的收益率绝对值与成交量比值的移动平均。
  • 逻辑解释:

该因子试图通过单位成交量对收益率的冲击来体现流动性风险。采用移动平均的目的是增强因子稳定性及降低换手率。
  • 不足之处:

经典定义存在根本缺陷——分子收益率为有向叠加(涨跌抵消),分母成交量为无向叠加(始终正向累加),因此在震荡行情中无法正确反映市场冲击,导致对非流动性的低估。文章以平安银行9月21-22日为案例,展示经典因子在连续无重大事件的背景下出现非流动性估计剧烈波动,实际与震荡行情不符。
  • 表1数据:

经典因子在A股2010-2017年IC均值约在3.17%-4.25%,IR值0.328-0.464,周期越短,效果越好,说明经典因子在低频下有效但存在一定局限。[page::4,5]
  • 图解说明:

图1展现两日日线价格与成交量,21日单边上涨,22日日内震荡;图2展示15分钟价格频率,说明震荡行情下经典因子失灵的直观原因。[page::6]

---

2.2 基于K线最短路径的新非流动性因子构造(第6-8页)


  • 改进思路:

提出分子与分母叠加方式需统一,避免经典定义中收益与成交量叠加方式不匹配带来的失效。通过“全有向”叠加(赋予成交量涨跌符号),虽逻辑上合理,但实际可能产生负值并变得不稳定,因此非优选。
  • 最优选择为全无向叠加,核心创新:

定义“最短路径”长度为K线价格变动的无向总路径长度,等同于价格穿越区间的上升和下降幅度之和,即
$$
\text{Shortest Path} = 2 \times (High - Low) - |Open - Close|
$$
用成交额做分母,形成新的非流动性因子。
  • 高频数据应用:

将日K线拆分成多根高频K线(5分钟、15分钟等),计算这些K线最短路径和成交额的比率并取移动平均,提升代理精度。
  • 图3示意:

蓝色图解清晰展示了完整K线路径、多个可能完整路径以及最短路径的区别,直观诠释了“路径”这一概念。[page::7,8]

---

2.3 高频数据提升因子预测能力(第9-14页)


  • 低频(日线)时,经典与最短路径因子效果相近甚至经典稍优。

经典因子可能受收益率本身Alpha效应影响有一定性能优势;同时单根日K线最短路径难以近似完整路径,信息利用有限。
  • 高频数据(1小时、30分钟、15分钟、5分钟)下,K线最短路径因子效果明显提升,且随频率提升单调增强。

表3数据清晰显示,5分钟线MA5周期下IC均值最高(约4.72%),IR达到0.57,明显优于日线水平。IC标准差下降,因子稳定性增强。
  • 相比之下,经典非流动性因子的IC均值与IR对数据频率敏感度较弱,IC无明显提升,IR有小幅增加。
  • 图4-11中的柱状图与折线图,明示经典与最短路径因子在不同MA周期及频率下的表现,显示最短路径因子特别是高频下具有更强预测能力和统计显著性。
  • 因子变形定义尝试(调整求和顺序和移动平均方式)结果显示变形定义IC均值较高但波动更大,IR略低。后续回测选股表现变形定义因子优于原始定义。

图12-15全面展示了不同移动平均方式与定义下IC、IR的表现对比。[page::9,10,11,12,13,14]

---

2.4 非流动性因子选股表现(第15-20页)


  • 回测框架(表5)严格,覆盖2010-2017年,全部A股,月度调仓,行业内分组,市值加权,未计交易费。
  • 选股实验结果显示TS非流动性因子(即变形定义未经平滑处理)表现最佳。

多空组合年化收益达17.3%,年化波动率11.8%,夏普1.405,最大回撤20.3%。
整体因子组合年化收益18.2%,波动24.8%,夏普0.8,最大回撤48.3%。月换手率31.4%,均优于中证全指基准(12.5%收益,8.3%波动)[表6,7,图16-18]
  • 挑选股票数量减少到前100支,等权选股组合表现更好:年化收益20.29%,波动23.24%,夏普0.91;市值加权组合稍逊。

考虑交易成本后,双边千六成本使等权组合年化收益降至13.2%,市值加权降至9.85%。
图19-21直观反映了组合净值表现与交易成本的影响。[page::15,16,17,18]
  • 年度回测显示TS因子在多数年份超额收益明显,尤其2014、2015年表现突出,2016-17年波动较大。

表8、9数据详尽反映了多年度选股表现指标。[page::16,17,18]

---

2.5 剔除相关因子后TS因子自身独立效用(第18-20页)


  • 相关因子分析(见图22)显示TS非流动性因子与VSTD(波动)和市值最强相关(-0.55与-0.34),与换手、动量、波动率相关较弱。
  • 通过横截面回归剔除市值、动量、换手、波动等因子影响后,因子效力有所下降但仍显著。

IC均值下降至3.5%,IR=0.39,年化多空收益5.52%,夏普大幅回落至0.52,最大回撤扩大至25.95%。
  • 中性化后构造的最高组合仍具有较强的选股能力,但收益及稳健性较非中性化前减弱。

图23-26及表10展示了中性化后因子IC序列、分组单调性及年度表现对比。[page::18,19,20]

---

2.6 风险提示(第21页)



模型及测试基于历史历史数据,未来回测效果及模型稳定性不可保证,存在失效风险,投资需谨慎。[page::21]

---

3. 图表深度解读



图1-2(第6页)


描述:展示平安银行9/21和9/22两日价格与成交量日线及15分钟线图。
解读:9/21单边上涨,9/22日内震荡明显;成交量差异小而收益率差异大,经典因子计算导致非流动性估计波动异常。
联系文本:直观说明经典因子在震荡行情下的测量误差。[page::6]

图3(第8页)


描述:示意一根K线对应的完整价格路径、多种可能路径和最短路径。
解读:最短路径通过区间高低价和开收盘价计算,能较好近似无向路径长度,克服经典定义的方向性偏误。
联系文本:支持构造新代理变量的理论基础。 [page::8]

图4-5(第10页)


描述:经典与K线最短路径日频因子在不同移动平均周期的IR和IC均值对比柱状图。
解读:两因子在日频下表现接近,5日MA时经典因子略优;IC和IR随MA缩短提升,反映平滑程度影响稳定性。
联系文本:说明短周期平滑能提升因子效果,K线最短路径优势尚不明显。[page::10]

表3、图6-7(第11页)


描述:不同频率K线最短路径因子IC、IR随MA周期变化。
解读:高频率(5分钟)数据下IR最高(达0.57),IC均值和IR均随频率上升,显示高频数据带来更高预测力及稳定性。
联系文本:验证高频K线最短路径定义优势显著。 [page::11]

表4、图8-9(第12页)


描述:不同频率经典非流动性因子IC、IR表现。
解读:经典因子IC均值对频率无明显规律,IR稍随频率变动;波动未明显减少,稳定性不足。
联系文本:与最短路径因子的对比进一步凸显其劣势。 [page::12]

图10-11(第13页)


描述:5日MA平滑后,经典与最短路径因子的IC、IR对比。
解读:随频率升高,两者差距明显拉大,尤其是在5分钟频率,最短路径因子领先明显。
联系文本:陈述最短路径因子能充分利用高频信息。 [page::13]

图12-15(第14页)


描述:不同移动平均方式与因子定义变形对IC、IR的影响。
解读:加权与简单移动平均差异小,变形定义IC明显高但IR略低,表明交易信号强度增强但稳定性稍损。
联系文本:辅助选股回测因子定义选择。 [page::14]

表6-7,图16-18(第15-16页)


描述:TS非流动性因子多空组合统计指标及分组表现,配合IC序列及组合净值曲线。
解读:多空收益17.3%,夏普1.405,最大回撤20.3%;净值曲线表现分组单调,显示因子强有力的选股能力和风险收益特征优良。
联系文本:支撑TS因子选股效果优秀结论。[page::15,16]

表8-9,图19-21(第16-18页)


描述:TS因子年度回测指标、前100只股票组合表现及交易成本敏感性分析。
解读:前100股票组合年化收益20.29%,双边千六成本后降至13.2%;等权组合较市值加权更优,交易成本对收益影响显著。
联系文本:实证因子选股价值与实际交易限制。 [page::16,17,18]

图22(第19页)


描述:TS因子与其他大类因子的IC相关系数绝对值。
解读:与VSTD和市值关联最强,表明与波动和规模因子有重叠信息,换手及动量关联较弱。
联系文本:指导后续中性化处理。 [page::19]

图23-26,表10(第19-20页)


描述:中性化后TS因子IC序列、分组单调性及年化表现对比。
解读:中性化处理使信息含量减少,收益率下降至10.1%,夏普0.5左右;2014年表现拖累整体,其他年份较稳定。
联系文本:证实TS因子包含独立有效信息,但受其他因子影响显著。 [page::19,20]

---

4. 估值分析



报告未涉及传统估值分析方法(如DCF、市盈率分析),因其聚焦于金融指标因子挖掘与量化选股策略构建。研究主要曝光于因子构造、统计评估和选股回测分析,并不涉及股票的基本面估值层面。

---

5. 风险因素评估


  • 模型风险:基于历史数据构建,未来表现可能不符合过去。

- 数据风险:高频数据质量、交易异常可能导致因子失效。
  • 交易成本风险:高换手率带来滑点和费用问题,影响实际收益。

- 报告未作策略匹配风险管理方案的详细说明,仅警示模型存在潜在失效风险。[page::21]

---

6. 审慎视角与细微差别


  • 优点:

- 创新利用K线最短路径近似价格波动路径长度,通过高频数据显著提升流动性代理变量的预测能力。
- 多维实证验证,指标体系完善,结果具备较强说服力。
  • 潜在不足:

- 高频数据获得与处理门槛高,实际部署存在成本与数据完整性问题。
- 变形定义虽然IC更高但波动性也大,可能增加策略风险,报告未深入讨论其稳定性管理。
- 中性化处理后表现大幅下滑,显示因子与其他因子交叉影响显著,独立信号强度有限,实际应用时需结合多因子协同。
- 换手率较高带来的交易成本影响或许被低估,尤其在流动性较弱股票中更显著。
  • 细微点:

- 选股组合数目庞大(600+只),从实操角度看不够集中。
- 报告中对频率更高如1分钟K线下因子表现未能直接验证,推断性质。
- 对未来可能衰减或市场结构变化对因子稳定性的讨论较少。

---

7. 结论综述



该报告通过精准构造基于K线最短路径的非流动性因子,创新利用高频数据解决了经典非流动性度量在震荡行情下失效的问题。实证显示该TS非流动性因子在高频数据支持下显著提升了因子信息效用和预测能力,尤其是在5分钟至15分钟数据频率,通过多重统计指标验证了广泛的有效性和稳健性。

选股回测表现突出,多空组合年化收益达17.3%,夏普1.405,且剔除相关因子后的独立信号统计特征仍显著,证明该因子的实际应用价值。交易成本考量凸显了策略实施的现实挑战。整体而言,TS非流动性因子具备成为多因子投资框架重要组成部分的潜力,特别是在需精准捕捉流动性风险的投资和量化交易中。

本研究对于高频数据使用及价格波动路径刻画提出了新的思路,有助于更正确地理解市场冲击及流动性模式,推动市场流动性因子研究拓展。未来工作可进一步验证更高频数据,结合风险管理机制优化因子稳定性与应用。

---

重要图片与表格展示


  • 图1:平安银行9/21-22日价格与成交量日线图

- 图2:平安银行9/21-22日价格15分钟频率图
  • 图3:K线形成的完整路径与最短路径示意图

- 图4:不同移动平均下IR值对比
  • 图5:不同移动平均下IC均值对比

- 图6:不同频率下K线最短路径因子IR值
  • 图7:不同频率下K线最短路径因子IC均值

- 表3:不同频率K线最短路径非流动性因子测试效果 见正文
  • 图10-11:不同频率数据下评估经典与K线最短路径因子IC、IR对比

- 图16-18: TS非流动性因子IC序列、分组选股净值
  • 图22:TS非流动性因子与其他大类因子相关性

- 图23-26:中性化后TS非流动性因子IC序列、分组及选股表现

---

溯源标注


本文所有结论均直接源自光大证券刘均伟2017年11月22日发布的《基于K线最短路径构造的非流动性因子》研究报告[page::0-21],引文均已对照页码。

---

总结



此份研究报告提供了非流动性因子研究中的重要突破,利用K线最短路径的定义显著提升了传统因子的有效性和预测能力,特别是在高频数据情形下。TS非流动性因子凭借其独特构造,在选股表现中展现了稳定的超额收益及良好的风险调整收益,且独立贡献明显。报告分析严谨、数据充分,既揭示理论缺陷,也提供切实可行的解决方案,对量化投资和因子研究具有实用价值。然而实际操作中仍需注意高频数据获取、因子综合应用、中性化处理带来的效果波动以及交易成本等限制因素。该因子的未来推广和优化值得期待。

---

如需详细讨论报告具体章节内容或进一步解读相关数据,请告知。

报告