高频因子(八):高位成交因子——从量价匹配说起
创建于 更新于
摘要
本报告系统构建了高位成交因子,主要通过量价相关性、加权收盘价比、加权偏度和成交额熵等因子刻画个股在高位和低位成交的密集水平,反映交易中的羊群效应及价格反转现象。各因子在全市场及中证800均展现稳健的选股能力,剥离风格因子线性影响后,量价相关性、加权偏度和单位一成交额占比熵依然保留有效信息,三者等权合成的高位成交因子表现最佳,多空收益稳定且具备较强超额收益,为量化选股提供了有力工具 [page::1][page::4][page::5][page::17][page::18]
速读内容
- 高频因子背景及概述 [page::1]

- 高位成交因子重点关注个股高位和低位成交的密集程度,反映市场羊群行为和未来价格反向修正。
- 通过量价相关性、加权收盘价比、加权偏度、成交额熵等指标,全市场及中证800均显示选股能力。
- 量价相关性因子构建及表现 [page::4][page::5]


- 以成交量与股价时间序列的相关系数衡量量价匹配程度,高相关显示高位成交聚集。
- 因子表现稳定,2005年以来全市场及中证800多空收益显著,分年风险指标显示年度间波动。
- 加权收盘价比及其回测表现 [page::6][page::7]


- 通过成交量加权的收盘价与简单均价比值反映高位成交密集度。
- 回测显示该因子在全市场和中证800表现出一定的超额收益,分年风险指标呈现一定波动。
- 加权偏度因子设计与表现 [page::8]


- 以成交量加权的价格偏度衡量价格分布对称性,负偏度越大意味着成交越集中在高价位。
- 因子在多个市场均表现良好,具有显著多空收益,尽管部分年份出现回撤。
- 成交额熵因子及表现分析 [page::9][page::10][page::11][page::12]




- 基于成交额的单位占比熵反映成交分布的混乱程度,信息熵越大成交体系越稳定。
- 单位一成交额占比熵因子表现稳定,成交额占比熵因子在中证800有一定波动,多空收益整体较为稳定。
- 高位成交因子整体风险统计与风格中性分析 [page::12][page::13][page::14]
| 指标 | 量价相关性 | 加权收盘价比 | 加权偏度 | 单位一成交额占比熵 | 成交额占比熵 |
|---------------|------------|--------------|----------|--------------------|--------------|
| IC (%) | -5.29/-4.41| -5.09/-5.04 | -5.98/-4.98 | -4.42/-4.31 | -6.23/-6.86 |
| ICIR (%) | -55.92/-37.56| -62.15/-48.69| -81.23/-52.43 | -58.40/-44.15 | -77.53/-68.52|
| 超额收益(%) | 1.91/1.67 | 2.59/2.02 | 2.66/2.66 | -0.93/-1.13 | 2.36/3.17 |
| 多空收益(%) |16.43/12.22 |13.02/10.91 |19.74/15.16|15.64/10.64 |20.80/16.97 |
| 多空夏普 | 1.48/1.19 | 1.35/1.13 | 2.02/1.71 | 1.87/1.33 | 2.05/1.81 |
- 多数因子在剥离风格因素后表现有所下降,量价相关性与加权偏度依然表现较强,成交额占比熵与单位一成交额占比熵稳定度优异。
- 因子与传统风格因子相关性较低,表明具备独立选股信息。
- 合成高位成交因子及其回测总结 [page::14][page::15][page::16][page::17][page::18]




| 指标 | 全市场中性前 | 全市场中性后 | 中证800中性前 | 中证800中性后 |
|---------------|--------------|--------------|--------------|--------------|
| IC (%) | -6.53 | -5.13 | -5.65 | -4.78 |
| ICIR (%) | -75.78 | -94.25 | -51.03 | -66.79 |
| 超额收益(%) | 3.02 | 1.99 | 2.39 | 1.26 |
| 信息比 | 0.48 | 0.40 | 0.44 | 0.30 |
| 多空收益(%) | 23.12 | 18.63 | 15.73 | 13.08 |
| 多空夏普比 | 2.13 | 2.46 | 1.59 | 1.79 |
- 合成因子融合了量价相关性、加权偏度、单位一成交额占比熵,保留了更全面的信息增量和较强的选股能力。
- 回测结果显示合成因子在风格因子中性前后均表现良好,尤其多空夏普比提升,说明风险调整后收益更佳。
- 尽管超额收益在中性后略有下降,但多空收益依然稳定,验证了高位成交因子在实战中的潜在应用价值。
- 风险提示: 模型存在失效风险,历史表现不代表未来收益,投资需谨慎 [page::1]
深度阅读
高频因子专题报告详尽分析报告
---
一、元数据与报告概览
本报告题为《高频因子(八):高位成交因子——从量价匹配说起》,由长江证券研究所的资深分析师覃川桃、郑起撰写,报告发布时间为2020年9月16日,属于金融工程专题研究报告。报告围绕“高位成交因子”设计与应用展开,核心探讨了如何通过成交量与价格的匹配关系,从多个角度刻画个股在不同价位的成交密集度及相关的选股能力。报告并未提供传统意义上的投资评级和目标价,而是聚焦于学术性因子的构建、回测和分析,主要意在透露高位成交因子在量化选股中的潜力和局限。
报告核心信息包括:
- 高位成交因子主要刻画个股于高位及低位的成交密集程度;
- 因子以成交量与价格匹配程度为基础,反映价格高估及潜在后续反转趋势,及低位加仓后的价格上升空间;
- 多种构建因子方法(量价相关性、加权收盘价比、加权偏度、成交额熵)系统介绍并分别进行回测验证,剥离风格因子影响后仍具有稳定的选股能力;
- 综合合成因子具备更强的稳定性及选股优势。
报告强调,因子基于历史数据,有一定失效风险,不保证未来收益表现。整体思路在金融工程量化因子构建领域具一定创新价值。[page::0,1]
---
二、逐章节深度解读
2.1 报告要点章节
本节总结了高位成交因子的主要设计理念与实证检测框架,核心观点是高位成交多的个股可能存在羊群效应导致局部价格高估,进而未来可能出现反转,低位成交多则可能隐藏价格上行空间。构建了量价相关性、加权收盘价比、加权偏度和成交额熵四类因子,分别从不同维度刻画成交密集状态并剥离市场风格线性因素影响,均显示了一定的选股能力。
此外,报告首次提出“合成因子”概念,通过对上述三类因子(量价相关性、加权偏度、单位一成交额占比熵)等权求和,稳定捕捉高位成交特征,明显提升了选股表现和抗干扰性。[page::1]
---
2.2 量价相关性因子
报告以“成交量与收盘价时序相关性”作为因子定义,即计算个股在过去区间成交量序列与对应收盘价序列的Pearson相关系数。价量序列趋同程度越高,说明个股成交密集于高位,存在羊群交易特征。
实证回测(图1、图2)展示该因子2005年以来在全市场及中证800范围内稳定取得超额收益与多空收益,分年风险指标(表1)进一步量化展现因子在指标如超额收益、信息比率、夏普比的稳健表现,尽管近年存在波动,但长期看具较强线性分组能力及选股价值。
此处因子逻辑基于“短期过度反应与反转假说”,即量价相关性高的个股往往因行为偏差被高估,未来可能呈现一定的收益修正。[page::4,5]
---
2.3 加权收盘价比因子
加权收盘价比是基于成交量加权计算的收盘价与简单平均收盘价的比值,反映成交集中于价格高位程度。即若成交活跃于价格较高区间,加权平均价高于简单平均价,该因子值较大。
数学表达式为:
\[
\text{加权收盘价比} = \frac{\sum{t=1}^T \frac{volt}{VOL} \times closet}{\frac{\sum{t=1}^T closet}{T}}
\]
其中 \(VOL = \sum{t=1}^T volt\) 为总成交量,\(T\)为时段数量。
实证结果(图3、图4及表2)显示该因子自2005年以来在全市场及中证800均具较好稳定表现,多空收益稳定但剥离风格影响后选股能力有所下滑。该因子体现了成交与价格的直接交互,代表着高价位密集成交情况,成为关注个股高位资金动向的有效指标。[page::5,6,7]
---
2.4 加权偏度因子
偏度量度价格分布的非对称性。传统偏度未考虑成交量,假设每时段成交量相等。此报告创新性地引入成交量加权偏度,即成交量较大的时间段对价格偏度的贡献更大,更贴合实际成交分布。
垂直表达式如下:
\[
wt = \frac{volt}{VOL}, \quad \bar{close} = \text{收盘均价}, \quad \sigma = \text{收盘价标准差}
\]
成交量加权偏度公式中,负偏度程度越大,意味着个股成交密集于价格高位。
回测(图5、图6及表3)体现该因子具备较强的超额收益和多空收益,且多空收益指标稳定,显示了较好的风险调整收益。因子在解释成交对价格分布的细粒度影响方面表现优异。[page::7,8]
---
2.5 成交额熵因子
熵指标源于信息论,用以衡量系统状态的混乱程度。报告对成交行为进行熵刻画,通过转换成交量与价格乘积(成交额)占比为状态概率,构建单位一成交额占比熵因子与成交额占比熵因子。
定义:
\[
H = -\sum{i=1}^N pi \ln pi, \quad pi = \frac{voli}{VOL} \times \frac{close_i}{CLOSE}
\]
高熵值对应成交分布较为均匀稳定,低熵则指示成交的集中度较高,体现体系混乱度。
回测图表(图7~图10)及分年风险指标(表4、表5)显示,该因子整体具备稳定的多空收益能力,但多头区分能力较弱。其创新点在于用信息熵度量非传统量价关系,提供了新的市场行为描述视角。
此外,成交额占比熵因子较强的收益表现进一步证实熵方法在成交行为分析中的实用性。[page::9,10,11,12]
---
2.6 高位成交因子整体风险指标及风格中性表现
各高位成交因子均独立于收益率构建,且多与传统风格因子(分红、盈利、成长、价值、反转、波动率等)相关性较低(表7),体现了因子的信息增量。
整体风险指标(表6)显示:
- 加权偏度与成交额占比熵的IC及ICIR最高,说明它们预测能力最为显著;
- 量价相关性和加权收盘价比具一定的超额收益,但剥离线性风格因素影响后,部分因子的IC大幅下降,尤其加权收盘价比的预测能力减弱。
中性后风险指标(表8)验证,与前述一致,中性处理对加权偏度和量价相关性的预测能力影响较小,其他因子则丧失明显信息。说明部分因子与市场风格关联较强,实际应用中需要注意。
以上内容表明,量价相关性和加权偏度是稳健的高位成交因子,适合作为策略的基础。[page::12,13,14]
---
2.7 合成因子表现
根据各因子相关性(表9),量价相关性、加权偏度和单位一成交额占比熵具有较好正相关性且信息增量显著,因此报告采用对其等权合成形成新的高位成交综合因子。
回测结果(图11~图14,表10、表11)显示合成因子在全市场及中证800均取得良好选股能力,在风格中性前后均存在超额收益和多空收益,且多空收益稳定,但中性处理使超额收益有所下降,夏普比等风控指标有所提升。
时间序列上,合成因子收益表现受市场环境影响存在波动,如2015年大牛市的回撤,但长期趋势表现稳健,具有较强的风险调整选股能力。
风险指标(表12)进一步证明合成因子维持较高的稳定性,尤其多空夏普比提升,说明合成因子风控优势明显。[page::14,15,16,17]
---
2.8 总结章节内容
报告总结指出:
- 高频因子中的高位成交因子基于量价匹配理论,重点刻画个股高低位成交的密集度;
- 量价相关性、加权收盘价比、加权偏度、成交额熵四类因子分别从不同侧面刻画成交密集和价格状态关联性;
- 多数因子在剥离传统风格因子后的收益预测能力仍显著,尤其量价相关性和加权偏度适用性更佳;
- 合成因子以三个主要因子等权组合,兼顾了信息覆盖和稳健性,展现出相对更为优异的选股能力和抗风格风险能力;
- 高位成交较多的股票表现反转效应明显,理论和实证均表明该类因子存在一定的套利机会,然而由于基于历史数据,存在模型失效风险。
本报告为量化选股研究提供了一条有效的新路径,同时对投资者警告其滞后性和风险隐患,强调谨慎使用。[page::17,18]
---
三、重点图表深度解读
3.1 图1与图2——量价相关性因子回测净值
图1显示自2005年以来全市场量价相关性因子回测收益表现,不同分组间收益分化明显,多空净值线条稳步上升,表明组间排序线性良好。灰色曲线(比价指标)持续上涨,说明因子组别高低价差越大,能获得超额收益。
图2为中证800范围对应表现,整体趋势类似,全市场表现更强且较平稳,中证800因子收益波动较大,尤其在2015年牛市出现回撤,表现周期性略高。
两图支持因子稳定性和有效性验证,配合表1风险指标,表达了该因子良好的历史选股能力。[page::4,5]
---
3.2 图3与图4——加权收盘价比因子回测净值
图3为全市场回测,显示该因子各组收益呈现良好层次性,最高组与最低组差距明显。多头组较为集中在右上方,基线和比价指标持续走高,但近年波动明显。
图4为中证800表现,趋势相似但整体回撤更明显,且收益呈现震荡,说明该因子在窄范围指数中表现存在不确定性。
对应表2风险指标显示,全年分布收益、信息比率存在起伏,积累了稳定但波动性较大的选股收益。[page::6,7]
---
3.3 图5与图6——加权偏度因子回测净值
图5和图6分别为全市场和中证800的加权偏度因子回测,均显示多空收益净值逐渐提升,组间区分度明显。相比加权收盘价比,条件更加稳定。特别是多空夏普比指标表明风险调整后收益优良。
表3数据支持因子收益的持续性强,但分年也有回撤,表明因子表现与市场环境相关。[page::8,9]
---
3.4 图7至图10——成交额熵因子系列回测
单位一成交额占比熵和成交额占比熵因子分别于全市场和中证800的回测结果(图7至图10)均表现出稳定的多空收益曲线,但多头组表现不如空头明显,体现因子更强的空头识别能力。表4和表5的风险指标对应出因子有效性,但也暴露了其多头分组识别的弱势。
这些图和数据揭示该因子通过信息熵视角对成交行为的捕捉,更侧重于解释成交结构混沌与市场定价的关系。[page::10,11,12]
---
3.5 表6至表8——高位成交因子整体及风格中性后风险指标
表6整合多个因子的IC、超额收益及信息比数值,突出加权偏度和成交额占比熵因子表现较优。表7展示因子与传统风格因子相关性,确认了相对独立性。
表8为风格中性后的指标,表明部分因子,如加权收盘价比和成交额占比熵,丧失多头收益潜力,而量价相关性和加权偏度因子依然保持展示了信息优势,表明因子稳健性不同差异明显。[page::12,13,14]
---
3.6 图11至图14及表9至表12——合成因子表现与风险指标
图11、12及图13、14分别展示合成因子及其风格中性后的回测净值,均体现出强劲的多空收益和分组线性,特别中性后的稳定性提升明显。
表9显示合成因子与单因子间的相关性,明显高于加权收盘价比与单位一成交额占比熵,反映因子选取合理。表10、11、12的风险指标明确了合成因子的持续超额收益及风险调整表现,风格中性处理后稳定性增强但超额收益略有减少。
整体回测结果与风险统计验证了合成因子结构的优越性与适用价值。[page::14,15,16,17]
---
四、风险因素评估
报告明确提出高位成交因子存在模型失效风险,主要原因包括:
- 反转效应基于历史规律,未来因市场结构、交易机制变化可能不再适用;
- 因子基于历史成交量与价格数据,若市场流动性或行为模式改变,则预测能力将减弱;
- 部分因子剥离风格因子后表现下降,且与部分风格因子具相关性,存在潜在同质化风险。
报告并无具体风险缓解策略,但强调使用时需结合动态市场环境,持续跟踪模型有效性,避免盲目长期依赖。[page::1,18]
---
五、批判性视角与细微观察
- 因子回测统计上的负值IC偏低:IC指标绝大部分为负,说明因子与收益呈负相关,符合反转逻辑,但应注意此类反转因子存在时效限制,需要灵活调整持仓周期。
- 超额收益波动性较大:部分年份因子表现负面,提示因子绩效存在周期性,投资者不能盲目乐观,需考察投资时窗。
- 信息比率较低:多个因子信息比在0.3-0.6之间,表现中等,需结合其他因子使用优化。
- 报告中风格因子剥离后的因子指标下降明显:此点提示该因子部分信息可能来自传统风格暴露,实操时应关注因子重叠风险。
- 合成因子设计科学,但未提供动态权重调整或机器学习优化路径:虽然等权求和简便有效,但未来可探索更优组合方式。
- 报告未具体说明因子计算的时间维度(如小时、日、周),仅笼统提及时间段,缺乏更细数据处理说明,影响复制与理解。
总体报告学术水准高,分析细致,但作为投资决策支撑需配合风险监控及动态调节机制。[page::1,17]
---
六、结论性综合
本报告系统构建了“高位成交因子”体系,重点突破了利用量价匹配关系刻画个股成交密集度与价格定位的传统难题。其基于成交量与收盘价的时间序列相关性、成交量加权价格偏度、加权收盘价比及成交额熵等多维度因子,科学揭示了高位成交与价格反转的内在联系。回测数据显示,这些因子在全市场及主要指数中均表现出稳健的选股能力,特别是剔除风格影响后,量价相关性和加权偏度因子依然维持预测收益能力,反映因子信息含量丰富且不依赖传统风格因子。
合成因子的设计进一步整合各单因子信息,兼顾了信息增益与风险控制,多空收益明晰且持续,风格中性后亦表现可观,体现了高位成交因子在量化策略中的实用价值。
尽管存在模型失效风险和历史数据局限,报告为量化投资者提供了稳定的交易信号来源和因子多样化思路,预示高位成交因子在今后投资模型构建中具备较高研究及应用价值。
此外,报告中详尽的图表(如量价相关性因子回测净值图、加权偏度及成交额熵等多个指标的风险分析表)清晰阐释了各因子的表现及风险特征,为专业投资人士提供了可信赖的量化因子研究参考。
综上,报告对高频因子研究领域做出实质性贡献,尽管未直接给出股票买卖评级,但对投资策略构建具指导意义,建议投资者结合动态市场环境,合理利用高位成交因子,实现风险收益优化。[page::1~18]
---
参考图片
报告首页要点图片

量价相关性因子回测净值(全市场)

量价相关性因子回测净值(中证800)

加权收盘价比因子回测净值(全市场)

加权收盘价比因子回测净值(中证800)

加权偏度因子回测净值(全市场)

加权偏度因子回测净值(中证800)

单位一成交额占比熵因子回测净值(全市场)

单位一成交额占比熵因子回测净值(中证800)

成交额占比熵因子回测净值(全市场)

成交额占比熵因子回测净值(中证800)

合成因子回测净值(全市场)

合成因子回测净值(中证800)

合成因子中性后回测净值(全市场)

合成因子中性后回测净值(中证800)

---
综上分析,本报告为高频因子研究提供了系统方法论和翔实实证,适合从事量化投资研究者深度学习参考。