利用高频数据监测机构动向
创建于 更新于
摘要
本报告利用傅里叶变化将股票交易量时序数据从时域转换为频域,提取高频交易峰值以探测机构算法交易的活跃度。构造了三个特征$\mathbf{B}{+}\mathbf{S}$、B-S、B/S,分析其与股价中短期涨跌幅的相关性及平稳性。结果显示,$\mathbf{B}{+}\mathbf{S}$与周涨跌幅呈负相关,反映机构交易活跃度与股价下跌趋势相关,且大多数股票的B-S表现出显著平稳性,算法单交易方向与股价变动方向一致,机构算法交易活跃度能够预测收益趋势,为挖掘机构动向提供了有力工具 [page::0][page::2][page::9][page::11]
速读内容
- 高频数据的技术原理与作用 [page::3][page::4]



- 通过傅里叶变化将时间序列信号转换到频域,识别显著峰值对应的交易频率。
- 高频峰值显示机构以固定频率进行算法交易,低频峰值多为个体投资者随机交易特征。
- 傅里叶变化能有效去噪,提取交易信号中高频成分,用于捕捉机构交易活跃度。
- 高频算法交易峰值识别及数据处理技术 [page::7][page::8]



- 对买卖单交易量按日进行快速离散傅里叶变换(DFT),用峰值查找算法筛选特征峰值,峰值数量反映机构活跃程度。
- Prominence 参数调整峰值选取灵敏度,本报告采用prominence=3筛选显著峰值。
- 案例分析显示万科买卖单峰值明显,峰值对应了固定频率交易习惯,验证算法单峰值检测方法可行。
- 关键指标构建与统计分析 [page::9][page::10][page::11]
| 特征 | 均值相关系数 | 相关系数分位数 | 平稳性显著比例 | 截面相关t值 | 显著性水平 |
|---------------|--------------|-----------------------|-----------------|-------------|-------------------------|
| $\mathbf{B}{+}\mathbf{S}$ | -0.0559 | 75%分位:0.0014 | 86.3%股票(10%)| -2.070 | 10%显著 |
| B-S | 0.0035 | 大部分为正 | 99.9%股票(1%) | 2.015 | >10%(不显著) |
| B/S | 0.0029 | 75%以上为正 | 37.9%股票(10%)| 3.381 | 10%显著 |
- $\mathbf{B}{+}\mathbf{S}$与股价周涨跌幅负相关,反映机构活跃度增高常伴随股价中短期下跌。
- B/S和B-S反映算法单买卖方向,B/S与周涨跌幅正相关,表明机构买卖单方向与价格变动方向一致。
- 特征在绝大多数股票上表现出时间平稳性,尤其是B-S和平稳性最高。
- 量化因子构建及应用价值 [page::9][page::11]
- 构建三个基于算法单峰值的因子:买卖峰值之和($\mathbf{B}{+}\mathbf{S}$)、买卖峰值差(B-S)、买卖峰值比(B/S)。
- 通过快速离散傅里叶变换提取买卖单高频峰值,峰值数量和比值反映机构整体与方向性参与度。
- 因子体现了机构交易行为,短期内与股价变动显著相关,适合作为机构动向监测和收益预测的量化因子。
深度阅读
报告深度分析报告
——《利用高频数据监测机构动向》,国泰君安证券研究,金融工程团队,2021年
---
1. 元数据与概览
报告标题:《利用高频数据监测机构动向》
作者与机构:金融工程团队,主导分析师陈奥林、刘昺轶、杨能等,国泰君安证券研究所
发布日期:报告数据时间截至2021年7月,报告发布时间大约为2021年7月底至8月初
研究主题:应用傅里叶变化这一信号处理工具,从高频交易数据中探测机构投资者通过算法交易的活跃度,揭示机构动向与股价变动的关系,挖掘股价趋势预测信号。
核心论点与结论概述:
- 本报告创新地将信号处理领域的傅里叶变化应用于A股高频交易盘口数据,区分买卖单中的高频算法交易与低频个体投资者交易。
- 构造并验证了三个关键特征:买卖峰值数量之和($\mathbf{B}{+}\mathbf{S}$)、买卖峰值数量差(B-S)及比值(B/S),用以量化机构的交易活跃度与交易方向。
- 发现$\mathbf{B}{+}\mathbf{S}$与股票中短期周涨跌幅呈负相关,表明机构交易活跃通常伴随股价下跌;算法单交易方向与股价变动方向具有正相关关系,说明机构针对股价走势有相应的买卖策略。
- 特征多数展现平稳性,特别是B-S在99.9%的股票中均平稳,说明该指标时间序列可可靠用于预测模型。
- 提供了算法交易行为对市场影响的实证分析基础,支持利用高频数据及频域分析进行机构动向监测和股价趋势预测。
---
2. 逐节深度解读
2.1 引言
报告首先回顾了算法交易在全球特别是美国市场的快速增长历程,指出2003年算法交易在美股占比仅约15%,到2010年达到70%左右,且基金经理中79%至少使用过一次算法交易,每日交易次数激增,成交笔数大幅提升但单笔订单规模缩小。结合计算能力和机器学习技术的发展,算法交易在中国市场得到加速应用。
强调传统大单与小单区分不足以有效捕捉市场行为,因为算法交易往往将大额订单拆解为等额小单并均匀发送,因此难以预测价格变动。由此,傅里叶变化被引入以识别市场高频交易成分,辨别机构和个体投资者的交易活动。算法交易作为机构参与市场的主要手段,其规模变化成为判断机构意愿及预测股价趋势的关键变量[page::2,3]。
2.2 核心结论
- 采用傅里叶变化区分高频交易,构造了$\mathbf{B}+\mathbf{S}$、B-S、B/S三个指标用于机构活跃度量化。
- 观察到$\mathbf{B}+\mathbf{S}$与周度涨跌幅呈一定负相关,机构持股多的股票相关性更显著。
- B-S指标在99.9%股票中表现很高的时间序列平稳性,$\mathbf{B}+\mathbf{S}$和B/S也有较多股票表现平稳,说明指标具备统计分析的基础。
- 机构活跃度与市场短期下跌关联,且买卖方向指示与股价变动方向正相关,反映机构在买卖策略上的针对性[page::2,3]。
2.3 算法介绍
傅里叶变化原理
报告通过图示(图1)清晰展示傅里叶变化将时域信号分解成不同频率成分的机制,阐述了连续傅里叶变换及逆变换的基本公式,继而介绍离散傅里叶变换(DFT)公式以适应离散的交易数据。DFT通过对样本点求和,转换出每个频率成分的幅值和相位,帮助识别交易量序列中的周期性规律和频率成分。
具体说明频谱峰值代表了信号中存在显著的周期性交易行为,较多的峰值反映了复杂且频率多样的交易策略。给出时域信号与其频域表示(频谱图)的直观对比(图2,图3),通过典型示例进一步说明傅里叶分析在信号处理中的实用性[page::3,4]。
2.4 算法的常规应用场景
傅里叶变化广泛应用于物理学、电子学、医疗影像等领域,用于信号分解、降噪和特征提取。举例医疗信号频率变化反映生理状态,及图像去噪前后的示例(图4,图5),生动说明傅里叶变化可有效滤除噪声,提取信号内在规律。
这一理论基础为将傅里叶变化应用于金融交易数据奠定了有力支撑,表明时域至频域转换能帮助剖析复杂数据中的交易频率特征,进而甄别算法交易和市场操控[page::4,5]。
2.5 本报告应用场景与算法具体方法
报告针对A股数据指出:
- 机构投资者普遍使用高频、定时算法交易(如TWAP),表现出比较固定频率和短周期多次拆单特征。
- 个人投资者交易频率较低,交易随机性强,低频交易占比高。借助傅里叶变化分离盘中不同频率交易成分。
- 高频段峰值数目多表明机构算法交易活跃,低频峰值多说明个体投资者占主导。
- 通过每日买卖单交易量傅里叶变换和峰值检测提取峰值个数(算法交易信号),构造特征,反映机构交易活跃度和买卖倾向[page::5]。
2.6 算法应用具体步骤
数据输入与清洗
利用2020年7月3日至2021年7月2日共计一年间的800只A股盘口快照和委托队列数据,间隔3秒,进行高频数据分析。数据清洗排除异常点,保证价格、成交量非零且无空值[page::6]。
买卖方方向划分
因正式买卖方向数据不可得,采用订单流算法根据成交价与买一、卖一价关系推断交易方向,详细定义了判断规则,对成交价格与买卖一价的相对位置进行类别划分[page::6,7]。
傅里叶变化与峰值检测
采用快速离散傅里叶变换(DFT)计算日内买卖单交易量的频域表现,使用峰值检测算法筛选显著峰值,峰值代表交易频率出众、固定,体现机构算法交易。通过调整“prominence”参数,控制峰值的显著性,保证筛选结果可靠。具体用例来自万科2020年9月16日的交易数据,展示买卖单交易量及其对应频谱峰值(图6,图7),峰值个数比重仅为总频率的0.5%,峰值多寡即反映机构参与度高低[page::7,8]。
特征工程
构造三个核心指标:
- $\mathbf{B}+\mathbf{S}$(买卖峰值总数),反映市场机构参与交易的总活跃度;
- B-S(买卖峰值差),反映买卖双方机构的力量对比;
- B/S(买卖峰值比),反映买卖势力比例。
并构建了一系列15种特征供筛选,最终以这三个指标作为主要分析对象[page::9]。
2.7 特征与市场表现关联分析
日度时序相关
统计分析显示,$\mathbf{B}+\mathbf{S}$与周涨跌幅呈一定负相关,均值约-0.0559,表明机构越活跃,股价短期趋向承压下跌。B-S、B/S相关系数均较小,但在机构持仓多的特定股票(如万科、贵州茅台等)中相关性更明显,反映机构买卖力量对短期涨跌的影响[page::9,10]。
平稳性检验
运用ADF统计方法检验时间序列的平稳性:B-S指标在99.9%股票中于1%显著性水平表现平稳,$\mathbf{B}+\mathbf{S}$在10%水平下有86.3%股票表现平稳,B/S指标平稳性较低,仅约37.9%具备统计意义上平稳性,显示多数核心指标在时间序列层面趋势稳定,适合用于后续建模与预测[page::10]。
横截面截面收益预测能力
计算日度截面秩相关系数,t检验结果表明$\mathbf{B}+\mathbf{S}$与周度股价涨跌幅显著负相关(t值-2.070,p=0.065),机构活跃度越高,股价短期下跌概率越大。B/S指标因反映买卖比例,呈现正相关(t=3.381,10%水平显著),展示机构交易方向与股价变动方向一致。B-S指标相关性不明显[page::10,11]。
---
3. 图表深度解读
- 图1:傅里叶变化示意,红色时域信号被分解为不同频率(三条正弦波颜色)频域呈现为幅度图柱状峰值,直观说明信号从时域到频域的变换概念[page::3]。
- 图2、3:时域信号示例与其对应频谱图,清楚展示信号中存在的6个频率峰值,展示频谱仅保留单边频率的对称性,说明傅里叶分析可揭示复杂周期信号中的主要频率组成[page::4]。
- 图4、5:图片降噪前后对比,降噪后图像更清晰,说明傅里叶变换在去噪处理领域的典型应用,映射到交易数据即可通过过滤噪声频率分析有效信号[page::5]。
- 图6:峰值“prominence”含义图,演示峰值高度与周围“谷”落差决定峰值重要性和识别,指导如何筛选交易量频谱显著峰值,保证峰值确实代表交易规律[page::7]。
- 图7(a-d):万科9月16日买卖单时间序列交易量(a,c)和对应的频谱峰值标记图(b,d)。绿色与蓝色系列交易量峰峰起伏明显,频谱图红点标记的峰值表示三秒交易节奏中存在高频显著交易频率,显示机构交易量峰值位置,峰值数量反映当天机构活跃度,高峰值数量便说明机构以多样策略参与高频交易[page::8]。
- 表1-3数据结构和特征构造详见报告简略索引,说明数据完整性和指标体系基础[page::6,9]。
- 表4、5、6、7统计结果显示特征与股价涨跌的相关系数,统计分位,平稳性比例及截面秩相关系数t检验,各项数据直观验证了核心指标作为机构交易活跃度及趋势反应的有效性与稳健性[page::10-11]。
---
4. 估值分析
报告主要围绕金融工程量化信号提取,并未涉及传统意义上的公司估值分析(如DCF、PE估值等),因此无估值方法论及其参数分析。本报告的价值更多体现在市场微结构分析及高频信号的预测应用框架构建。
---
5. 风险因素评估
报告未设专门章节详述风险因素,但通过内容可推断以下潜在风险:
- 交易方向推断误差风险:实际买卖方向较难准确识别,订单流算法虽有理论基础,但难免误差,可能影响峰值特征准确性。
- 傅里叶变化模型局限性:傅里叶变化假定信号有固定频率成分,市场行为复杂多变,算法交易策略更新快,可能导致信号变异性增大,峰值变化不稳定。
- 截面分析的个股差异:特征与涨跌幅的相关性在不同股票中差异较大,行业、流动性或持仓结构差异可能导致信号代表性不同。
- 数据采样频率和窗口期风险:三秒快照虽高频,仍有可能漏掉更细粒度的高频波动;且数据仅覆盖1年,市场周期性和突发事件风险未必完全体现。
报告未明确缓解措施,建议后续结合更多验证方法、多市场对比,提升模型稳健性和适用范围[page::2-11]。
---
6. 批判性视角与细微差别
- 报告方法较为数据驱动,依赖傅里叶变化对机构算法交易频段的界定,隐含假设机构交易必然体现为高频且周期性明显,但现实中机构有多种策略,部分非固定频率策略可能无法准确捕获。
- 与股价相关的统计相关度较弱(如平均相关系数绝对值均小于0.06),说明单一指标解释能力有限,预测股价的有效性可能有限,需与其他特征结合。
- 相关性差异明显,强调机构持股较多股票中指标表现更强,暗示模型对不同个股适用性有限,或需辅助机构仓位信息进行更细分分析。
- 对指标的平稳性检验彰显其时间稳定性,但波动性较大股票和周期切换的潜在风险未深入探讨。
- 报告没有深入剖析算法交易不同策略类别对指标的差异贡献,未来可增加策略分类匹配分析。
- 数据和方法基于中国A股市场单一区间,缺少多市场、多周期验证,适用性与泛化能力尚待验证。
总体看,研究提供了有价值的新视角但仍为探索性成果,理论与实证结合有待进一步加强。
---
7. 结论性综合
本报告首次系统利用傅里叶变化,创新地将信号处理技术应用于高频买卖交易数据,成功识别出市场中显著的算法交易信号峰值,以此构建了$\mathbf{B}+\mathbf{S}$、B-S、B/S三大关键特征,作为机构参与度和买卖方向的量化指标。通过大量A股样本与典型股票实证分析,报告发现:
- 高频峰值数量强烈反映了机构的算法交易活跃度,峰值越多机构参与度越高。
- 机构整体参与度指标$\mathbf{B}+\mathbf{S}$与未来周度涨跌幅呈负相关,表明机构频繁算法交易往往预示市场短期压力或估值回调。
- 算法单买卖比(B/S)与股价涨跌方向一致,有助于判断机构多空力量,捕捉股价动向。
- 核心指标均展现了良好的时间序列平稳性,支持其作为预测模型的输入变量。
- 特征与股价的相关性存在个股差异,机构持股权重高的股票表现尤为显著,表明模型适用需考虑持仓结构。
图形与表格紧密配合,数据充分彰显傅里叶变化在金融领域高频数据挖掘的有效性及潜力。报告结论为投资者和量化策略设计者提供了识别机构行为和预判短期股价走势的新工具,并指明了未来深化算法交易研究的方向。整体报告体现出专业的技术深度与对市场微观结构的洞察。
---
(本分析全程基于报告内容,页码标识详见每处引用)