选股因子系列研究(七十一)——逐笔大单因子与大资金行为
创建于 更新于
摘要
本报告基于逐笔成交信息构建的大单因子,系统分析其与市场中大资金行为的关系。通过对交易异动股票及公募基金重仓股的实证,验证大单因子能够有效捕捉大资金动向。剔除交易异动的负向长期效应后,大单因子的选股效果显著提升。结合非流动性因子与大单因子,对上期基金重仓组合进行增强组合构建,成果显示该复合策略在报告期前两个月表现出显著超额收益和较高稳定性,提升基金持仓预测能力,进一步挖掘大资金交易信号的投资价值 [page::0][page::4][page::6][page::10][page::11][page::12].
速读内容
- 大单因子定义及意义 [page::4]
- 通过逐笔订单成交金额,界定“买单”和“卖单”超过全天订单均值的成交占比。
- 该因子旨在反映大资金交易行为。
- 交易异动股票与大单因子高度相关 [page::4][page::5]
| 统计期间 | 相关性系数 |
|----------|------------|
| 2019.05-2020.10 | 显著正相关 |
- 大单因子数值与异动股票买入前五大席位成交金额占比表现出强相关。
- 异动股票短期正收益,长期显著负收益 [page::5]

- 异动股票次日存在微弱正收益和高开效应,但长周期收益快速反转下滑。
- 剔除异动股票后,大单因子IC及多空收益均显著提升。
- 基金重仓股组合构建及业绩表现 [page::6][page::7]

- 使用公募基金前十大重仓股持仓量和持仓增量指标构建基金重仓和增持组合。
- 报告期前的组合收益率分位数显著高于报告期后,且剔除市值影响后效果更明显。
- 基金持仓量及增量与收益相关性及选股因子相关性分析 [page::8][page::9]
- 持仓增量与报告期前收益呈显著正相关(>10%)。
- 市值、流动性和ROE因子与基金持仓量和持仓增量保持高度相关,机构投资逻辑匹配。
- 高频因子(大单因子等)与持仓增量相关显著,验证因子与机构大资金买入力度。
- 基金重仓组合具有良好延续性 [page::9]

- 上期基金重仓股有78.9%概率继续出现在下期重仓组合中。
- 上期重仓股中71.6%概率在下期被基金增持,体现基金持仓的稳定性和连续性。
- 利用非流动性及大单因子增强基金重仓组合表现 [page::10][page::11][page::12]


| 组合类型 | 月均收益率 | 月胜率 |
|------------------------|------------|----------|
| 基础基金重仓组合 | 较低 | 低 |
| 叠加非流动性+剔除大买大卖 | 明显提升 | 提升明显 |
| 叠加非流动性+正交大单大买 | 类似提升 | 也有提升 |
- 两大单因子升幅接近,因其相关性较高。
- 报告期前两个月复合因子增强组合表现最优,说明策略稳定性强。
- 因子在报告期与非报告期表现差异 [page::12][page::13]
- 非流动性因子选股效果在非报告期优于报告期。
- 大单因子在报告期表现较好,体现报告期财务数据释放对因子表现的影响。
- 传统因子表现差异亦明显,如市值因子表现方向报告期月与非报告期月相反。
- 风险提示 [page::0][page::13]
- 市场系统性风险。
- 模型误设风险。
- 有效因子变动风险。
深度阅读
报告详尽分析:选股因子系列研究(七十一)——逐笔大单因子与大资金行为
---
1. 元数据与报告概览
报告信息
- 标题:选股因子系列研究(七十一)——逐笔大单因子与大资金行为
- 作者:冯佳睿,余浩淼
- 发布机构:海通证券研究所
- 发布日期:2020年12月13日
- 研究主题:探讨通过逐笔成交数据构建的“大单因子”与大资金交易行为的相关性,分析其在选股及基金重仓预测中的应用价值与表现。
- 主要信息:
报告核心观点在于验证大单因子能够有效捕捉市场上的大资金交易行为,尤其是交易异动中的大资金买入以及公募基金重仓和增持股票行为,并结合这些因子构建增强组合以提升选股收益表现。报告同时对交易异动股票的长期表现进行了负面风险提示,并提出风险管理关注点。
---
2. 逐节深度解读
2.1 交易异动与大单因子
1.1 交易异动中的大资金行为
- 交易异动股票是指因出现超高换手率等异常交易行为而被交易所定义为“异动”的股票。
- 交易异动时,交易所会披露买卖双方中前五大营业部的成交金额占比,为观察大资金动向提供窗口。
- 研究重点在于验证报告构建的大单因子(基于日内大额订单成交占比)与异动股票前五大买入席位成交金额占比的相关性。
关键数据和结论
- 表1显示(2019年5月-2020年10月),大单因子分位数与异动股票买入前五席位成交占比存在显著正相关,证明大单因子能够有效刻画大资金买入行为。
逻辑与意义
- 资金通过单一席位大量买入,容易使股票产生异动,因而前五席位占比是大资金行为的直观体现。大单因子与此强相关,验证了因子设计的有效性。
---
1.2 交易异动股票的短期及长期表现
- 使用大单因子筛选异动股票,考察次日收益及胜率。
- 表2显示,异动股票整体存在微弱正收益,买入席位成交占比前30%分位的异动股票收益显著提升。
- 利用大单因子进一步筛选,特别是“剔除大买的大卖”因子,收益表现接近高占比异动组。
- 长期看(表3),异动股票次日开盘后反转明显,收益转为负向,体现异动股票存在高开的现象,随后有回落。叠加大单因子筛选后,负向反转更为显著。
逻辑分析
- 异动股票的短期高开表明大资金的介入推高价格,但后续市场调整导致反转,带来长期负收益。
---
1.3 剔除交易异动效应后大单因子的表现提升
- 由于异动股票的长期负向表现对大单因子产生拖累,报告测试去除过去10个交易日内有异动的股票,或用哑变量正交的方法剔除异动效应。
- 表4结果显示剔除异动股票后,大单因子的IC值和多空组合收益均不同程度提升,稳定性增强。
结论与策略启示
- 大单因子在捕捉大资金行为有效,但交易异动股票的反转效应对选股效应有负面影响,理应剔除异动影响以提升因子表现。
- 下一步推断大单因子也与公募基金建仓具有相关性,值得进一步深入研究。
---
2.2 基金重仓与大单因子
2.1 基金重仓股组合构建
- 基于季报披露的公募主动基金前十大重仓股构建指标——持仓量指标(持仓市值占总市值比例)和持仓增量指标(市场上基金增持市值占比)。
- 图1展示了基金筛选并构建组合的流程:首先筛选主动公募基金,统计前十大重仓股与增持比例,构建组合。
2.2 基金组合业绩表现分析
- 表5显示基金重仓组合收益率在报告期前显著高于50%分位,并且普遍优于报告期后表现,剔除市值影响后差异更加明显。
- 表6反映基金增持组合报告期前收益同样显著优于报告后,且增持组合优于重仓组合。
- 表7相关性分析显示,持仓量和持仓增量在报告期前与收益存在明显正相关,尤其持仓增量在报告期前与收益相关性超过10%。
逻辑与意义
- 公募基金重仓股和增持股票普遍在报告期公布前已有超额收益,反映了机构投资者的选股能力和市场提前反应。
- 持仓信息具有滞后性,不适合即时使用,但关联指标可用于预测。
---
2.3 基金持仓量与选股因子关系
- 表8显示基金持仓量和持仓增量与传统选股因子相关性显著,市值、流动性和ROE最为显著,符合机构投资者偏好大盘高盈利且流动性好的股票逻辑。
- 表9进一步表明,大单类高频因子与基金持仓量、持仓增量高度相关,尤其是基金持仓增量,支持大单因子有效反映机构资金动向。
---
2.4 基于持仓量预测的基金重仓增强组合构建与表现
- 基金重仓股表现出较强延续性:上期重仓股有约78.9%概率继续在下期重仓,约71.6%概率被增持(图2)。
- 利用市值、非流动性、ROE、剔除大买的大卖、正交大单的大买5个因子,在上期重仓股中分别筛出因子值最高50个,构建增强组合。结果显示这些增强组合在下期重仓股和增持股中的出现比例均明显高于基础重仓组合(图3,图4),最高达97.2%与94.6%。
- 表10揭示因子与基金持仓量和增量相关性,非流动性与两个大单因子相关性最高,说明这三个因子较适合做增强筛选;市值和ROE相关性反向,提示其改善增强组合效果较差。
---
增强组合业绩表现
- 表11-13结果表明:非流动性和大单因子叠加构建的增强组合,报告期前1个月和2个月均显著提升了基金重仓组合的月均收益和胜率,能缓解重仓组合随时间的收益衰减。
- 不同时段中,非流动性因子在非报告期表现更好,大单因子在报告期表现更优,二者复合增强组合稳定性强。
---
2.5 不同时段因子表现差异及市场解读
- 表14-15数据显示,报告期月与非报告期月因子表现存在明显差异,如反转因子、换手率因子及ROE在报告期表现较好,市值因子表现截然相反。
- 该现象可能与公募基金报告期对应财报数据逐渐明朗及机构投资行为的反映相关。作者建议后续研究从此角度深入探讨市场微观机制。
---
3. 图表深度解读
- 表1展示了大单因子分位数与交易异动股票前五大买入营业部成交金额占比的相关性,是报告初步验证大单因子有效性的核心数据基础。
- 表2与表3分别展示短期和长期的异动股票收益统计,揭示异动股票虽有短期正收益,但长期表现负向,体现了资金介入后市场的反转风险。
- 表4则是剔除异动效应后大单因子表现的统计数据显示,因子有效性显著提升。
- 图1通过流程图形式,形象展示了基金重仓股筛选和组合构建逻辑,有助理解后续相关分析过程。
- 表5及表6为基金重仓及增持组合于报告期前后的收益表现,通过分位数统计精准展示基金持股策略的超额收益能力。
- 表7至表10分别解析持仓量/增量指标与收益及选股因子的相关性,论证大单因子和非流动性因子与基金行为的紧密联系。
- 图2量化显示基金重仓股组合的时间延续性,提供实证基础。
- 图3和图4分别展示基于多因子构建的增强组合在基金重仓组合和增持组合中的占比,强化了组合策略的有效性。
- 表11-13通过月度收益数据,具体量化增强组合带来的业绩提升。
- 表14和表15体现了不同季度及月份的因子表现差异,为因子应用的时效性和周期性提供理论支撑。
总体来看,各图表严密支持报告论点,从量化数据和实证分析角度全面验证了大单因子与基金持仓行为的联系及其选股价值。
---
4. 估值分析
本报告并未涉及具体个股估值模型,如DCF或PE倍数法。核心聚焦于大单因子与基金持仓的定量关系以及提升选股策略表现,并通过统计学指标量化因子的有效性和收益表现。
---
5. 风险因素评估
报告在“投资要点”及“风险提示”部分明确提出风险因素:
- 市场系统性风险:全市场波动可能导致异常波动,影响大单因子和基金持仓的正常表现。
- 模型误设风险:因子构建可能存在假设偏误或模型参数设置不当,导致因子有效性降低。
- 有效因子变动风险:因子在不同市场周期或环境下表现不稳定,可能失去捕捉资金行为的能力。
报告未提供具体缓解策略,但上述风险意识对投资者识别因子应用局限性和设定合理预期至关重要。
---
6. 批判性视角与细微差别
- 报告较为谨慎并且客观地解释了交易异动股票的长期负面影响,这表明作者认识到大资金交易信息虽具有指示性,但也存在被市场反转风险所抵消的可能。
- 利用限于披露时间的基金持仓数据构建指标,虽能反向支持因子有效性,但因数据滞后限制因子即时运用,侧面说明因子策略应用的时效挑战。
- 部分因子(如市值与ROE)在增强组合中的表现不理想,且呈现反向相关,暗示选择因子组合时需注意因子间相互作用和目标群体特征。
- 报告强调因子表现存在时段效应,反映市场中机构投资者行为和财务信息披露节点对因子表现的动态影响,提醒投资者策略应用需要关注时段环境。
- 未发现报告中明显矛盾,但对市场机制的进一步解读仍留有空间,尤其是因子与基金持仓动态交互的因果关系和如何提前预测基金动向。
---
7. 结论性综合
本报告通过大样本的实证数据和严谨统计分析,系统验证了基于逐笔成交数据构造的大单因子与市场上大资金交易行为的紧密关联,具体包括:交易异动股票买入营业部成交额占比以及公募基金重仓和增持行为。交易异动股票虽短期存在超额收益,但长期负向反转明显,提示需剔除其影响以优化大单因子表现。基金持仓量和持仓增量指标与股票收益表现强正相关,且持仓重仓股表现出高延续性,报告提出利用非流动性与大单相关因子结合,基于上期基金重仓股票构建复合增强组合,显著提升投资组合的收益水平及胜率,表现稳定。
各类图表与表格数据深刻揭示了大单因子既能反映市场大资金行为,又因与基金持仓行为高度相关,成为预测基金买入、增持股票的重要工具,尤其结合非流动性因子优化后增强效果卓著。同时,因子表现具有显著的时间依赖性,与公募基金报告期和公司财报披露存在内在联系,反映基本面信息确认对于基金投资行为的影响。
报告亦充分提示风险因素,提醒市场系统性波动与因子模型稳定性的潜在风险,强调在实际应用中需要注意模型设定和市场环境变化。
总体而言,报告展现了作者对大单因子的深入理解和严密的实证验证,结论具有较强的理论支持与现实指导意义,适合作为量化选股或基金持仓预测的重要参考。
---
附录:主要图表示例(部分)
图1 基金重仓股指标构建示意

图2 上期基金重仓组合股票在下期基金重仓及增持组合中的占比

图3 增强组合占下期重仓组合占比

图4 增强组合占下期增持组合占比

---
参考文献
报告原文及所引用数据来源:Wind,海通证券研究所 [page::0,4-13]