基于企业营收相似性的选股策略
创建于 更新于
摘要
本报告基于秩鼎公司营收拆解标准化数据,构建了营收相似相对动量因子(RevRelative_MOM),并从信息来源、经营业务复杂度、业务关联性等维度对其进行增强。该因子显著提升了股票收益预测能力,IC均值最高达到5.21%,因子在不同宽基指数中均表现良好,尤其在中证1000股票池中效果最佳,体现了有效捕捉企业间营收相似性驱动的股价联动效应及补涨逻辑 [page::0][page::4][page::5][page::6][page::7][page::8][page::9][page::10][page::11][page::12][page::13]
速读内容
- 营收拆解标准化数据及其重要性 [page::1][page::2]


- 标准化采用国家统计局《统计用产品分类目录》第三级产品代码,实现业务跨公司可比。
- 通过示例南玻A2021年营收拆解示范,详解业务拆解细化及均分处理方法。
- 营收相似度计算及基于绝对动量的因子构建 [page::3]


- 通过余弦相似度计算公司间营收向量相似度,仅保留相似度 > 0.1的连接。
- 绝对动量因子RevMOM回测IC均值低,仅1.46%,表现一般。
- 营收相似性的相对动量因子及效果提升 [page::4]


- 相对动量因子RevRelativeMOM结合公司相对超额收益,IC均值提升至3.63%,t值2.93。
- 多头组合年化收益17.74%,夏普比0.64,多空组合也表现不错。
- 信息来源维度增强——行业异质性影响 [page::5]

- 仅采纳不同行业相似公司数据,构建IndRevRelativeMOM因子,IC均值提升至4.65%,t值3.54。
- 多头组合年化收益18.89%,夏普比0.69,表现优于基础因子。
- 经营业务复杂度维度增强 [page::6][page::7]

- 利用HHI及营收相似度指标量化业务复杂度,后者效果更佳。
- 业务复杂度因子CompRevRelativeMOM2 IC均值3.92%,t值3.30,虽收益略微逊色但更具稳定性。
- 综合信息来源与业务复杂度双维度增强因子 [page::7][page::8]

- 因子IndCompRevRelativeMOM综合考虑行业异质及业务复杂度,IC均值4.73%,t值3.76,为最优基础模型。
- 多头组合近三年总收益78.45%,年化收益18.00%,夏普比0.66。
- 创新纳入业务关联性修正因子构建及效果显著提升 [page::8][page::9][page::10]

- 定义标准产品之间关联矩阵,并用以修正公司营收相似度,得到radjij,t。
- 同时考虑行业异质、业务复杂度及关联性的IndCompRevRelativeMOMadj因子,IC均值提升至5.21%,t值4.26。
- 多头组合年化收益17.02%,多空组合年化收益13.63%,明显优于未修正版本。
- 因子与其他风格因子相关性及中性化处理 [page::10][page::11]

- IndCompRevRelativeMOMadj因子与反转因子相关性较高,但与成长、价值等相关性较低。
- 对因子进行反转因子中性化后仍具显著预测能力,IC均值仍为2.48%,显示因子包含补涨及反转两重效应。
- 双变量分组显示在控制反转后因子仍具良好分组能力和单调性。
- 不同宽基指数中因子表现及卖方覆盖度影响 [page::11][page::12][page::13]


- IndCompRevRelativeMOM_adj因子对沪深300、中证500、中证1000均有效,且在中证1000中表现最为突出,IC均值6.15%。
- 中证1000多头年化收益19.51%,超额收益11.10%,夏普比达1.6,表现最优。
- 主要原因可能为中证1000成分股被卖方机构覆盖数量少,信息传递效率较低,增强了因子效果。
深度阅读
基于企业营收相似性的选股策略—招商定量任瞳团队报告详尽解析
---
1. 元数据与报告概览
- 报告标题:《基于企业营收相似性的选股策略》
- 作者及团队:招商定量任瞳团队
- 发布日期:2023年2月22日
- 发布机构:招商证券
- 研究主题:基于企业营收结构相似性,构建动量选股因子,重点聚焦A股市场上市公司的营收拆解数据,通过多层面的增强措施提升因子预测能力及稳定性,挖掘具有更强的选股表现的营收相似性动量因子。
报告核心论点是:企业经营业务相似性导致信息在市场上的传递存在时滞,利用企业之间的营收结构相似度可以构建有效的相对动量因子(RevRelativeMOM),并基于信息来源的行业差异、经营业务复杂度及业务之间的关联性进行多维度增强,得以显著提升因子的预测效果与稳定性。研究还验证了在不同股票池中的适用性,尤其在中证1000小盘股中表现突出。
[page::0,1,3,4,5,6,7,8,9,10,11]
---
2. 逐章节详解与剖析
I. 企业营收拆解标准化数据概述
关键论点:
- 上市公司披露的业务营收信息存在命名不统一和披露详细程度不一致的问题,导致直接对比困难。
- 利用秩鼎公司数据,将企业年报披露的营收通过对照国家统计局《统计用产品分类目录》(涵盖多层级产品编码体系,涵盖97个一级产品至16253个五级产品)进行深度拆解与标准化,解决了不同公司间业务不可比问题。
- 采取对营收业务进行细化和标准化处理,生成统一的经营业务“向量”,用于后续相似度的计算。
推理依据与数据点:
- 表格举例显示同为“伺服微电机”业务不同公司披露名称完全不同,但经过标准化均被归为同一标准代码(3903050204)。
- 以南玻A公司2021年为例,展示拆解后具体占比及归类示意(浮法玻璃、光伏玻璃、电子玻璃等分布透彻)。
- 此标准化提供了基础数据源和计算维度,为构建营收相似性度量提供了可靠基础。


[page::1,2]
---
II. 基于营收相似性的动量效应
1. 营收相似绝对动量因子(Rev
MOM)论点总结:
通过两家公司在标准产品营收向量上的余弦相似性计算其业务相似度,进而构建以营收相似企业收益加权为基础的绝对动量因子。该因子在整体回测中表现一般,IC均值仅$1.46\%$,统计显著性不足,显示简单绝对动量逻辑效果有限。
关键数学表达式:
- 营收相似度:
$$
r{ij,t} = \frac{P{i,t} P{j,t}^{\prime}}{\sqrt{P{i,t}P{i,t}^{\prime}} \cdot \sqrt{P{j,t} P{j,t}^{\prime}}}
$$
- 绝对动量因子:
$$
Rev\MOM{i,t} = \frac{\sum{j \neq i} r{ij,t} Ret{j,t}}{\sum{j \neq i} r{ij,t}}
$$
考虑剔除相似度低于0.1的部分,过滤噪声。
回测框架:
| 项目 | 内容 |
| ------------ | ------------------------- |
| 回测区间 | 2019.5.1-2022.11.30 |
| 调仓频率 | 月度 |
| 样本池 | 中证1800成分股 |
| 动量回溯期 | 20个交易日 |
| 指标 | IC(秩相关系数)、分组收益 |
数据洞察:
| 因子 | IC均值 | 胜率 | t统计量 |
| ---------- | ------- | ------- | ------- |
| RevMOM | 1.46% | 52.50% | 0.73 |
指标不明显有效。
[page::3,4]
---
2. 营收相似相对动量因子(RevRelative
MOM)关键创新点:
基于“补涨”逻辑,将目标公司收益率同其营收相似公司的超额收益(相对收益)加权后构造因子,极大提升了因子有效性。
因子计算公式:
$$
RevRelative\MOM{i,t} = \frac{\sum{j \neq i} r{ij,t} (Ret{j,t} - Ret{i,t})}{\sum{j \neq i} r{ij,t}}
$$
回测表现:
| 因子 | IC均值 | 胜率 | t统计量 | 三年总收益 | 年化收益率 | 夏普比率 | 卡玛比率 |
| -------------- | ------- | ------- | ------- | --------- | ----------- | -------- | -------- |
| RevRelativeMOM| 3.63% | 58.14% | 2.93 | 77.12% | 17.74% | 0.64 | 0.51 |
多头组合表现明显优于绝对动量版本,且多空组合盈利显著,表明该因子对截面未来收益预测稳定且具有实用性。
[page::4]
---
III. 营收相似相对动量因子增强
1. 根据信息来源 - 行业差异维度增强(Ind
RevRelativeMOM)假设与逻辑:
投资者更关注同行业公司的信息,对不同行业但业务相似的公司的信息忽视度较高。故只考虑不同行业的营收相似公司构建因子,挖掘未被充分消化的跨行业业务相关信息。
因子定义:
同上相对动量因子,但只包含不同行业的相似公司。
实证结果:
| 因子 | IC均值 | 胜率 | t统计量 |
| ---------------- | ------- | ------- | ------- |
| IndRevRelativeMOM | 4.65% | 62.79% | 3.54 |
表现提升显著,多头组合年化收益达18.89%,夏普0.69,效果超过基础相对动量因子。

[page::5]
---
2. 根据经营业务复杂度增强(Comp
RevRelativeMOM)背景与量化业务复杂度方法:
- 方法一:借鉴HHI指数,业务占比平方和。复杂度 = 1 - HHI;
- 方法二:跨行业营收相似度均值与同业营收相似度均值的比值,数值越大,业务越复杂。
因子定义:
$$
Comp\RevRelative\MOM{i,t} = Rev\Comp\Rank{i,t} \times RevRelative\MOM{i,t}
$$
其中业务复杂度的行业内排名用于加权。
回测结果显示方法二优于方法一:
| 因子 | IC均值 | 胜率 | t统计量 |
| ---------------------- | ------- | ------- | ------- |
| CompRevRelativeMOM1 | 3.56% | 58.14% | 2.99 |
| CompRevRelativeMOM2 | 3.92% | 60.47% | 3.30 |
多头年化收益为16.31%,略低于初版相对动量因子,风险指标适中,但提供了因子多样性思路。

[page::6,7]
---
3. 综合信息来源与业务复杂度增强(IndComp
RevRelativeMOM)结合不同行业信息过滤与复杂度加权,进一步提升指标表现。
| 因子 | IC均值 | 胜率 | t统计量 |
| ------------------------ | ------- | ------- | ------- |
| IndCompRevRelativeMOM | 4.73% | 65.12% | 3.76 |
表现最佳,多头年化收益达18%,夏普0.66,综合增强因子有效提升了预测能力和稳定性。

[page::7,8]
---
IV. 考虑业务关联性的营收相似相对动量因子
逻辑提升:
基础营收相似性计算基于假设各产品线独立,但实际产品之间存在供应链关联和经济联系。故创新地引入产品间关联矩阵$\mathrm{Cor\P}{mn,t}$进行调整,修正企业间相似度。
核心数学公式:
- 业务关联度矩阵:
$$
Cor\P{mn,t} = \frac{C{m,t} C{n,t}'}{\sqrt{C{m,t} C{m,t}'} \cdot \sqrt{C{n,t} C{n,t}'}}
$$
- 修正公司间相似度:
$$
r{adj{ij,t}} = \frac{P{i,t} Cor\P{t} P{j,t}'}{\sqrt{P{i,t}P{i,t}'} \cdot \sqrt{P{j,t}P{j,t}'}}
$$
- 修正后的相对动量因子(例如IndComp版):
$$
IndComp\RevRelative\MOM{adj{i,t}} = Rev\Comp\Rank{i,t} \times \frac{\sum{j\neq i} r{adj{ij,t}}(Ret{j,t} - Ret{i,t})}{\sum{j\neq i} r{adj{ij,t}}}
$$
示例说明:两家主营互相关联的公司,传统计算相似度为0,修正后为0.5,更贴近业务实际相关性。
回测效果:
- 各改进因子均优于同名未调整版。
- IndCompRevRelativeMOMadj表现最佳,IC均值$5.21\%$,t统计量4.26,表现显著,胜率稳定。
| 因子 | IC均值 | 胜率 | t统计量 |
| ---------------------------- | ------- | ------- | ------- |
| RevRelativeMOM | 3.63% | 58.14% | 2.93 |
| RevRelativeMOMadj | 3.84% | 55.81% | 3.30 |
| IndRevRelativeMOM | 4.65% | 62.79% | 3.54 |
| IndRevRelativeMOMadj | 5.14% | 65.12% | 4.05 |
| CompRevRelativeMOM | 3.92% | 60.47% | 3.30 |
| CompRevRelativeMOMadj | 3.42% | 65.12% | 3.57 |
| IndCompRevRelativeMOM | 4.73% | 65.12% | 3.76 |
| IndCompRevRelativeMOMadj | 5.21% | 62.79% | 4.26 |
多头组合和多空组合收益表现均良好,且多空组合表现较未改进版本显著增强。

[page::8,9,10]
---
V. 因子相关性及中性化分析
- 因子与成长、估值和价量因子关联度低,说明策略具备较强独立性。
- 与反转因子相关度较高(达71.22%),暗示部分因子表现可能由短期反转机制驱动。
- 通过对因子做反转因子中性化,调整后因子依然保持显著预测能力(IC均值2.48%,t=2.10),确认因子有效性源于补涨与反转效应叠加,且1+1>2的叠加效应明显。
双变量分组回测控制反转因子后,IndCompRevRelativeMOMadj依然表现良好,表现单调且分组明显。

[page::10,11]
---
VI. 不同宽基指数的测试与行业覆盖分析
- IndCompRevRelativeMOMadj因子在沪深300、中证500、中证1000均表现显著,特别在中证1000表现最强:
| 股票池 | IC均值 | 胜率 | t统计量 | 多头年化收益 | 多头超额年化收益 | 多头夏普比率 |
| --------- | ------- | ------- | ------- | ------------ | ---------------- | ------------ |
| 沪深300 | 5.63% | 65.12% | 2.93 | 7.68% | 3.97% | 0.26 |
| 中证500 | 3.51% | 62.79% | 2.42 | 13.15% | 5.71% | 0.50 |
| 中证1000 | 6.15% | 79.07% | 5.06 | 19.51% | 11.10% | 1.60 |
- 小盘股中(中证1000)有效性最高,因覆盖机构较少,市场信息传导效率相对较低,投资者对营收相似性的忽视效应更显著,使得此因子优势明显。

[page::11,12,13]
---
3. 图表深度解读汇总
- 图3(页3):展示计算营收相似度的公式与思路,清晰描绘利用余弦相似度度量业务结构相似。
- 关联机构数图(页13):解释了不同股票池因子表现差异背后的机构覆盖因素,为因子有效性提供市场结构微观基础支撑。
---
4. 估值分析
报告未明显涉及现金流折现(DCF)或传统市盈率、EBITDA倍数等估值方法,核心聚焦于金融因子构建和回测,从统计学相关指标(IC均值、t统计量、胜率)和实证表现(年化收益、夏普率、最大回撤)角度对因子价值进行量化评估。
强调投资因子在截面未来股票收益率预测中的能力,无疑用于量化选股和智能投研,估值目标价非本报告核心。
---
5. 风险因素评估
- 本报告多次强调本因子策略基于市场非完全有效性假设,即市场存在信息传递延迟、投资者注意力有限,风险在于市场效率提升时,因子优势可能弱化。
- 行业分类、营收拆解标准及信息披露变动可能影响业务相似度计算准确性。
- 反转因子关联性提示短期市场情绪波动也可能影响策略表现,存在非基本面驱动风险。
- 机构覆盖等市场微观结构变化是因子表现波动重要因素。
- 报告明确声明策略不构成投资建议,历史表现不预示未来成果,投资风险自负。
[page::0,14]
---
6. 批判性视角与细微差别
- 因子有效性虽然得到统计学支持,IC均值最高也在5%左右,属于中等水平,因子收益率表现波动较大,换手率较高(部分因子年化双边换手率约400%以上),这在实践中可能导致交易成本提高。
- 业务复杂度的两种计算方法选用第二种,说明复杂度定义存在一定主观因素,较依赖行业分类的准确性。
- 报告承认因子与反转因子高度相关,但试图通过中性化处理分离效果,虽然有效但仍提示因子部分收益可能来自投机心理驱动。
- 不同行业分类及标准产品之间关联度的定义极大影响因子作用,相关性权重的确定未详述,存在模型假设不可完全验证的风险。
- 同时报告未提供对卖方分析师调研等信息变量可能变化的敏感性分析。
- 因子在小盘股表现更好,但相应波动率和流动性风险也更大,报告未深度讨论流动性风险等实操障碍。
[page::0,5,6,10,13]
---
7. 结论性综合
招商定量任瞳团队基于秩鼎公司提供的企业营收拆解标准化数据,通过构造企业间基于营收相似度的相对动量因子,深刻挖掘了企业业务结构相似性对股票价格表现的影响。
1. 数据标准化:对企业营收进行统一拆解,规避数据异质性,奠定定量比较基石。
2. 因子构建:从绝对动量出发超越到相对动量因子,显著提升预测能力。
3. 多维度增强:结合信息来源(不同行业信息过滤)、经营业务复杂度(通过两个衡量方法量化及加权)和业务间产品关联性(供应链关联矩阵调整),多重提升因子效果。
4. 反转效应分离:厘清因子内在多重机制,通过中性化处理仍保持稳定的预测能力。
5. 股票池表现:因子在不同宽基指数均有效,且在机构覆盖较少的小盘股(中证1000)中表现尤为突出,提示信息传播效率差异对因子表现贡献。
- IndCompRevRelativeMOMadj因子IC均值最高达$5.21\%$,t统计量4.26。
- 三年总收益率年化稳定在17%-19%区间,夏普率约0.6以上。
- 多空组合回报较优,指示良好的风险调整后表现。
综上,基于企业营收相似性的相对动量因子及其多维度增强版本不仅拓展了量化选股多因子构建思路,也为挖掘细分市场信息传递延迟提供实证支持,策略尤其适合中小市值板块投资,具备较强实用价值与学术创新价值。
[page::0-14]
---
附:报告研究团队及声明
- 任瞳(SAC号:S1090519080004),周靖明(S1090519080007),杨航(S1090523010004)
- 本报告清晰反映团队观点,非投资建议,数据基于截至发布当日信息,历史表现仅供参考。
---
总结
该报告系统地构建并完善了一套基于企业营收相似性的多维度动量选股因子,以严谨的数据标准化、创新的业务关联性修正和对信息来源及业务复杂度的细致考虑,提升了因子稳定性和预测能力,对A股市场尤其是中小市值股票池表现尤为突出。投资者和研究者可将其视为开拓细分业务信息特征与量化策略融合的有力范例。
仅供专业投资者参考,请结合自身投资偏好谨慎使用。