`

移动大数据应用:基于金融活动指数的量化选股策略

创建于 更新于

摘要

本报告基于杭州数行科技提供的移动大数据中的金融活动指数,构建覆盖中证1000指数成分股的量化选股策略。利用金融活动指数边际变化捕捉机构投资者调研热度,实证结果显示金融活动指数增长组表现优异,构建的多头组合年化收益显著超越基准。进一步结合多因子方法,构建的增强组合取得22%以上年化超额收益,信息比率达3.61,表现稳健。移动大数据丰富且高频,有效弥补传统机构调研数据的时效性和完整性限制,为选股策略提供新的数据支持与优化空间[page::2][page::6][page::15][page::16][page::17]

速读内容


移动大数据在资产管理行业应用及重要性 [page::2][page::3]

  • 移动大数据具有海量、高频、全面和准确等特点,基于用户移动终端数据,可刻画个体和社会的多维行为标签。

- 移动大数据在资产管理行业具备丰富应用场景,能够更贴近市场真实交易场景,领先于公开数据对市场进行高频还原。


机构现场调研数据分析及其局限性 [page::8][page::9][page::10][page::11][page::12]


| 年份 | 调研公司数量 | 机构调研数量 | 现场调研数量 | 非现场调研数量 | 现场调研占比 | 非现场调研占比 |
|-------|--------------|--------------|--------------|----------------|--------------|----------------|
| 2013年 | 1201 | 约8500 | 约8000 | 约500 | 高比例 | 低比例 |
| 2020年 | 1417 | 约7500 | 下降至约2900 | 增至约3300 | 46% | 54% |
  • 机构调研数量和被调研公司数持续增长,2021年被调研公司数量突破2000家。

- 受疫情和技术影响,非现场调研快速上升,但现场调研的事件效应和股价超额收益更为突出,事件分析显示现场调研公司股价表现优于非现场。
  • 现场调研间隔时间长,月均调研公司数量不足350家,限制调研数据的连续性和覆盖广度。






金融活动指数数据优势及与调研数据对比 [page::13]

  • 金融活动指数高频捕捉机构投资者对上市公司实际访问情况,数据覆盖率和完整度超过传统调研数据,覆盖超2000家A股上市公司。

- 指数变化与机构调研事件及股价表现高度相关,具有较强的市场预判能力。



基于金融活动指数构建的量化选股策略表现 [page::15][page::16]

  • 利用金融活动指数的边际变化构建选股因子,指数边际增长对应股价表现优于无变化组和无指数组。

- 多头组合以最近两周指数边际增长最大前30、50、100家公司构建,年化收益率分别达62.16%、48.84%、37.3%,均超出中证1000指数23.17%表现。



| 组合 | 年化收益率 | 年化波动率 | 最大回撤 |
|-------|------------|------------|------------|
| top30 | 62.16% | 25.45% | -19.60% |
| top50 | 48.84% | 24.75% | -18.72% |
| top100| 37.30% | 24.57% | -17.11% |
| 中证1000| 23.17% | 24.54% | -22.21% |

金融活动指数增强中证1000组合表现优异 [page::17]

  • 结合金融活动指数改进多因子指数增强策略,中证1000增强组合年化超额收益22.63%,信息比3.61,表现稳健。

- 2019年至2021年间,该增强组合超额收益分别为约23.39%、14.75%和20.61%。

| 年份 | 增强组合收益率 | 超额收益 |
|------|-----------------|----------|
| 2019 | 49.05% | 23.39% |
| 2020 | 34.14% | 14.75% |
| 2021 | 36.89% | 20.61% |
| 年化 | 45.80% | 22.63% |

风险提示 [page::19]

  • 量化模型基于历史数据构建,存在未来失效风险,投资需谨慎。


深度阅读

金融研究报告详尽分析报告


报告标题:移动大数据应用:基于金融活动指数的量化选股策略
作者:曹春晓、杨国平(均拥有SAC证券投资咨询执业资格)
发布机构:华西证券研究所
报告日期:2021年9月26日
主题:该报告围绕移动大数据在资产管理行业的应用,特别是基于杭州数行科技有限公司提供的金融活动指数,探索量化选股策略及其效果,覆盖了移动大数据的行业背景、数据价值、机构调研对比、金融活动指数构建及应用,最终提出基于金融活动指数的多头组合及指数增强组合策略,并评价其表现和存在风险。

---

1. 元数据与报告概览


报告目的一是在金融投资决策领域,利用移动大数据属性打造金融活动指数,突出体现机构投资者调研活动的频次和质量;二是对比传统机构调研数据,展示移动大数据的优越性及其广泛性和连续性优势;三是基此指数开发量化选股策略,实验结果表明该策略表现优异,能够显著超越基准指数。内容结构清晰,有四大板块:移动大数据行业背景、金融活动指数与机构调研数据对比、基于金融活动指数构建的量化策略及其实证表现、风险提示。[page::0,1]

---

2. 报告逐节精读与分析



2.1 移动大数据在资产管理行业的价值(第2-6页)


  • 关键论点:移动大数据因其海量、高频、全面和准确性,是另类数据的重要形式,在金融资产管理特别是投资决策场景下应用潜力巨大。

- 论证及逻辑:移动终端用户行为数据结合基站及WiFi等信号,能通过脱敏处理后的数据,构建细致的用户行为画像及金融投资者画像,从而挖掘潜在投资机会。数据特点包括覆盖亿级用户、实时频率高、标签多元时空覆盖全方位。移动大数据比传统调研或财务指标更贴近市场交易场景,频率更高且前瞻性较强。
  • 数据与案例:[图4]数行科技形成的用户画像体系示意,覆盖线下场景人流统计、宏观行业研究、微观用户洞察、多样用户标签等维度。[图5]以陆家嘴为例的人流强度、性别及年龄分布监测,体现了数据的空间和群体多维度解析能力,说明数据可精准描述市场活跃状态。[图6]提出金融活动指数,覆盖上市公司员工、顾客、物流、游客等多个维度,特别针对金融投资人群,体现数据的差异化与针对性。[page::2,3,4,5,6]


2.2 机构调研现状及移动大数据优势(第8-13页)


  • 关键论点:传统机构调研作为信息不对称下的核心破壁手段之一,其数量和深度不断增长,但具有周期长、频苛限制等弊端。移动大数据金融活动指数则表现出数据量更丰富、覆盖面更广、频次更高的优势。

- 具体分析
- 机构调研量从2013年开始数据统计,2021年调研公司数首次突破2000家,调研总次数也显著增加。[图8]
- 调研类型由以特定对象调研为主,转向业绩说明会主导增长(2021年深市1648家上市公司召开业绩说明会)。业绩说明会推动调研量快速增长,但并未显著改变特定对象调研的趋势。[图9]
- 调研形式方面,疫情以来非现场调研次数首次超过现场调研,但剔除业绩说明会后现场调研依然占主导(57%)。现场调研效果在股票价格事件研究中明显优于非现场调研,具有较为显著的超额收益,表现出更强的市场信息转化能力。[图10-11]
- 调研公司的间隔时间较长(中位数约93天),月均仅350家公司接受现场调研,数据有限且非连续性强,限制了调研数据作为短期量化因子使用。[图12]
- 相比之下,数行科技金融活动指数基于去重后日度人流量数据,覆盖超过2000家上市公司,频次和覆盖广度均优于机构调研数据。样例股票(鲁西化工、博腾股份)中,金融活动指数同时与机构调研数和股价走势正相关,且指数数据更加完整、连续。[图13]
  • 推理:机构调研虽效果明显但受限于覆盖和频率,金融活动指数的高频、广覆盖特性提供了新的量化投资数据源,能够更及时、持续反映机构关注度及市场动向。[page::8,9,10,11,12,13]


2.3 基于金融活动指数的量化选股策略(第15-17页)


  • 策略思路与假设

- 选取金融活动指数近期边际增长值作为因子,边际增长体现机构实地调研或关注度的提升,暗示市场对公司前景的乐观态度。区别于传统单调选股因子,该因子边际减少不能简单视为看空信号。
- 经过测试,金融活动指数边际上涨的公司,其长期表现显著优于有金融活动但增长不明显及无金融活动的公司。[图15]
  • 组合构建

- 以中证1000成分股为池,选出金融活动指数边际增长最快前N家公司,做市值加权多头组合,每月末调仓。
- 回测结果显示,top30、top50和top100组合均显著跑赢基准中证1000指数,尤其top30组合年化收益率62.16%,大幅优于中证1000 的23.17%。年化波动率相近,最大回撤更优。[图16及下表]
  • 指数增强测试

- 将金融活动指数增量作为多因子增强策略一因子,针对中证1000构建指数增强组合,自2019年表现稳健,年化超额收益22.63%,信息比3.61,表现优于市价指数。[图17及下表]
  • 推断基础:通过持续性、完备性更高的金融活动指数,捕捉机构调研行为,构建具备较强前瞻性和市场反应的量化因子,提升量化择时和选股能力。[page::15,16,17]


2.4 风险提示(第19页)


  • 风险:报告提示该量化模型基于历史数据,存在未来模型失效的风险,提醒投资者注意历史表现不代表未来结果。[page::19]


---

3. 图表数据详解



图4(第4页)


描述数行移动大数据基于用户线上线下行为数据,构建多维度用户画像体系示意图,涵盖千万级POI线下场景与超过10亿设备APP行为指标,用于宏观行业、中观企业、微观用户研究,体现数据维度丰富性及多层次阶段解析能力。意义在于说明数据覆盖从宏观到微观,全面支持投资决策。[page::4]

图5(第5页)


三组图表通过陆家嘴地区近两年多期人流强度(蓝色柱)、环比变化率(线图),性别比例(男女)、年龄分布(0-17,18-24,25-34,35-44,45+)动态观察,展现移动大数据精细化捕捉特定城市核心商圈流动人口及其属性结构的能力,为投资者提供市场活跃度和客群结构等多维信息。[page::5]

图8(第8页)


柱状图(左轴)与折线图(右轴)显示2013-2021年机构调研的被调研公司数及调研总数,2021年公司数突破2463,调研次数达万级,历年总体呈上升趋势,反映机构调研活动逐年活跃升温,说明调研是市场关注提升的核心途径。支持机构调研活跃化趋势的论述。[page::8]

图9(第9页)


表格详细罗列了2013-2021年不同调研类型(如特定对象分析师会、业绩说明、媒体采访、现场参观等)的数量,体现2021年业绩说明会达2100次显著提升,推动调研总量增长,但特定对象调研变化不大,说明不同调研类型涨跌异态,辅助理解调研体量扩张背后的结构性变化。[page::9]

图10(第10页)


柱状图显示2013-2021年现场调研(红柱)与非现场调研(褐柱)次数,2020年疫情后首次非现场超过现场。饼状图剔除业绩说明会后,现场调研仍占57%,非现场43%,验证现场调研在非说明会中仍是主流。反映疫情引发调研形式变化,但现场调研市场价值更大。[page::10]

图11(第11页)


事件分析图以交易日(上)及公告日(下)为基准,横轴为交易距离基准日的天数,纵轴为累积异常收益。现场调研公司超额收益明显强于非现场调研,后者在调研后4个交易日开始回撤,暗示现场调研更有效反映市场预期,收益持续稳健,非现场调研信息时效性较差。[page::11]

图12(第12页)


柱状与累计曲线描绘上市公司相邻两次现场调研间隔天数分布,间隔较长且分布广;以及每月进行现场调研的公司数量走势,平均不及350家,显示调研数量节奏较为稀疏,限制了调研数据作为高频量化因子应用的可能。[page::12]

图13(第13页)


两则折柱图分别展示鲁西化工和博腾股份身体金融活动指数(日度)与机构现场调研数量及股价走势关联。数据体现金融活动指数稳定连贯,覆盖面广,且波动与调研次数对应且能较好反映公司股价走势,佐证金融活动指数具备成为有效投资信号的基础。[page::13]

图15(第15页)


柱状图表示金融活动指数增长分组的因子收益率,增长组表现明显优于不增长组;折线图展示不同金融活动类别公司股价的累计收益对比,金融活动指数增长组以红线显示,长期收益领先于其他组,如无金融活动组和中证1000指数。[page::15]

图16(第16页)


折线图体现基于金融活动指数边际增长构建的多头组合表现,top30、top50、top100不同规模组合均跑赢中证1000指数。表格详细量化收益率、波动率和最大回撤,top30组合年化收益最高62.16%,最大回撤仅-19.6%,表现优异,显示金融活动指数因子具备显著择时和选股能力。[page::16]

图17(第17页)


折线图与表格验证将金融活动指数结合多因子模型构建的中证1000增强组合,近三年表现持续优于中证1000指数,具有良好超额收益(年化22.63%)和信息比(3.61),反映该策略稳健性和市场适应性,体现金融活动指数因子的潜力在多因子组合中的价值扩展。[page::17]

---

4. 估值分析



本报告核心聚焦于以金融活动指数辅助量化选股及指数增强策略的构建,未涉及传统公司估值模型如DCF、市盈率、多元回归等具体估值计算方法。量化策略基于实证回测以年化收益率、年化波动率、最大回撤、信息比等指标评价因子有效性和组合表现,属于量化投资层面绩效评价,不直接单一估值模型衡量。风险收益权衡及组合构造逻辑主导估值属性,展示了以另类大数据因子筛选标的的能力和有效性。

---

5. 风险因素评估


  • 量化模型基于历史数据,存在未来可能失效的风险。报告强调历史表现不代表未来结果,因模型参数和市场环境可能发生变化,量化因子的持续有效性需要动态验证。

- 移动大数据的采集与处理虽符合法律规范和脱敏要求,但数据安全、隐私保护、合规风险仍是潜在挑战。
  • 机构调研与金融活动指数的相关性虽较强,但并不完全等同,存在信息噪音和外生变量干扰。

- 组合策略暴露于市场波动风险、流动性风险,尽管历史最大回撤适中,但未来波动难以预测。[page::19]

---

6. 审慎视角与细微差别


  • 本报告对移动大数据的光环效应较为乐观,强调其数据优势和实证表现,但对潜在噪音、数据偏差、人为操控风险讨论有限,建议读者在实际应用中保持警惕。

- 机构调研数据时间成本及调研内容差异对策略影响未充分展开,调研质量不一会影响模型稳定性。
  • 金融活动指数边际增长的选股因子虽表现佳,但因无严格单调性,负增长时策略处理复杂,应注意模型的非线性响应和极端情形。

- 由于年份样本期较短(2019年以来),期间市场环境较特殊(疫情、新经济周期等),模型表现或存在阶段性优势,未来轮动与市场变化有待持续验证。
  • 报告未详述多因子增强策略中其他因子权重及风险因子对模型收益的贡献,单一因子难以完全解释组合收益,应综合多因子视角对结果进行稳健性验证。


---

7. 结论性综合



本报告系统阐述了移动大数据,尤其是基于杭州数行科技开发的金融活动指数,在资产管理领域尤其是量化投资上的创新应用和显著优势。报告通过详实的数据对比,证明了金融活动指数在相比传统机构调研的覆盖面广、更新频率高、数据丰富性强等多方面的优势,克服了机构调研后的间隔时间较长、数据非连续、样本有限的不足。

基于金融活动指数边际增长所构建的量化选股策略兼具实用性和有效性,策略期内显著超越中证1000指数,组合风险指标合理,且在多因子指数增强策略中亦取得稳健的超额收益,信息比达到3.61,充分体现了移动大数据因子作为另类投资逻辑载体的可行性与潜力。

图表如陆家嘴人流动态分析、机构调研数量及形式演化、事件研究中调研对股价影响、金融活动指数与机构调研及股价走向对比、多头组合及增强组合回测表现,均直观呈现了数据与逻辑的内在关联。

总体而言,报告展示了移动大数据技术结合人工智能分析,带来的投资理念和技术手段的现代化变革。金融活动指数为机构投资者调研活动数字化延伸,弥补传统调研不足,构建了高频、广覆盖的量化投资因子库,为资产管理行业提供了强有力的工具支持。

然而,模型存在未来失效风险,市场波动和另类数据使用中的隐含风险不可忽视,投资者应务必结合自身风险承受能力,谨慎使用相关策略。

报告整体立场积极肯定移动大数据尤其金融活动指数的战略价值和投资应用前景,建议投资者关注和尝试基于此类数据因子的精选投资策略。[page::0-19]

---

综述



本报告以深度调研及数据驱动视角,创新性地将移动大数据应用于选股策略设计,借助金融活动指数提供市场投资者行为的动态映射,并通过大量统计分析和回测,明确展示了该因子的投资价值与潜力,为量化投资领域提供了重要参考。

---

附注意事项:以上分析基于报告内容,严格按照报告所提供的数据和论述,未引入额外外部观点。文中所有引用均严格标注页码,用于溯源与验证。

报告