`

机器学习选股在海外公募量化发展如何?

创建于 更新于

摘要

本报告系统梳理了海外公募市场机器学习选股策略的应用现状和发展趋势,分析了贝莱德、高盛、WisdomTree及Invesco等头部机构对AI的不同使用方式,结合全球主要AI选股产品的策略框架和业绩表现(如图1示机构使用比例),指出目前端到端AI选股产品表现较弱,基于价量因子的策略效果较好,而以文本为核心的AI应用主要集中在辅助决策领域。QRAFT系列因子轮动策略近五年表现突出,累计超额收益约28%。报告强调基金经理在AI策略中的核心作用和机器学习在因子配置中的潜力,为国内量化投资应用提供借鉴参考 [page::0][page::4][page::7][page::17][page::19]

速读内容


全球机构量化投资中因子投资与AI应用现状概览 [page::4][page::5]


  • 超过90%的机构仍采用因子投资;

- 机器学习/AI使用比例约30%,亚太地区尤为活跃。
  • 机器学习最常见应用为因子挖掘,直接开发策略主要见于北美;

- 文本分析受益于大型预训练模型,未来受关注度提升。

贝莱德基于文本大语言模型的投资应用与主题机器人 [page::6][page::7][page::8][page::9]




贝莱德:
  • 侧重文本信息处理,使用自主训练的大语言模型生成股票收益预测,胜率超60%;

- 对文本实现深入情绪分析和投资主题识别;
  • 研发“主题机器人”,协助基金经理基于主题分析构建组合,体现“人机结合”的投资理念。

- 也在私募股权领域利用AI预测IPO及收购概率,准确率接近80%。

高盛量化团队文本情绪分析与全球选股产品表现 [page::10][page::11]


  • 利用大模型细化情绪分析,拓展至未来音频数据;

- 其Global Core Equity Portfolio最近半年表现优于MSCI World 约3%,但前三年跑输;
  • 结合机器学习与宏观风险分析工具,支持客户组合管理。


WisdomTree 基本面AI驱动选股模型及业绩表现 [page::12][page::13]


  • 构建约250个基本面特征,利用机器学习筛选股票,强调价值风格;

- 产品表现整体未能显著跑赢基准,2023年小幅跑输;
  • 因子暴露体现明显价值倾向,但基本面型模型在当前美股市场成效有限。


AI选股ETF业绩与策略多样性分析


AM-One世界AI基金 [page::15]


  • 基于深度学习的财务数据盈利预测,未持续跑赢基准指数,仅大致优于同类。

AIEQ AI Powered Equity ETF [page::16]


  • 端到端模型结合多维度数据,日运算百万级数据,换手率逐年攀升至27倍;

- 超额收益近年来显著下降,表现与换手率负相关;
  • 风格因子暴露波动大,偏小市值及低波动,但未形成稳定优势。


QRAFT系列:机器学习因子配置策略及优异表现 [page::17][page::18]


  • 旗下三只ETF历史表现领先,QRFT和AMOM近五年累计超额收益约28%;

- QRFT拟合动态调整五大类因子,风格偏离较小且稳定;
  • AMOM聚焦多时间窗口动量因子,风格更激进,表现更优;

- QRAFT与LG合作产品LQAI使用多维数据端到端预测模型,整合大语言模型技术。

AI选股应用总结与观察 [page::18][page::19]

  • 不同头部机构AI应用尺度差异大,均强调基金经理主导与模型微调;

- 文本类AI应用主要应用于辅助投资及情绪分析,端到端文本选股产品稀缺;
  • 基于人工提取特征的模型中,价量因子相关策略效果优于纯基本面模型;

- 直接端到端AI选股产品表现普遍不佳,机器学习因子组合轮动策略最具竞争力。

深度阅读

机器学习选股在海外公募量化发展如何?报告详尽分析



---

一、元数据与报告概览


  • 报告标题:《机器学习选股在海外公募量化发展如何?》

- 作者:证券分析师沈思逸、邓虎
  • 发布机构:申万宏源证券研究所

- 发布日期:2024年8月6日
  • 主要研究主题:海外公募量化基金特别是机器学习及AI技术在选股领域的应用现状、策略表现和未来发展趋势。


本报告旨在系统梳理海外公募量化基金中机器学习、特别是AI技术的应用路径、实践案例和产品表现,重点分析贝莱德、高盛、WisdomTree、Invesco等头部机构的AI策略,结合具体基金产品数据和策略特征,探讨AI选股策略的实际效果及发展意义。报告明确指出,目前全球公募中直接靠AI选股运作的产品数量有限且寿命普遍较短,但机构对AI技术的重视程度和应用热情仍处于上升阶段,AI在人机结合的投资流程中价值显著。投资评级或目标价未涉及,报告聚焦现状总结和趋势分析。[page::0,1]

---

二、逐节深度解读



1. 机器学习在海外公募平台的应用概览


  • 关键论点:过去两年机器学习在投资领域广泛应用于因子挖掘、因子合成和端到端选股模型开发。大模型(如基于Transformer的生成式AI)为文本信息的挖掘带来新机会,但因机器学习“黑箱属性”以及小市值因子回撤,机器学习选股的持续有效性仍充满争议。

- 数据摘录:全球公募基金和ETF中含量化/多因子产品规模约为千亿美元,规模不及整体市场但头部机构设有专门量化部门。调查筛选含AI关键词产品39只,规模260亿美元,但真正使用AI选股策略的仅5只,规模约17亿美元。美国市场标的以ETF形式存在多只,均规模不大,且多数早期产品已清盘。
  • 推论:直接依赖AI选股的公募产品稀少且存续能力弱,表明AI策略成熟度和稳定性尚需提升;但机构重视度高,尤其亚太地区使用比例较北美更高。[page::3,4]
  • 图表解读

- 图1显示全球因子投资使用率超过90%,机器学习/AI使用比例约30%,亚太领先。
- 图2显示机器学习主要用于趋势识别、组合优化,文本分析虽目前使用有限,但未来应用被普遍看好。
这体现出机构对机器学习辅助投资的普遍采用和增长趋势。[page::4,5]

2. 头部公募量化平台对AI的应用详解



2.1 贝莱德:文本分析为最大应用方向


  • 论点总结:贝莱德在运营、客户交互、投资环节广泛用AI,投资中重点用大语言模型处理文本信息,辅助投资决策,强调人机结合。它不单纯用机器学习挖价量因子,而是专注于文本情绪分析、大语言模型驱动的收益预测和主题投资。

- 关键数据
- 贝莱德每月处理分析师报告超10万篇(图3),说明海量文本数据驱动模型。
- 自研基于Transformer架构的大型语言模型胜率超过60%,显著优于公开GPT模型(图4)。
  • 模型架构与训练流程

- 先有基础预训练模型,再结合股票未来收益进行带标签微调,目标函数兼顾收益、风险及交易成本,输出基于文本的收益预测。这一基于文本的端到端模型创新地替代了传统价量端到端模型,贴合资本市场特征打造差异化alpha来源。
  • 主题投资

- 运用机器学习识别新闻、电召纪要、社媒等多个文本源的投资主题,辅以资金流及券商推荐,结合大语言模型提高识别精准度。
- “主题机器人”作为主动基金经理辅助工具,按输入主题文本返回股票池及投资组合,体现了高自主权的人工-机器协作机制(图5、6)。
  • 此外,贝莱德将AI拓展至私募股权领域,用AI预测IPO或收购概率,准确率约80%,远高于市场平均。[page::6-9]


2.2 高盛量化团队


  • 分析思路:与贝莱德类似,聚焦文本情绪分析,利用公司独有算力训练大模型。方法论历经由线性因子模型,传统词频NLP,到大模型Fine Tuning的进化(表3)。

- 应用案例:Global Core Equity Portfolio结合机器学习与传统量化方法,2024上半年超越MSCI World指数约3%,但前三年整体表现落后(图7)。
  • 未来展望:拓展文本情绪分析至电话会议音频,利用语调识别额外情绪信息,领先于文本情绪分析的深度。

- 合作创新:联合Quant Insight开发宏观量化工具,为机构客户提供宏观风险分析建议。[page::10,11]

2.3 WisdomTree


  • 产品核心:旗下WisdomTree U.S. AI Enhanced Value Fund采用基本面驱动机器学习策略,强调基本面特征工程及AI选股,构造传统价值与AI特色的组合(图8)。

- 策略流程:大规模数据处理(宏观、分析师预期、财务等)、构建250+特征,AI选股筛选400-500只股票,组合层面结合基金经理确认及交易执行。
  • 表现:2022年开始转向价值风格表现,但至2024年未展现绝对优势,甚至微弱跑输罗素1000价值指数,风格暴露清晰但表现有限(图9,表4)。

- 推断:基本面数据驱动AI选股产品在美国市场效果不佳,或因基本面因子本身的已有成熟度及市场环境限制。[page::11-13]

2.4 Invesco


  • 态度鲜明:尽管机构整体重视AI,Invesco聚焦提高运营效率,尤其生成式AI在客户服务、宣传上的辅助,当前未直接用于选股。

- 策略特色:以被动指数产品和动态多因子配置为主,量化辅助人工,未将机器学习结果直接纳入投资决策。[page::14]

3. 其他AI选股产品策略与表现



3.1 AM-One World Eq Fund


  • 以深度学习模型基于20年全球10,000+公司财务数据训练,使用MSCI Kokusai指数为基准。

- 近年未能持续跑赢基准,业绩波动较大(图10)。
  • 结论:基本面AI选股策略在跨国股票市场超额收益难以稳定获得。[page::14,15]


3.2 AIEQ(Amplify AI Powered Equity ETF)


  • 美国第一个以AI为名的选股ETF,采用IBM Watson平台,端到端模型结合基本面、价量、文本等。

- 数据源和计算量庞大,2017年成立至今换手率逐年提升,2023财年达27倍,换手与表现反相关,近年超额收益呈下降趋势(图11)。
  • 风格波动大,成长、基本面等偏好五年跨度极宽(表5),说明策略风格不稳定,不同于AIVL的稳健价值属性。

- 总体表现揭示高换手、高风格灵活度并未转化为超额收益,AI选股仍面临挑战。[page::15,16]

3.3 QRAFT 系列


  • 同类产品中近年表现最佳,旗下QRFT、AMOM和合作产品LQAI整体近5年累计超额约28%(图12)。

- QRFT以AI动态配置传统质量、市值、价值、动量和低波五类大因子,风格偏离不大但波动明显(表6、7);AMOM偏激进,聚焦多样动量因子,风格明显偏向动量、高波动和成长,表现优于QRFT。
  • LQAI为端到端模型,输入包含多维度数据且结合大语言模型,四周调仓,产品策略前沿。

- QRAFT产品成功体现了机器学习结合传统因子配置的优势,且灵活性与不同市场阶段适应性较强。[page::17,18]

4. 总结部分明确了以下几点


  • 头部机构对AI的态度谨慎而积极,不同尺度使用AI并强调“人”的主导作用。

- 贝莱德、高盛等侧重文本情绪处理与大语言模型,WisdomTree偏向基本面驱动,Invesco则作为辅助工具。
  • 直接基于多维度数据的端到端模型未来能否获得超额收益仍存在质疑。

- 价量信息驱动的机器学习模型优于基本面驱动模型。
  • 利用机器学习进行大类因子动态配置展现较好表现,代表QRFT产品。

- 综合端到端AI选股产品表现不佳,头部机构往往在文本领域或局部数据维度深耕。
  • 报告强调对风险提示,声明其不构成基金推荐。[page::18,19]


---

三、图表深度解读



图1:量化投资机构使用各类方法的比例(第4页)


  • 描述:该柱状图展示了全球及区域市场(亚太、EMEA、北美)机构量化投资方法的采用比例。

- 解读:
- 因子投资采用率高达90%以上,表明因子投资是最主流的量化手段。
- 机器学习/AI采用率约30%,北美亚太高于EMEA,亚太最高接近50%。
  • 说明机构对因子投资的依赖和对机器学习逐步升温的趋势。[page::4]


图2:量化投资机构在不同场景使用机器学习的比例(第5页)


  • 描述:展示机器学习在6大具体应用场景的地区使用比例。

- 解读:
- 以识别市场行为趋势结构占比最高,尤其亚太65%+。
- 直接策略开发虽属于高价值应用,但比例相对较低,北美使用率高于其他地区。
- 文本分析使用较少,但被视未来重要场景。
  • 支持报告观点:价量因子挖掘是主流,文本分析及端到端开发仍处成长阶段。[page::5]


图3:贝莱德平均每月大语言模型处理研报数(第7页)


  • 描述:逐年展示贝莱德月均处理分析师报告篇数,历经连续增长,2023年超13万篇。

- 解读:反映贝莱德投入海量文本资产,验证其以文本为核心AI应用战略。
  • 由此可见文本量级赋能模型的Alpha来源广阔。[page::7]


图4:贝莱德大模型预测胜率(第7页)


  • 描述:柱状图比较贝莱德自研大语言模型和公开GPT模型的股票收益预测准确率,贝莱德模型超过60%。

- 解读:自研模型通过定制优化指标及训练数据,显著优于通用大模型,说明定制化模型对于金融应用具备优势。[page::7]

图5-6:贝莱德“主题机器人”工作流程与输入信息(第9页)


  • 描述:图5流程简明表述基金经理输入主题文本后,机器人关联海量文本数据生成股票组合及回测结果;图6为具体示例输入(涉及药物释放相关主题、起止日期、股票种子等)。

- 解读:此工具辅助基金经理主题选股决策,结合人机互动,提升主题投资效率和定制化水平。
  • 体现“人”的作用仍核心。[page::9]


图7:高盛Global Core Equity Portfolio表现(第11页)


  • 描述:条形图展示2021至2024年上半年,高盛该组合与MSCI世界指数收益对比。

- 解读:表现波动明显,2022年遭遇较大负收益,2024年初回升并超越基准3%以上,反映量化策略表现受市场周期影响较大。[page::11]

图8:WisdomTree机器学习产品选股流程(第12页)


  • 描述:流程图从数据收集、特征工程、AI选股、组合建设至交易执行五步展开,结合“人-机”两部分。

- 解读:体现机器学习策略下人机互动的管理流程与严格筛选逻辑。
  • 人工研究投入初期建立稳健的底层数据信息基础。[page::12]


图9:WisdomTree美国AI选股价值基金表现(第13页)


  • 描述:罗素1000、罗素1000价值指数及AIVL基金2022年至2024年1-7月的收益对比图。

- 解读:AIVL整体表现弱于基准,价值风格明显但无明显超额收益,表现与价值因子暴露相符。
  • 反映基本面驱动AI选股未带来质的收益改善。[page::13]


图10:AM-One World Eq基金表现(第15页)


  • 描述:2019-2024年7月,基金表现、MSCI Kokusai指数及Lipper同类基金收益对比。

- 解读:基金波动明显,部分年份表现优异,整体与市场及同行持平,显示基本面深度学习模型难以持续超越基准。[page::15]

图11:AIEQ财年超额收益与换手率(第16页)


  • 描述:2019-2023财年AIEQ的超额收益(负轴)和换手率(正轴)趋势图,换手率逐年大幅增长。

- 解读:换手高企与业绩负相关,提示过度交易可能侵蚀机器学习选股策略盈利能力。[page::16]

图12:QRAFT产品半年度相对标普500超额收益(第17页)


  • 描述:2019年至2024年中,QRFT、AMOM、LQAI三只ETF半年度超额收益对比。

- 解读:整体表现优于标普500,特别是AMOM动量策略在2020年和2022年下半年表现强劲。
  • 说明动态因子配置与机器学习结合策略具备较好适应市场能力。[page::17]


---

四、估值分析



本报告整体属于策略与产品现状分析及案例研究,未涉及具体的个股财务估值模型(如DCF、PE倍数估值等),因此无专门估值分析章节。

---

五、风险因素评估



报告虽无专门风险章节,但在多处提及风险信号:
  • 机器学习“黑箱”属性带来模型透明度和解释性不足风险。

- AI策略特别是端到端多维度输入模型近年在美股市场适应性差,持续超额收益能力未彰显。
  • 高换手率可能导致交易成本高企,侵蚀实际收益。

- 基本面驱动AI模型表现弱于价量动量驱动模型,可能受市场风格变化及因子退化风险影响。
  • 主题或文本驱动模型的成功高度依赖数据质量及模型训练,未充分披露潜在过拟合等风险。

- 在实际使用中,部分产品表现波动大,回撤显著(如高盛Global Core Equity的2022年),投资者需警惕市场周期风险。
报告强调人机结合和基金经理主导,隐含对信号使用谨慎和持续监督的风险缓释策略。[page::0,3,18]

---

六、批判性视角与细微差别


  • 机构普遍对AI抱以高度期待,但实际AI策略产品表现不一,且多呈现出风格波动大、持续性差的特点,暗示市场对机器学习信号的噪声过滤仍不完善。

- 贝莱德和高盛等头部机构注重文本分析及大语言模型,但未披露具体量化策略的组合表现数据,仅以预测胜率等技术指标佐证,有待未来业绩验证。
  • 基本面数据驱动的AI选股模型普遍表现逊色于价量因子驱动模型,提示市场已有的基本面因子可能难以被机器学习进一步提升。

- AIEQ高换手率与低超额收益关系提示AI选股在实务中易遭遇过拟合和交易成本冲击问题。
  • 报告中部分产品数据依赖外部供应商(如Bloomberg、Refinitiv),数据完整性和节奏或对结果有一定影响。

- 各ETF产品的风格波动区间极大,说明机器学习选股策略风格稳定性不足,投资体验可能欠缺一致性。
  • 尽管报告强调基金经理在使用AI模型中的关键作用,但人机协同的具体流程和决策细节未详述,决策偏差风险仍存在。

- 报告未对AI选股的监管及伦理风险提出分析,未来监管环境不确定性可能加大。[page::0-19]

---

七、结论性综合



报告全面剖析了海外公募量化基金领域机器学习及AI技术的应用演变、现状和挑战,核心发现包括:
  • 全球市场背景:虽然AI在量化投资中受关注度增加,直接以AI选股策略运作的公募产品规模和数量依然有限,且多数AI选股产品生命力不足。
  • 机构应用态度:以贝莱德、高盛等头部机构为代表,AI更多作为文本情绪分析、主题挖掘的工具,而非完全替代人类的端到端选股策略,它们强调“人”的主导作用,和模型的微调、解读及集成。
  • 策略类型差异:市面上AI选股产品主要分为

1. 端到端多维数据输入模型(宏观、基本面、价量、文本),但表现欠佳且波动大;
2. 偏向基本面数据的人工特征构造AI模型,表现逊于价量动量驱动的模型;
3. 机器学习动态配置传统因子(质量、动量、价值等)以实现风格轮动,表现更优(如QRAFT产品)。
  • 表现总结:价量因子驱动的机器学习模型优于基本面驱动,换手率过高(AIEQ)往往伴随表现恶化,而部分策略具备较好超额收益潜力(QRAFT),但整体稳定性尚显不足。
  • 技术革新:大语言模型在文本信息挖掘上的革命性改进成为目前头部机构重点布局方向,AI未来进一步在情绪音频分析、私募股权预测领域也展现潜力。
  • 图表数据支持了以上结论,如贝莱德强劲的文本大语言模型预测能力(图3、4),不同AI产品风格暴露及表现对比(表4-7,图9-12),换手率与收益的负相关(图11)。


总体来看,海外公募量化基金机器学习选股应用仍处于探索和逐步完善阶段,AI技术正逐渐成为提升传统量化研究和文本信息处理能力的重要工具,但远未达到替代传统投资决策的成熟度。投资者和从业者应理性看待AI的潜力与风险,注重人机协作与模型解释,逐步推动AI在量化投资中的高质量应用。

---

(完)

---

引用格式说明:本文所有结论均源于所提供报告内容,引用页码区间已在对应小节末尾注明,确保内容溯源准确。

报告