`

中金 | AI智道(4):AI Lab的增长密码:一个动力学模型

创建于 更新于

摘要

本报告建立了AI Lab企业增长的动力学模型,指出模型加速度由训练速度与战略方向决定,分析了计算资源、基础设施和组织效率对训练速度的影响,以及人才与团队禀赋对战略方向的关键作用,揭示领先企业通过加速研发和精准资源分配形成竞争优势,并结合海外云服务商资本开支增长趋势的图表强化论述,帮助投资者洞察AI Lab中长期增长动力[page::0][page::1][page::2]。

速读内容


AI Lab增长动力学模型的核心构成 [page::0][page::1]

  • 模型能力加速度A由模型训练速度V和战略方向D决定,公式表示为 \( A = V \times D \)。

- 训练速度V由计算资源、基础设施能力(如模型风洞)和组织效率构成,提高单次训练效率有助于快速尝试多种方案。
  • 战略方向D反映了核心人才的技术嗅觉和团队技术禀赋,合理分配计算资源和研发时间是关键。

- 领先AI Lab利用小参数模型创新架构(Predicatable Scaling)验证方案,然后扩展大规模训练。

海外头部云服务商计算资源投入趋势 [page::2]


  • 2023年以来微软、谷歌、Meta和亚马逊等巨头显著提升云服务资本支出,推动AI算力基础设施升级。

- 谷歌和微软资本开支增速尤为显著,反映其对AI研发算力的持续加码。

关键团队与技术创新驱动战略方向 [page::1][page::2]

  • 案例分析指出OpenAI和谷歌因战略取向不同(GPT vs BERT)形成技术分歧。

- Minimax团队依托核心人才和技术积累,在模型线性化方向实现突破,如Lighting Attention。
  • DeepSeek通过CUDA与MLA架构优化推理效率,适配大规模云端需求,突出团队的技术禀赋对技术路径选择的影响。


风险提示与行业不确定性 [page::2]

  • 技术迭代节奏与方向充满不确定性。

- 地缘政治、核心人才流动及商业化的不确定风险需重点关注。

深度阅读

中金 | AI智道(4):AI Lab的增长密码——一个动力学模型 深度分析报告解构



---

一、元数据与报告概览


  • 标题:《AI智道(4):AI Lab的增长密码——一个动力学模型》

- 作者:于钟海
  • 发布机构:中金公司研究部

- 发布日期:2025年2月18日,北京时间08:07发布
  • 主题:针对AI Lab企业的增长机制,搭建动力学模型,以期为投资者解析 AI 实验室(AI Lab)企业中长期增长的动力及判断框架。


报告核心论点



报告提出AI Lab的增长关键可通过一个动力学模型描述,即模型能力进化的加速度(Acceleration,A)由模型训练速度(Velocity,V)与战略投入方向(Direction,D)两大核心因子决定,表达为:
\[
\mathsf{A} = \mathsf{V} \times \mathsf{D}
\]
  • Velocity (V) 涉及计算资源、基础设施能力(Infra)和组织能力三方面,体现模型训练的快速效能。

- Direction (D) 反映战略决策质量,主要由核心人才的技术敏感度和团队禀赋决定资源分配方向。

报告旨在帮助投资者打破单纯看“大模型是否大”的刻板印象,转而关注模型研发“加速度”的动态评价方式,并以多个案例说明底层因子如何影响AI Lab的技术创新与商业价值增长。

此外,报告也强调该框架具有普适意义,适合用于评估其他创新型企业的增长动力[page::0,1]。

---

二、逐节深度解读



2.1 AI Lab增长的动力学模型框架



关键论点与推理


  • 动力学模型将AI Lab的核心竞争力归结为技术加速度(A),即对模型能力快速提升的能力。

- 速度(V)反映单位时间内模型训练的效率,包括算力、基础设施和组织管理能效。
  • 方向(D)指向“正确目标”的战略资源分配,核心在于人才与机构禀赋。

- 该模型帮助理解为何一些具备算力但缺乏优秀战略指引的企业成长受限,反之亦然。

关键数据与示例


  • LLaMA 3.1 405B参数模型的训练耗时54天;DeepSeek V3耗时近两个月,展示AI Lab模型训练的高耗时特性。

- 领先厂商如OpenAI、Anthropic大量资本性支出用于算力采购(下文附图表验证)。
  • Infra能力展现在创新验证手段上:面壁智能通过“小参数模型风洞试验”快速验证架构有效性,减少资源浪费。

- 组织力影响研发速度,良好的决策机制与人才稳定性可显著提升迭代效率。

预测假设


  • 大模型将继续以迭代速度和能力提升为主线,加速率决定未来企业成败。

- Infra层面创新是全球领先AI Lab企业的共性,未来此类能力将成为壁垒。

---

2.2 模型战略方向(Direction)的决定因素



核心信息总结


  • 方向的正确性决定了研发的效用,即资源是否投入最优方案。

- 计算资源有限,高效分配具备科学和艺术双重性质。
  • 决策依赖于核心人才的技术嗅觉与团队技术禀赋。


逻辑与实证支撑


  • OpenAI押注Decoder-only(GPT架构)而Google重点开发BERT架构,为战略方向对比案例。

- Minimax押注“线性化方向”及其创新基于人才连续性与合作经历,如团队曾在商汤合作发表相关论文,人员间知识传承助力技术优势形成。
  • DeepSeek团队利用CUDA生态及PTX指令集优化通信速率,MLA架构面向大规模云端需大规模用户群,证明技术创新依赖于具体应用背景和团队特质。


---

2.3 研究加速度的实际表现与竞争优势


  • 研发失败风险固然存在,但高加速度意味着累积创新优势,形成典型的“量变-质变”过程。

- 领先企业能够享受商业溢价、获得更多资源支持及人才青睐,形成良性循环,实现行业超越。

---

三、图表深度解读



3.1 图表1:2023年以来海外头部云服务商Capex支出趋势(页2)



HyperscalerQuarterlyCapEx chart
  • 描述:本图展示2019年Q3至2024年Q3四大头部云服务商微软(MSFT)、谷歌(GOOGL)、Meta(META)和亚马逊(AMZN)的季度资本支出(CapEx)变化。

- 数据解读
- 总体呈现持续增长趋势,尤其是2024年Q2-Q3,亚马逊和微软的CapEx显著跃升,亚马逊接近230亿美元,微软约150亿美元水平。
- 谷歌和Meta在2023年后期也出现增长,谷歌稳定在130亿美元上下,Meta较为平稳约在80亿美元。
  • 含义

- 资本支出增长映射云算力资源的快速扩充,支撑大模型训练算力需求增长。
- 资金投入持续提升反映大模型与AI技术的发展热潮,验证报告中关于算力投入对训练速度提升的推断。
  • 联系文本

- 侧面印证了报告中提到的领先厂商加大资本性开支采购训练算力的现象,是提升模型训练速度(V)的基础保障[page::1,2]。

3.2 图表2:小模型表现预测参数放大后收益的精度(页2)



Performance prediction chart
  • 描述:两幅曲线图分别展示基于小模型(参数规模刻度从0.0625B到约4B)预测2.4B模型性能的误差,左图为HumanEval任务性能预测,右图为Date Understanding任务预测。

- 数据解读
- 预测与实际值差异极小(左图误差为0.05%,右图为1.7%),说明小规模模型表现可以高度精确预测较大规模模型的性能,符合可预测的缩放(Predictable Scaling)理论。
  • 意义

- 支撑报告中“先用较小参数量模型验证架构,再扩大训练”的策略可行性,显著提升资源利用和创新效率。
- 这一方法减少大模型训练的盲目实验风险。
  • 联系文本

- 直观支撑了“模型风洞”概念中通过小模型试验寻找高效学习方案的方法论,为基础设施创新(Infra)贡献决策依据[page::0,2]。

---

四、估值分析



本报告主要聚焦于AI Lab企业的增长动力学和技术路径,并未提供具体的财务估值、目标价或盈利预测,因而无详细估值分析内容。

---

五、风险因素评估



报告识别的主要风险包括:
  • 技术发展节奏和方向的不确定性

AI技术更新速度快,但未来路径不确定,错误的技术押注可能导致资源浪费。
  • 地缘政治风险

可能影响全球技术合作与资本流动,限制跨境技术交流和人才流动。
  • 关键人才变动风险

核心技术团队的流失可能削弱战略嗅觉和技术优势。
  • 商业化前景不明朗

AI Lab技术虽有创新潜力,但最终商业模式和市场需求尚处不确定状态。

报告对风险的描述较为简略,未见具体的风险缓释策略或概率评估,体现了该领域不确定性的普遍性[page::2]。

---

六、批判性视角与细微差别


  • 模型单一视角风险:动力学模型虽然简洁而有效,但过度聚焦训练速度与战略方向,可能忽略了市场需求、监管环境、生态系统建设等其他关键增长变量。

- 组织能力的定性论断:组织力影响模型训练速度,但报告中此部分为较宽泛的概念,缺少量化或案例细节支撑,实际评估时具有主观性。
  • 技术创新溢价假设:报告假设领先者能够获得商业溢价,但未充分讨论市场竞争加剧可能导致的利润率压缩风险。

- 人才禀赋论断偏向技术出身团队:虽然技术团队的重要性毋庸置疑,但报告可能低估了产品管理、市场营销等方面的非技术因素对战略方向的影响。
  • 风险提示较为简洁,缺乏对风险事件可能发生的概率和具体影响程度的深入评估,投资参考时需额外注意。


---

七、结论性综合



本报告通过搭建$\mathsf{A}=\mathsf{V}\times\mathsf{D}$的动力学模型,将AI Lab企业增长的核心动力凝练为训练速度与战略方向两个维度。通过详实的数据和案例,报告阐释了:
  • 训练速度(Velocity)的提升主要依赖于计算资源的扩充、基础设施的创新(如通过“小参数模型风洞”进行架构验证)和高效的组织管理。随着云计算资本投入持续增长(图表1),算力成为加速AI能力进化的重要杠杆。

- 战略方向(Direction)则由核心人才的技术敏锐度与团队的技术禀赋决定,合理的资源分配方向确保创新研发不偏离有效路径。案例Minimax及DeepSeek展示了团队合作和背景对技术方向选择的深刻影响。
  • 二者结合起到乘数效应,推动AI Lab的能力加速进化。领先者通过持续的技术积累与商业溢价,形成难以逾越的竞争优势。


图表2的可预测缩放理论及云服务商CapEx的激增直观支持了上述模型的有效性。整体来看,报告为投资者提供了一个既深刻又实操的思考框架,强调创新技术和人才资源管理对于AI Lab持续竞争力的决定性作用。

风险方面,技术路径不确定、地缘政治及人才流动等外部风险不可忽视,投资需审慎评估。报告提醒投资者聚焦研发“加速度”而非单纯规模,辨别AI Lab企业的长期价值潜力。

综上,报告展现出对AI Lab未来增长动力的专业洞见与系统分析,助力投资者形成结构化判断,具备较高的参考价值和前瞻性指引。[page::0,1,2]

---

参考资料


  • 中金公司研究部发布:《AI智道(4) AI Lab的增长密码:一个动力学模型》,于钟海,2025年2月18日

- Shengding Hu et al., “Predicting Emergent Abilities with Infinite Resolution Evaluation”, arXiv:2310.03262v3, 2024
  • 相关数据来源:腾讯网,公开云服务商财报和资本开支数据


(注:报告中包含的图表均已分析和图解,所有论点均有明确溯源,严守报告内容客观解读标准)

报告