`

中金 | AI进化论(13):算力,后GPT-5时代的“硬通货”

创建于 更新于

摘要

报告聚焦后GPT-5时代AI算力需求,分析全球与国产大模型持续快速迭代带来的Token消耗激增,探讨OpenAI、谷歌等巨头的定价及策略差异,以及国产算力从芯片向系统方案拓展趋势,指出算力作为AI应用的“硬通货”地位将持续强化,推荐重点关注算力产业链相关投资机会 [page::0][page::1][page::6][page::8][page::12][page::13]

速读内容


GPT-5带动算力需求升级 [page::0][page::3][page::4]

  • GPT-5发布,提升了推理效率和上下文窗口至400K Tokens,显著降低单次调用成本,API定价低于前代产品及竞争对手,推动“降本—扩容—增需”的良性循环。

- GPT-5采用统一系统和自适应推理路由,有效减少Token消耗,推理链更短、更稳,支持多工具协作,降低总Token使用量。
  • 上下文窗口扩大3倍以上,显著提高长文档、跨工具流水线等复杂应用算力需求。




全球大模型竞争推动算力需求多元增长 [page::1][page::6][page::7]

  • 全球大模型厂商推陈出新,2025上半年9家发布21个新模型,同比增长近30%,涵盖多模态、超长上下文等能力提升。

- 不同厂商商业策略差异明显,OpenAI依赖外部资本,强调价格-性能平衡;谷歌、Meta依托雄厚资源持续推优;Anthropic注重代码能力投入。
  • 相关商业策略均正向拉动算力需求。




谷歌AI Overview引领Token消耗爆发式增长 [page::8][page::9]

  • 谷歌AI Overview基于搜索关键词自动触发生成摘要,构成谷歌Token消耗快速增长的核心驱动力,2025年其Token使用量领先微软与字节。

- 谷歌月活用户远超其他厂商,免费轻交互模式降低使用门槛,AI Overview月活达15亿用户。
  • Token密度抬升受多因素推动:思维链、多步推理、Agent逻辑、AI搜索、多模态处理、上下文积累及复杂任务,带动算力需求爆发式拓展。




国产大模型创新与应用迭代加速,引发Token消耗大幅增长 [page::10][page::11][page::12]

  • Kimi K2基于MoE架构,1万亿参数,Token消耗大,支持高复杂链式任务,预训练Token超15T,展示国产模型升级实力。

- MiniMax、可灵AI及通义千问等持续更新,推动多模态应用和视频生成,驱动Token需求爆发。
  • 字节跳动豆包模型日均Token超16万亿,市场份额领先公有云大模型调用,国内模型月活持续增长。





国产算力全维度赋能,聚焦芯片到系统创新 [page::13]

  • AI芯片企业从单芯片性能迭代迈向互连创新、超节点架构及规模化系统方案,打造从芯片到系统的高效算力集群。

- 面对不断扩张的应用场景和算力瓶颈,多维度突破能力为国产算力抢占市场提供关键竞争力。

风险提示 [page::1][page::13]

  • 生成式AI模型创新与商业落地不及预期影响算力需求。

- 硬件算力与通信带宽瓶颈可能限制AI算力扩展。
  • 国际贸易摩擦带来的政策风险。


深度阅读

中金 | AI进化论(13):算力,后GPT-5时代的“硬通货” —— 详尽分析报告解构



---

1. 元数据与报告概览


  • 报告标题:《AI进化论(13):算力,后GPT-5时代的“硬通货”》

- 作者:成乔升、贾顺鹤等,中金公司研究团队
  • 发布时间:2025年8月13日

- 发布机构:中金公司(CICC)
  • 主题:深度聚焦生成式AI大模型,尤其是以GPT-5为代表的技术迭代背景下算力的需求变化、市场表现及投资机会

- 核心论点
- 生成式AI大模型迭代迅速,尤其是2025年第二季度及第三季度密集亮相的GPT-5等新品,推动算力需求进入“硬通货”阶段。
- GPT-5的高效token使用、低价格以及大幅提升的上下文窗口能力三重因素共同驱动算力需求攀升。
- 全球范围内大模型频繁迭代,自由与商业驱动的创新并行,推动算力市场快速增长。
- 国内模型虽技术稍逊北美领先者,但持续升级并通过多模态与开源创新逐步实现追赶,可望带动国产算力硬件及系统解决方案快速发展。
- 风险包括技术创新不足、商业落地进展不及预期、硬件算力瓶颈及贸易摩擦潜在影响。

本报告通过结合全球和国内大模型最新技术变革、商业模式及Token使用数据,探讨算力产业链的发展机遇及风险展望,从资本视角持续看好相关投资主题。[page::0,1]

---

2. 逐节深度解读



2.1 摘要与引言


  • 报告开篇回顾了“DeepSeek创新热”后全球大模型的迭代快节奏,尤其是2025年第二季度多家头部厂商密集推出升级产品,推动算力需求指数级增长。

- 重点提及OpenAI发布GPT-5,该模型在智力水平、编程能力、资源调度、幻觉减少、上下文容量及写作质量等基础能力提升明显。
  • GPT-5重大变化在于提高单位算力效率,降低API调用成本,预计带动算力需求“降本-扩容-增需”良性循环,同时OpenAI承诺算力资源5个月内翻倍。

- 国内方面,字节、快手、Kimi、Minimax等厂商均有模型升级,推动国内算力需求稳步上升,尤其在多模态领域实现突破,合计token消耗已与Google相当。
  • 供给侧方面,国产芯片企业正从单芯片性能提升向系统方案发展,形成从硬件到系统的产业链全景布局,为国产算力市场长远增长奠定基础。[page::0]


---

2.2 GPT-5发布与全球模型迭代加速


  • 2025年8月,OpenAI重磅推出GPT-5,结合GPT-oss、Claude Opus 4.1、谷歌DeepMind Genie 3等新模型标志着大模型进入多点爆发的时代。

- 技术特性核心剖析
- Token使用效率大幅提升
- GPT-5为统一推理系统,智能切换聊天模型与推理模型,有效避免无谓算力浪费,Thinking模式对比o3版本在多任务token用量降低50%至80%。
- 推理链条收敛提升,工具调用减少(token较o3减少22%,工具调用减少45%),降低了规划-执行-校验过程中的冗余。
- 新增控制参数(verbosity、reasoning effort)精准调控文本输出长度及推理深度,进一步节省token消耗。
- 定价体系显著优化
- GPT-5主版本API调用成本约输入1.25美元/百万token,输出10美元/百万token,均远低于GPT-4.1及Anthropic产品,mini及nano版本价更低。
- 划分多档次模式(免费GPT-5模式、Plus订阅、Pro订阅),覆盖不同用户需求,降低准入门槛,提高用户粘性和调用密度。
- 上下文窗口大幅扩展
- 支持400K token上下文,超目前主流的128K及200K,极大提升了长文档、多源内容直达处理能力,减少拆分带来的额外开销。
- 对显存和带宽的瞬时算力需求更高,推动算力的进一步升级。
  • 报告指出,GPT-5更新重心在于“效率+成本”,实现算力使用良性飞轮,受资金约束强烈影响,需要在满足性能的同时实现商业可持续。

- 其他参与者(谷歌、Meta、Anthropic)利用资源和市值优势以更稳健策略推动模型更新,整体推动算力需求持续走高。

图表4-6详细展示了Genie 3性能对比、gpt-oss竞赛编程表现和Claude Opus 4.1多维评测提升,以及2022年以来模型发布时间轴,显示出全球大模型迭代密度加大、功能边界不断拓展的趋势。[page::1,2,3,4,5,6]

---

2.3 Token消耗与AI应用密度迅速攀升


  • 报告借助谷歌、微软、字节的数据验证了Token消耗量的线上急剧增长趋势,谷歌2025年上半年Token消耗量远超其他厂商,主要得益于搜索增强产品“AI Overview”的高速扩展。

- 谷歌AI Overview的特点
- 默认触发,无需用户主动提问,频繁在搜索结果生成AI摘要,大量token在后台自动消耗。
- 月活达15亿,相比Gemini(3.5亿月活)与ChatGPT(6亿月活),规模大幅领先。
- 新增AI Mode复合多轮搜索和多问题预测,进一步提升token密度。
  • 报告归纳谷歌依凭更优产品形态和庞大用户体量,占据领先地位,并推动其Token使用量遥遥领先,促进算力需求快速增长。

- 此外,Token消耗增长的驱动因素多元化,包括:
- 思维链(Chain of Thought,CoT)与多步推理:模型更复杂的问题分解,多次验证,延长Token序列。
- Agent模式:任务拆解、工具调用带来交互开销及误差修正消耗。
- AI搜索功能:多轮搜索和返回结果再次处理产生大量token。
- 多模态处理:图像、语音、视频等非文本输入输出转换为token。
- 上下文积累:长对话历史与多轮交互导致Token序列剧增。
- 复杂任务处理:长文本生成及精准推理任务拉升消耗。[page::7,8,9]

---

2.4 国产模型的迭代与流量王者动态


  • 报告概述了具有代表性的国产大模型近期更新及其带来的Token规模暴涨:

- Kimi K2模型基于MoE架构,拥有1万亿参数设计并优化了激活参数,支撑超长Token训练(15.5万亿token),在代码生成、数学推理等取得SOTA,定价相对较高,且被视为国产多模态突破核心。
- K2的损失与训练Token的折线图显示,随着训练Token增长模型loss明显下降,表明性能稳步提升。
- MiniMax在视频生成、智能体代理等方向加码,模型容量及分辨率提升引导用户使用更高规格输入,致使Token用量成倍增长。
- 快手可灵AI发布2.1系列模型,虽保持定价稳定,但因能力及创作自由度提升,带动用户更频繁使用高规格模式。
- 阿里通义千问团队推出首个文生图模型Qwen-Image,对多模态交互兴趣提升显著,进而推动Token消耗增加。报告中附有Qwen-Image生成的多样化高质量图片样本,体现技术效果。
  • 通过对主流国产AI应用周度日均活跃用户数进行分析,包括通义、海螺、可灵、DeepSeek、Kimi智能助手、豆包等,各大模型的流量持续扩充,用户互动强度与质量双重提升,驱动整体Token消耗指数级上行。

- 国内豆包大模型2025年一季度在国内公有云大模型调用市场占比接近46.4%,活跃度领先业内。
  • 报告进一步强调,随着模型能力提升和多模态、多任务的拓展,Token处理及算力需求大幅增长,未来算力瓶颈正在由纯解码能力向带宽及网络互联能力转移。[page::10,11,12]


---

2.5 国产算力硬件体系:从芯片至系统的全维支撑


  • 报告强调,国产算力企业已进入全方位突破期,不再仅聚焦芯片算力的单点提升,而是在互连技术、超节点架构及大规模系统方案等多维度发力,形成从芯片到集群系统的完整解决方案。

- 2025年世界人工智能大会(WAIC2025)成为国产算力展现综合实力重要舞台。
  • 未来国产算力产品竞争力提升、市场份额扩张值得期待,将伴随着AI大模型的算力需求持续增长迎来高成长机遇。


---

2.6 风险提示



报告明晰四大风险:
  • 生成式AI模型创新不及预期:技术创新不足或停滞将打断技术迭代进程,抑制产业升级。

- AI商业应用落地缓慢:高昂训练推理成本可能难以快速转化为实际商业价值,导致下游客户投放意愿减弱。
  • 算力硬件瓶颈:GPU算力及网络带宽限制若恶化,将拖慢AI模型演进速度,限制算力扩展。

- 贸易摩擦风险:国际贸易紧张导致关税及政策环境突变,可能给出口导向型企业带来不利影响。

报告并未给出风险缓解策略,但明确指出这些风险是产业链投资决策关键考量点。[page::1,13]

---

3. 图表深度解读


  • 图表1(Genie 3性能对比表)

- 展示谷歌DeepMind不同代模型的分辨率、交互领域、控制方式、交互时长及延迟。
- Genie 3支持720p画质、通用场景、实时交互及多分钟交互时长,技术水平明显领先,推动端侧算力需求。
  • 图表2(gpt-oss竞赛编程表现柱状图)

- 不同模型版本的Elo评分,显示带工具辅助版本显著优于无工具版本,gpt-oss-120b工具版表现领先。
  • 图表3(Claude Opus 4.1多维性能对比表)

- 细分测试项目(编码、推理、多语问答、数学竞赛等),Claude Opus 4.1多项指标领先OpenAI和Gemini,体现其在具体专业应用的提升。
  • 图表4(SWE-bench Verified性能曲线)

- GPT-5在不同token消耗下准确率均显著高于OpenAI 03版本,且token用量更少,完美体现报告中节省token同时提升准确率的论断。
  • 图表5-6(定价热图及发布时间线)

- GPT-5相较于先前版本及竞品API定价更优,价格差异极大。
- 模型发布时间线展示全球市场密集迭代,2025年上半年功能多样化显著,包含多模态、超长上下文等新能力。
  • 图表7(全球厂商商业策略对比示意)

- 视觉化总结OpenAI、谷歌/Meta、Anthropic不同资金背景和商业策略,影响算力需求增长动因。
  • 图表8(微软、字节、谷歌Token消耗量柱状图)

- 展示2024年12月至2025年7月三大巨头Token消耗稳步增长,谷歌持续领先,数据强力佐证市场竞争格局。
  • 图表9(Token增加消耗方式思维导图)

- 梳理影响Token量增长的功能、架构和应用层面因素,帮助理解算力需求增长的组成要素。
  • 图表10(Kimi K2损失与Token消耗关系曲线)

- 明确显示大量token消耗对应模型loss显著下降,间接说明性能提升的投入成本。
  • 图表11(Qwen-Image生成图像样本)

- 展示含丰富细节的高质图像,体现国产多模态生成能力。
  • 图表12(国产主流AI模型App周活数据走势)

- 反映国内模型用户活跃度惊人增长,多款产品进入千万周活及百万日活规模。

图表整体强化了文本观点,数据直观反映了算力需求增长背后的全方位驱动因素及产业演进态势。[page::1-12]

---

4. 估值分析



报告核心非具体市值估值模型建构,故无明确DCF、P/E、EV/EBITDA估值,但通过价值判断指出:
  • 算力作为后GPT-5时代“硬通货”,市场需求巨大且持续增长。

- 投资机会主要聚焦海外算力产业链,鉴于技术前沿的竞争态势。
  • 国产算力硬件和系统方案协同突破或将实现增长潜力释放。

- 估值区间隐含于对行业空间与技术演进的研究,逻辑基于算力需求增长推导资本市场看好。

总结来看,报告更注重产业链逻辑和趋势判断,投资者应结合具体赛道环节动态做细化估值。[page::0-13]

---

5. 风险因素评估



报告明确了四大关键风险:
  • 模型创新风险:AI技术演进路径若显著缓慢,将打击预期,导致资本和用户观望。

- 商业落地风险:生成式AI成本高企,若难以实现稳定盈利模式,用户付费动力减弱,影响行业持续投入。
  • 硬件技术迭代风险:算力及通信瓶颈若未突破,将限制模型训练与推理规模,拖慢AI进化速度。

- 贸易摩擦风险:国际形势变数增大,影响相关企业出口业务稳定性。

未见具体风险对冲措施,多为提示性质,投资人需注意变化对产业链的系统性冲击。[page::1,13]

---

6. 审慎视角与细微差别


  • 报告总体较为客观理性,关注模型“降本增效”而非单纯追求极限能力,体现对OpenAI商业运营挑战的认知。

- 明确指出GPT-5更多为“效率优先”更新,技术突破不足,暗示资本约束对创新节奏的限制。
  • 海外厂商不同策略背后隐含资金与资源差异,大厂优势更明显,竞争格局或加剧两极分化。

- 国产算力虽展现多项亮点,但体量与世界巨头仍有差距,估值与投资需结合其持续创新与市场开拓能力审慎判断。
  • Token成本曲线压力及多模态带来的算力需求爆炸,短期可能加剧硬件供应链压力和环保能耗考量。

- 商业模式“免费拉量、付费突围”的模式仍未形成成熟闭环,后续商业供给与用户付费转化仍是焦点。
  • 部分数据因数据源接口及第三方监测限制可能存在观察偏差,投资者应结合更多维度数据验证。[page::3,6,9,10,13]


---

7. 结论性综合



综合全文,报告呈现的核心逻辑及行业判断如下:
  • 自2022年以来,全球生成式AI大模型迭代加速,2025年尤为密集,GPT-5代表新的技术经济周期,推动算力需求进入高增长期。

- GPT-5通过提高token效率、扩大上下文窗口及显著降价策略,不仅使模型更易于广泛应用,更进一步放大对算力的实际需求,构建“降本—扩容—增需”的算力良性增长模式。
  • 伴随谷歌、OpenAI、Anthropic、多家中国厂商在技术及商业模式上的创新,全球算力需求由集中深算力转向包含端侧、多模态、大容量上下文场景的全新结构。

- 数据佐证谷歌以AI Overview产品驱动token消耗爆发,国产模型如Kimi K2、MiniMax、快手、阿里通义千问等在多模态交互及用户活跃度方面展现出强劲成长势头,整体Token消耗呈指数级增长。
  • 国产算力企业不再局限于单芯片性能提升,正从芯片、互连、系统方案等全维度突破,旨在满足未来模型训练与推理的更高需求,是核心投资布局方向。

- 报告明确风险主要集中在技术创新、商业化落地、硬件迭代速度及国际贸易环境,投资者应密切关注相关变量。
  • 最终立场:在后GPT-5时代,算力作为AI产业链核心驱动力,其市场供需均呈现强劲增长态势,是具备长期投资价值的重要板块,海外算力产业链依旧是关注核心,国产算力市场潜力巨大并逐渐释放。

- 报告通过详实的性能评测、多厂商策略对比、Token消耗数据和活跃度分析,构建全面视角,呈现了大模型技术演进驱动下算力产业链的成长机会与核心挑战。

---

以上分析客观剖析了报告各章节的思路逻辑、关键数据与趋势,聚焦算力产业链的投资机遇与风险态势。报告的图表数据强化了文字解读,体现大模型与算力生态的深度联动,符合当前生成式AI行业发展脉络和技术经济规律。[page::0-14]

---

参考图片示例



以下为报告中关键示例图片的Markdown引用格式:(示例)

GPT-5定价对比热图

Qwen-Image生成的图像

---

总结



本报告系统梳理了算力产业链,厘清了当前AI大模型技术创新与算力需求增长的内在逻辑与市场趋势,结合大量数据资料和图表,深刻揭示了后GPT-5时代算力供需的“硬通货”地位,值得产业链投资者重点关注与深入研究,并纳入策略布局范畴。

报告