华为盘古大模型与昇腾AI计算平台,共同构建软硬一体的AI技术体系
创建于 更新于
摘要
本报告聚焦华为盘古大模型与昇腾AI计算平台,深入解析其软硬一体的全栈AI技术体系构建路径,重点介绍大模型架构创新(如分组专家混合架构)与基于CloudMatrix的硬件基础设施协同优化策略,展现华为在AI系统软硬件协同解决方案上的领先优势及潜在风险因素 [page::0]。
速读内容
华为AI发展策略与全栈技术体系构建 [page::0]
- 华为从单纯追赶行业标杆转向软硬协同创新,通过量身定制模型架构提升自研昇腾硬件潜力。
- 全栈体系涵盖软硬件协同架构、算子与软件栈,解决大规模AI模型的系统性瓶颈。
盘古大模型架构创新与系统级优化 [page::0]
- 推出Pangu Pro MoE与Pangu UltraMoE两种路径,分别通过分组专家混合架构和仿真先行设计优化硬件适配和负载均衡。
- 解决稀疏大模型专家负载不均问题,提升训练和推理效率。
CloudMatrix基础设施与硬件优化技术 [page::0]
- 采用统一总线(UB)网络构建分布式高速内存池,降低跨节点通信延迟,提高性能一致性。
- 算子级优化如大规模专家并行(LEP)与AIV-Direct提升硬件承载能力,实现软硬件深度协同。
风险提示 [page::0]
- 大语言模型技术进展可能不达预期。
- 人工智能行业竞争格局不确定。
- 硬件、算法优化效果若不理想,存在风险。
深度阅读
国泰海通证券研究报告深度分析
报告标题与元数据概览
本报告题为《华为盘古大模型与昇腾AI计算平台,共同构建软硬一体的AI技术体系》,由国泰海通证券于2025年8月6日发布,报告撰写者为鲍雁辛、李嘉琪及刘峰,均为国泰海通证券研究所的注册分析师和助理[page::0]。报告的核心主题聚焦于华为在人工智能领域,特别是其自研大语言模型“盘古大模型”及昇腾AI计算平台的软硬件协同创新,探索全栈AI竞争力的建设路径。报告剖析了华为如何通过软硬一体化技术体系创新,包括模型设计、硬件架构、系统优化等,提升AI算力与效率,突破行业瓶颈。
核心观点总结:
- 华为已从简单追赶业内最先进模型转变为基于自研昇腾硬件优化量身定制的模型架构,实现软件与硬件双向协同进化。
- 盘古大模型采用创新架构设计来解决大规模分布式AI计算中的性能瓶颈,尤其针对混合专家模型(Mixture-of-Experts,MoE)的“专家负载不均衡”问题推出了新方案。
- 华为研发了两条大模型创新路径:
1. Pangu Pro MoE的分组专家混合(MoGE)架构。
2. Pangu UltraMoE系统级协同优化设计。
- 新一代AI计算基础设施CloudMatrix及其统一总线(UB)网络,通过构建高速统一寻址的分布式内存池,极大优化跨节点通信延迟,为大规模专家并行架构提供硬件支撑。
- 结合软件算子级优化技术,如PDC分离架构、大规模专家并行(LEP)、AIV-Direct,华为搭建起软硬一体的高效AI技术体系。
- 风险点包括AI技术进度放缓、行业竞争加剧及硬件或算法性能未达预期[page::0]。
章节剖析
1. 引言与背景
报告起点明确指出,华为AI发展已由追求业界最优(SOTA)模型转向因地制宜地设计模型以发挥自研昇腾硬件潜能。此路径强调“软硬协同”,不再单一强调硬件提升或单纯提升算法,而是系统工程层面解决性能瓶颈。此背景强调AI领域的系统集成瓶颈,是华为差异化竞争策略的理论基础[page::0]。
2. 盘古大模型架构创新
报告详细解析大模型技术趋势,即从稠密模型向混合专家(MoE)稀疏模型转变,MoE可显著提升参数规模和理论效率,但“专家负载不均衡”阻碍了训练与推理表现。华为在这一挑战中提出两种创新路径:
- Pangu Pro MoE: 通过“分组专家混合(MoGE)”架构,结构化地解决负载不均衡,提升模型训练与推理效率。
- Pangu UltraMoE: 采用系统级协同优化并结合仿真先行设计,确保模型架构与昇腾硬件的高效匹配,通过训练和推理全流程协同提升硬件利用率。
两种路径分别应对不同技术难点,体现华为对“解决系统性瓶颈”的深入理解及全栈设计思路[page::0]。
3. 昇腾AI计算平台与CloudMatrix基础设施
硬件方面,新一代AI计算平台CloudMatrix尤为关键。其核心为“统一总线(UB)网络”,实现跨节点高速、统一寻址的分布式高速内存池。这显著降低了多节点计算过程中通信延迟的性能差异,是打造大规模专家并行(LEP)架构的硬件基础,为软件层面高度并行化及低延迟提供物理支撑。
报告强调,CloudMatrix为PDC(Prefill-Decode-Caching)分离架构等软件创新提供了底层物理条件。算子级优化措施如LEP和AIV-Direct更是在硬件通信带宽限制下提升计算效率,实现硬件与软件紧密协同,改善大模型推理与训练瓶颈[page::0]。
4. 风险提示
风险部分提到三个主要风险因素:
- 大语言模型技术进展不及预期,可能因为算法或硬件研发挑战。
2. 行业内竞争格局变化带来的不确定性,包括其他云计算及AI厂商的竞品压力。
- 硬件、算法或功能优化不能达到预期效果,影响整体性能提升和市场适应能力。
报告未具体给出缓解方案,但风险描述清晰,显示对行业技术复杂性的清醒认识[page::0]。
图表与视觉内容解读
报告当前节选中仅包含一张二维码图片(见下图),作为国泰海通证券研究所官方微信公众号的订阅引导,目的在于方便投资者订阅获取更多报告服务。该二维码无直接业务含义,不构成技术或数据分析内容[page::1]。

估值分析
此次披露内容中未涉及具体财务数据、估值模型或目标价,报告重点放在技术创新路径及软硬件协同体系建设层面,估值推断可能涵盖在完整报告版本中,但本节选未予展示。
风险因素评估
报告风险点设定较为明确,涉及技术演进、行业竞争和研发效果。三大风险均为华为AI体系能否成功商业化释放的关键障碍。鉴于AI领域技术革新快速且竞争激烈,这些风险合理且具有代表性。但报告中并未明确给出风险发生概率或明确缓解策略,显示一定的保守态度,后续持续跟踪研发进展将是关键。
审慎视角与潜在不足
- 报告充分侧重技术创新与软硬协同进展,体现对华为独特自研优势的积极评价,但少涉及市场环境、用户规模和商业变现的外部因素,评估相对偏重技术层面。
- 风险提示简要,未详细展开对竞品威胁的量化分析,也未涉及宏观政策和产业链上下游风险。
- 报告强调“软硬一体”战略,但未披露相关技术研发投入规模及时间节点,缺少对项目成熟度和商业落地时间的风险评估。
- 此版为节选内容,整体报告完整性和覆盖面受限,需关注后续全文发布。
结论性综合
国泰海通证券的这份报告深入解析华为在AI大模型领域的创新路径,揭示了其基于自研昇腾硬件的软硬协同设计战略。通过Pangu Pro MoE与UltraMoE两条创新线路,以及CloudMatrix统一总线网络基础设施,华为力图破解大模型训练与推理中的“专家负载不均衡”及跨节点通信瓶颈,构建全栈AI技术体系。这种软硬耦合创新在业界具有一定的领先性和差异化优势。
风险提示中涵盖了技术进展、竞争态势及优化实现三大关键不确定性,报告体现了技术创新的同时也注意潜在挑战。虽缺少财政估值,但通过技术细节展示华为向产业领先迈进的坚定步伐。
整体来看,这份报告为投资者和行业观察者提供了华为AI技术战略的清晰技术视角,强调软硬协同作为突破大模型业界瓶颈的关键路径,具有较高的参考价值和指导意义[page::0]。