`

具身智能:AI下一站

创建于 更新于

摘要

本报告系统分析具身智能,尤其是人形机器人产业的当前进展与未来前景,涵盖硬件本体、软件智能体、产业链全景及未来市场规模预测。指出硬件核心包括关节执行器、灵巧手和传感器,软件以“大小脑”模型为中枢,强调软硬件长期解耦趋势。预测中国人形机器人市场空间至2050年可达22.8万亿元,年复合增长率达24.7%[page::0][page::6][page::15][page::16]

速读内容


具身智能定义与人形机器人优势 [page::1]


  • 具身智能由“本体”和“智能体”构成,核心特征为感知、决策与控制,具备与物理环境交互能力。

- 人形机器人是具身智能的最佳载体,因其适配人类社会现有基础设施,覆盖多元复杂应用场景。

人形机器人产业发展历程与竞争态势 [page::2][page::3]



  • 人形机器人经历概念形成期、技术探索期、技术发展期和加速发展期,当前重心转向智能体感知与决策能力提升。

- 竞争主体多元,包括机器人初创公司、跨界车企与消费品牌及AI软硬件供应商。2025年将进入量产元年。

人形机器人产业链结构与市场规模展望 [page::4][page::5][page::6]


| 产业链要素 | 代表厂商及说明 |
|------------|--------------|
| 本体制造 | 特斯拉、优必选、波士顿动力等,侧重硬件如关节执行器和灵巧手 |
| 软件与智能体 | OpenAI、谷歌、科大讯飞等,主攻大模型和控制智能算法 |
| 应用场景 | 制造、采矿、金融、医疗、服务等多元行业场景渗透 |
  • 预测中国市场规模2050年达22.8万亿元,年复合增长率24.7%,涵盖动力、灵巧及导航三大任务场景。

- 不同行业元任务时间占比差异显著,力量型任务渗透较早,灵巧与导航任务仍需技术突破。

硬件产业链核心环节与成本结构 [page::7][page::8][page::9]



  • 人形机器人硬件分为六大部分,核心为动力装置、执行装置(关节执行器、灵巧手)与感知装置(传感器)。

- 以特斯拉Optimus为例,旋转执行器、线性执行器、灵巧手和传感系统分别占机器人成本约15%、37%、9%和14%[page::7]。
  • 传感器覆盖视觉、触觉、听觉等多模态感知,为实现机器人环境交互及自主控制奠定基础。


软硬件算力体系及未来发展方向 [page::9][page::10][page::11]



  • 建议采用云-边-端一体化算力架构,满足数据处理时延及能耗效率需求。

- 软件产业链围绕“大小脑”模型,分层架构为主流,端到端一体化模型也在探索中,机器人“大脑”负责策略规划,“小脑”负责运动控制。

机器人大模型训练与开发平台现状 [page::13][page::14]



  • 机器人大模型训练依赖真机数据、仿真数据、互联网多模态数据。

- 开发平台集成渲染引擎、动力学模型和工作环境,提供仿真基础设施,支持模型快速迭代和验证。

技术发展趋势与产业格局演变展望 [page::15][page::16]


  • 硬件赛道分成熟(规模化降本)、中等难度(技术突破及国产率提升)和高难度(方案未定、需研发示范)三类。

- 软件正由本体厂主导逐步向软硬解耦转型,未来头部模型厂商将掌握行业标准和智能层核心价值,推动“赢者通吃”格局成型。
  • 人形机器人全产业链包含传感器、执行器、控制系统、软件平台和AI基础算法等多环节,多方协同推进产业发展。


产业链关键参与者与市场合作模式 [page::16][page::17]


  • 关键技术和产品由特斯拉、优必选、宇树科技、英伟达、科大讯飞、谷歌、OpenAI等龙头主导。

- 跨界整合是产业常态,包括汽车厂商与AI软硬件巨头联合推动机器人产业升级。
  • 市场正由初创期向商业化规模化迈进,技术进步与成本降低是驱动关键。


深度阅读

中金研究报告之《具身智能:AI下一站》详尽解读分析



---

一、元数据与概览


  • 报告标题:《具身智能:AI下一站》

- 作者:邓学、刘中玉等
  • 发布机构:中金公司研究部

- 发布时间:2025年6月12日
  • 主题:聚焦“具身智能”及其下的人形机器人产业,涵盖技术演进、产业链分析、市场空间预测及风险评估。

- 研究背景:具身智能作为AI发展一个重要分支,涵盖了“本体”与“智能体”双重维度,特别聚焦于人形机器人,通过运控算法、神经网络、大模型技术带动产业快速迭代。市场关注在2022年特斯拉Optimus发布后快速升温。
  • 核心观点与评级

- 人形机器人是具身智能的最佳形态,叠加国家战略与产业政策,未来市场潜力巨大,远期市场规模可达万亿元。
- 硬件层面中国具备产业基础,不是瓶颈,但硬件方案仍在迭代中。
- 软件层面以“大脑”与“小脑”架构为核心,数据是模型迭代瓶颈,软硬件有望长期解耦。
- 风险在于产业化进度及核心技术突破速度。
  • 投资建议:关注核心硬件降本领域及即将技术收敛的赛道,软件领域关注“大小脑”模型发展及优质数据获取方式。[page::0,1]


---

二、逐章节深度解读



1. 概念及市场定义(page 1)


  • 具身智能定义:由“本体”(物理实体)和“智能体”(计算及决策算法)构成,关键特征包括感知、决策、控制与传输四大环节,与智能汽车类似。[page::1]

- 本体形态多样:包括四足、轮式、履带式及人形机器人,智能汽车也可视为具身智能。报告聚焦人形机器人,理由是:
1. 人形机器人可更好适应基于人类尺度的基础设施,场景复用强,想象空间大。
2. 可接触多样复杂场景,获取多维优质数据,助力智能体训练进化。
  • 结论:虽短期应用有限,但长期潜力巨大,产业格局初步形成。[page::1]


2. 发展历程(page 2)


  • 技术演进路径

- <2000年:概念形成期,双足行走但运动平衡及智能极弱。
- 2000-2010年:深度学习引入,运动能力增强。
- 2010-2020年:发展强化学习,运动智能提升。
- 2020年后:大模型技术加速智能体升级,感知决策能力大幅提升。
  • 主线:运动能力(本体)与智能水平(智能体)双重提升,未来两条主线并行。[page::2]

- 产品及技术多元化发展:全球多个厂商连续发布迭代产品,产品性能提升迅速,强调竞品多样化。[page::2]

3. 产业现状(pages 3-4)


  • 主要竞争主体

- 机器人初创公司(例如波士顿动力、宇树科技):专注机器人技术,运动控制算法优势明显。
- 跨界厂商(特斯拉、丰田,小米、美的等):拥有明确应用场景,供应链资源共享,受益规模化。
- AI软硬件厂商(英伟达、科大讯飞等):提供感知、认知相关的算法与算力支持,或投资布局。
  • 产品规格多样性:表格展示了全球20余款人形机器人产品维度(身高、重量、自由度等),显示产业技术快速迭代,产品多样。(图表4)[page::3,4]

- 市场发展节奏
- 2022年特斯拉发原型机,热度攀升。
- 2023年多家品牌推出首款产品,产业活跃。
- 2024年率先探索商用场景,合作汽车制造场景。
- 2025年预计进入量产元年,特斯拉预计工厂部署数千台机器人,远期目标年产百万台。[page::3]

4. 市场空间与渗透预测(pages 4-6)


  • 多场景应用潜力

- 产品适配多任务,拆解为力量型、灵巧型、空间导航型三类元任务。
- 应用领域涵盖工业制造、采矿、医疗、服务、教育、餐饮、养老等多行业。(图表5)
  • 元任务时间占比解析

- 利用2020年中国投入产出表及就业数据,测算各行业劳动时间在不同元任务的分布,突出力量型任务占比高行业如采矿业(力量型22%-27%),服务和餐饮业多偏重服务与关怀任务。
- 以时间占比结合行业工资水平,估算机器人价值。
  • 渗透时点基于技术可用性与经济性分析

- 技术可行性方面,力量型任务当前已具备,灵巧型和导航型需持续技术提升。
- 经济性方面通过比较机器人成本与人工工资预测商业化时点,并依据技术进步预期成本逐年下降。
  • 市场规模预测

- 预计中国市场2050年具备22.8万亿元潜力,2024-2050年CAGR约24.7%。
- 全球若按人口推测,规模更大。
  • 趋势图显示不同元任务市场份额随时间变化:力量型早期占主导,灵巧型与导航型后续迅速增长,体现全产业链多元化成长路径。(图表7)[page::4,5,6]


5. 硬件产业链详解(pages 6-10)


  • 硬件组成六大部分(图表98):

- 动力设备(电池、热管理)
- 执行装置(旋转执行器、线性执行器、灵巧手)
- 传感器(视觉、触觉、力传感器)
- 控制系统(SoC、ECU)
- 结构件(镁铝合金、塑料)
- 其他(线缆、面罩等)
  • 成本拆解(以特斯拉Optimus为例):

- 旋转执行器(15%)、线性执行器(37%)、灵巧手(9%以上)、传感系统(14%)为主要硬件成本。
- 结构件轻量化重要,算力硬件未来重要性提升。
  • 关节执行器

- 决定机器人自由度和运动性能,核心部件为电机和传动装置。
- 负责机体核心动作,约占总硬件成本60%以上。
  • 灵巧手

- 模拟人手操作能力,通用性体现在灵活抓取。
- 占硬件成本约10%,技术仍处于发展初期,路线未定,但市场参与者积极。
  • 传感系统

- 多模态感知神经系统,包括视觉(摄像头等)、听觉(麦克风)、触觉及力觉传感器。
- 重要性提升,远期将增加味觉、嗅觉等多元感知。
- 占硬件成本15%以上。
  • 材料应用

- 轻量高强材料并用,包括镁铝合金、碳纤维、PEEK塑料等,兼顾刚度、轻量、成本和加工难度(图表13)。
  • 算力架构

- 云-边-端协同,满足算力需求、时延、安全与功耗多维权衡。
- 终端侧算力负责实时感知与决策,边缘缓解时延和本地计算负担,云端支持大规模训练与数据分析。
- 算力细分比较详见图表14,传统云计算与协同结构示意见图表15。
  • 硬件投资策略

- 三类赛道划分:成熟类(技术成熟、国产率高,着重降本)、成长类(技术难度中等,国产率偏低,跨越瓶颈)、新兴类(技术难度高,路线未定,需跟随头部厂商研发)。
- 关注点集中在降本空间大与技术快速推进赛道。[page::6-10]

6. 软件技术及产业链(pages 11-16)


  • 软件产业链结构

- 以“大脑”(感知、决策)和“小脑”(运动控制)为核心,依赖数据和软件基础设施支撑。
  • 模型架构

- 主要存在分层架构(大脑与小脑分开训练整合)与端到端一体化架构两大技术路线,行业尚处早期,探索不断。
- 分层架构细节示意图见图表17。
  • 训练数据瓶颈

- 机器人大模型训练依赖海量高质量多样化数据。
- 数据来源为真实机体采集数据、仿真合成数据、大规模跨本体视频及互联网文本图像数据(图表18)。
  • 软件基础设施

- 仿真平台、开发平台及计算能力构成以支持模型开发(图表19)。
  • 借鉴智能驾驶经验

- 端到端模型联合优化能力,减少误差传递,提升数据闭环效率(图表20)。
- 多模态模型赋能增强零样本泛化能力,如行人探测、轨迹规划。
- 世界模型技术提高长尾场景覆盖,降低数据采集风险,虽然仍有仿真与现实差距。
  • 软硬件协作展望

- 短期由机器人本体厂主导紧耦合架构,解决业务落地。
- 远期软硬件解耦,模型算法成为核心竞争力。
- 未来行业有望出现通用大模型龙头,掌握行业标准,实现“赢者通吃”格局。
  • 行业格局

- 软件供应商和模型厂商集中,机器人本体厂主导系统集成。
- 示意图见图表21、22、23展示短中长期产业演进与主要参与者梳理。[page::11-16]

7. 产业链全景与风险点(pages 16-18)


  • 全景图详细展示了从核心零部件供应商、机器人本体厂商到应用端的完整生态链(图表17),呈现技术与产业多维交织。

-
风险因素
- 产业化进度可能滞后。
- 多模态大模型及关键硬件的技术及成本收敛不及预期。
- 数据收集及训练复杂度高,依赖技术攻关和资本投入。
  • 法律合规声明及免责声明明确报告仅供投资参考,不构成具体投资建议。[page::17,18]


---

三、图表深度解读



1. 图表1:具身智能组件


  • 清晰展现人形机器人作为代表具身智能的“本体+智能体”结构。

- 本体侧细化了感知各类传感器(视觉、听觉、力觉、触觉)、决策核心计算单元与控制执行机构。
  • 智能体侧则是多模态感知、决策和运动控制算法,解析感知-决策-控制闭环实现。

- 直观表现智能体与硬件本体的共生关系,[page::1]

2. 图表2:发展历程时间轴


  • 从1973年奠基模型WABOT-1到近年特斯拉、Figure.ai等多家商用产品。

- 能清晰看到技术与商业爆发的分水岭节点,尤其2020年后强化学习与大模型引领智能跃变。[page::2]

3. 图表3:主要竞争主体划分


  • 精细划分三个群体,辅以真实企业logo和产品照片,丰富视觉信息。

- 说明多层次、多维度合作和竞争的产业态势。[page::3]

4. 图表4:主流机器人规格


  • 详细对比了身高、体重、自由度等关键指标。

- 自由度反映其运动复杂度,是重要技术指标。
  • 对横向比较具有参考价值。[page::4]


5. 图表5-6:应用场景与元任务分布


  • 以矩阵形式展现工业、个人、特种等不同任务需求映射。

- 结合时间分布比例,展现各行业元任务复杂度及特征,为市场渗透预测提供数据基础。[page::5]

6. 图表7:需求市场规模预测


  • 条形堆积图形象展示未来三类元任务市场份额动态增长。

- 糅合多因素模型产出,量化市场潜力,利于投资判断。[page::6]

7. 图表9-12:硬件架构与拆解


  • 图表9通过多饼图分解关键硬件模块成本构成,显示执行器及传感器占比大。

- 图表10剖析线性与旋转执行器内部结构,凸显运动自由度与部件复杂性。
  • 图表11展示灵巧手样品,表明产业活跃度与技术差异。

- 图表12传感器应用示意,视觉、听觉、触觉等多模态传感并重,呼应软件多模态需求。[page::7-9]

8. 图表13:材料性能对比


  • 体现在密度、拉强度、比刚度、成本及工艺难度细节,指明材料选用对机器人性能影响。

- 指导材料供应端投资及技术选择。[page::9]

9. 图表14-15:算力架构展示


  • 表格对比云、边、端算力特性,突出三者的组合优势与权衡。

- 另一图展示传统集中式与云-边-端协同的演进,说明支持具身智能的计算层级架构复杂化趋势。[page::10]

10. 图表16-19:软件架构与基础设施


  • 软件层级清晰区分感知、人机交互、决策、控制、自主学习,中心为“大脑+小脑”具身智能大模型。

- 模型训练数据来源从互联网文本到仿真及真机,体现数据重要性。
  • 仿真平台架构图解释技术关键点,为减少训练成本和风险铺路。[page::12-14]


11. 图表20:端到端智能驾驶架构对比


  • 对比独立模型、多任务、端到端三个架构,突出端到端方案的联合优化潜力,具身智能借鉴此经验,提升决策精度与规模效应。[page::14]


12. 图表21-23:产业链、参与者及未来格局


  • 多维度划分软硬件各环节及主要厂商,分析布局和未来格局演变。

- 展示短、中、远期软硬件关系及商业模式变迁路径,指明未来软硬件解耦和模型平台集中趋势。[page::15-16]

---

四、估值分析



报告主要定位于产业技术与趋势全景研究,未涉及经典金融估值模型(如DCF、市盈率等),更多以市场空间测算为核心估值工具:
  • 通过分解元任务、行业就业及工资,利用机器人替代劳动的经济性推估潜在市场空间。

- 采用2024年不变价折算历史及预测数据。
  • 市场规模2050年目标值明晰,CAGR计算展示成长速度,丰富量化依据。[page::5,6]


---

五、风险因素评估


  • 产业化落地进度慢:硬件、软件成熟度不足,导致商业化推进缓慢。

-
大模型迭代速度不足:多模态大模型发展受限于数据及算力资源,可能导致升级缓慢。
  • 硬件降本及技术收敛低于预期:高端传感器、灵巧手等关键部件仍有技术与成本挑战。

-
缓解策略未明确:报告重点指明风险,却未详细说明相应的缓解措施和概率评估,提示需关注 技术突破和市场反馈。[page::1]

---

六、批判性视角与细微差别


  • 报告立足产业发展乐观预期,战略高度明显,可能对部分技术路线和市场规模抱较高信心,短期商业应用受限因素说明有限。

- 技术路径多样且未收敛,但投资建议侧重于核心赛道降本空间,忽略部分边缘创新路径潜力。
  • 软件软硬件解耦论断前瞻性强,但产业实际中解耦难度、商业模式复杂性需持续验证。

- 报告大量依托2020年统计数据,具备一定时效局限,未来更新将影响模型准确度。
  • 市场规模预测高度依赖于劳动力成本替代假设,未充分论述对人工智能伦理、政策、社会接受度等影响。

- 报告整体结构清晰但部分复杂图表解释略显简略,初学者理解需多加推敲。

---

七、结论性综合



中金公司《具身智能:AI下一站》报告立足“人形机器人”作为具身智能最佳载体,从技术演进、产业链构建、市场应用、竞争格局到投资策略作了全面且系统的深度解构。报告强调:
  • 人形机器人融合先进硬件与AI智能体技术,蕴含产业革命潜力,尤其是结合“大脑+小脑”软件架构及“端-边-云”算力配置,机器人将迎来感知、决策和控制能力的快速演进。[page::1,7,12]

- 硬件方面,关节执行器、灵巧手和传感系统是核心成本和技术攻关点,以特斯拉Optimus案例为代表,指导未来国产化和降本路径,材料应用多样,兼顾性能和成本效益。[page::7-9]
  • 软件方面,规模化大模型依赖海量多样优质数据,结合仿真平台持续训练,借鉴智能驾驶端到端及多模态模型经验,期望实现泛化智能,远期实现软硬件解耦,形成以通用大模型为核心的生态系统。[page::12-16]

- 产业应用从力量型到灵巧型及空间导航型,涵盖教育、医疗、制造、服务等多个行业,宏观市场空间可达数万亿元,且增速拉满,体现技术进步与经济替代双因素驱动。[page::5,6]
  • 风险主要包括产业化进程、硬件降本、数据积累等,需重点关注技术突破与市场试点反馈,投资需谨慎。

- 未来竞争将由软硬结合转向以模型算法为核心的软硬解耦模式,头部模型供应商极可能实现行业“赢者通吃”,中国具备产业布局和自主创新基础,市场机遇巨大。[page::15]

整体来看,报告视角深刻,数据详实,结构严谨,既有前瞻性技术剖析,也有宏观产业政策和市场视角,极具参考价值。结合详尽的图表释义与产业链分析,为投资者和行业参与者提供了理解具身智能及人形机器人产业走向的权威指引。

---

备注


  • 图表均为报告中关键论据支撑,建议二次引用时同步保留图例与出处。

- 溯源页码均根据报告原文页码标注,确保后续查证与内容一致。

---

此为中金公司深度产业研究报告的详尽解读,完整剖析了具身智能产业规模、技术、生态格局以及未来趋势,适用于专业投资者及行业决策者进行策略布局。

报告