中金 | AI进化论(16):OCS,AI新型网络架构下的创新光学底座
创建于 更新于
摘要
OCS(光路交换机)无需光电转换,具备低时延、低功耗和高兼容性优势,是AI大规模集群和数据中心新型网络架构的关键创新光学底座。谷歌等厂商率先应用,推动行业生态向开放化标准化发展,助力大规模AI集群通信效率显著提升。预计2029年相关市场规模将超16亿美元,产业链机会广阔,但切换速度、成本和替代技术风险依然存在[page::0][page::1][page::9][page::10].
速读内容
OCS技术原理与优势 [page::0][page::2]

- OCS通过直接光信号物理路径重构,实现端到端专用光路连接,无需光电转换。
- 相比传统电交换机,OCS具备时延降低数个数量级,单端口功耗降至1W以下、协议透明及更高系统可靠性。
- 主要技术路径包括MEMS、数字液晶(DLC)和压电陶瓷光束偏转(DLBS),各自优势不同,MEMS应用较广且具良好可扩展性。
- 技术局限在于切换时间较长(几十毫秒到几百毫秒),通道灵活性不足,及高制造成本和插入损耗问题。
OCS关键技术方案对比 [page::3][page::4][page::5]
| 技术方案 | MEMS | DLC | DLBS |
|---------|------|-----|------|
| 相对成本 | 低 | 低 | 高 |
| 端口数量 | 320x320可扩展至千端口 | 300x300 | 576x576 |
| 切换时间 | 几十毫秒 | 几百毫秒 | 几毫秒 |
| 插入损耗 (dB) | ~3 | ~4 | ~2.5 |
| 驱动电压 (V) | ≈100 | ≤10 | ≈10 |
谷歌OCS应用实践与效果 [page::5][page::6][page::7]

- Apollo项目中,谷歌用OCS替代核心层/spine电交换机,连接不同代际及速率的交换模块,提升网络吞吐30%,功耗降低40%,资本开支下降30%。

- TPU v4及后续,OCS构建3D环面网络,支持4096—9216芯片大规模AI集群跨cube高效通信,动力消耗显著降低且具故障自愈能力。
OCS产业发展及市场空间 [page::9][page::10]

- OCP成立OCS子项目,推动开放标准,行业厂商广泛参与,生态持续发展。
- Lumentum、Coherent等企业已实现OCS初期收入,预期2026年收入快速增长,利润率优于公司平均。

- 预计2029年OCS市场规模将超16亿美元,受益于AI集群通信需求提升与超节点组网的推广。
产业链核心部件及风险提示 [page::11][page::12]

- 关键部件包括MEMS芯片、光环形器、滤光片、波分复用器、光纤阵列等,多个环节有望快速扩容。
- 风险点主要是技术发展不达预期、成本和切换速度难突破,以及其他交换技术如CPO的竞争压力。
深度阅读
中金 | AI进化论(16):OCS,AI新型网络架构下的创新光学底座——深度分析报告解构
---
一、元数据与报告概览
- 报告标题:《AI进化论(16):OCS,AI新型网络架构下的创新光学底座》
- 作者:郑欣怡、李诗雯等,中金公司研究员团队
- 发布机构:中金公司,中金点睛平台
- 发布时间:2025年9月2日
- 主题:针对OCS(Optical Circuit Switch,光路交换机)技术及产业,尤其聚焦其在AI大规模集群及数据中心网络中的应用和市场前景,提供技术剖析、行业趋势和产业链分析。
报告核心论点:
- OCS技术作为新兴全光交换设备,具有低功耗、低时延、高兼容性等特质,逐渐成为数据中心和AI计算集群网络架构创新的重要基石。
- 谷歌等头部云厂商率先将OCS技术引入其数据中心和超级计算集群,实现网络效能提升、功耗降低和成本优化。
- OCS产业步入产业化早期阶段,多技术路线并行,产业链开始形成,部分厂商已开始产生初期营收,预计未来几年市场规模将突破10亿美元。
- 产业风险主要来自技术成熟度不足、替代技术竞争(如CPO)等方面。
---
二、逐节深度解读
2.1 OCS技术原理与优势(第0-2页)
- 关键论点:
- OCS通过物理层直接建立输入/输出端口的专用光路,实现光信号的“直接光交换”,中间无需光电转换过程。
- 相较传统电交换机,OCS实现了低时延(数十纳秒vs.数百微秒)、低功耗(<1W vs. >10W单端口)、协议透明性和设备跨代兼容,提升了网络效率和可靠性。
- 技术局限包括:较长切换时间(几十毫秒)、通道资源利用率不高(因不能复用传输通道)、高初期成本和插入损耗增加。
- 支撑逻辑与依据:
- 心脏技术为3D MEMS微镜阵列,通过机械反射实现光路切换。
- 参考学术文献及谷歌等大厂报告证明时延和功耗优势。
- 由于机械偏转切换速度限制,OCS难以满足高并发随机通信需求,因此专注于周期性、可预测流量场景。
2.2 OCS技术路线及代表厂商(第3-5页)
- 三大主流技术方案:
- MEMS(微机电系统):当前最成熟,代表厂商谷歌、Lumentum、华为。核心是微镜阵列反射控制光路,支持超大规模端口(320x320至千端口级)。欠缺快速切换且机械封装复杂。
- 数字液晶DLC:基于电光效应调制液晶分子偏转,切换时间更长(几百毫秒),适合冗余备份等切换频率低场景。代表厂商Coherent。
- 压电陶瓷驱动光束偏转DLBS:通过压电驱动精准调节光纤准直器位置,切换时延优于MEMS(几毫秒),可扩端口多,但系统复杂度和成本较高。代表厂商HUBER+SUHNER(Polatis浩信)。
- 技术方案对比表(图表5):
| 项目 | MEMS | DLC | DLBS |
|---|---|---|---|
| 相对成本 | 低 | 低 | 高 |
| 端口规模 | ~320x320,未来扩展 | ~300x300 | ~576x576 |
| 切换时间 | 数十毫秒 | 几百毫秒 | 几毫秒 |
| 插入损耗(dB) | ~3 | ~4 | ~2.5 |
| 驱动电压(V) | ~100 | ≤10 | ~10 |
(以上数据说明MEMS方案在端口规模和成本适中方面具优势,DLBS切换快但成本高,DLC可靠但切换慢)
2.3 OCS在数据中心及AI集群中的应用案例(第5-8页)
- 谷歌Apollo项目:
- 用OCS取代数据中心传统网络架构的核心层或spine层电交换机,实现多代汇聚交换机间低成本、高效能连接。
- 成效显著:网络吞吐量提升30%,功耗减少40%,网络宕机时间缩短50倍,资本开支下降30%。
- 图表6和7详细展示了汇聚交换机与OCS连接及网络拓扑结构,为低延迟光路互联提供直观支撑。
- 谷歌TPU v4超级计算集群:
- 64个TPU芯片组成cube,64个cube之间通过48个OCS构建3D Torus物理网络,实现高效跨cube通信。
- 光电混合网络架构:cube内部使用电交换实现低延迟数据包切换,跨cube用OCS实现光路专用连接。
- OCS提升了系统可用性和能效,降低功耗3.5倍,成本仅增加约10%。
- 后续TPU v7 (Ironwood) Superpod延续3D Torus结构,规模升级至9216芯片、144 cube,需更多OCS设备支持。
- 图表8-10用多角度展现了规模、拓扑和部署细节,凸显OCS作为超级计算的“超级主干”角色。
2.4 OCS产业发展阶段与生态(第9-10页)
- 产业生态开放化标准化趋势:
- OCP2025年7月成立OCS子项目,涵盖Google、微软、英伟达、Coherent等行业巨头,推动OCS技术的标准化与协作。
- 厂商投入与商业化初现:
- 谷歌过去5年在OCS领域投入5-10亿美元。
- 华为、曦智科技联手中兴通讯推出基于MEMS的全光交换机。
- Lumentum和Coherent均在2025年2季度实现了OCS初期收入,预计26年收入将加速爬坡,呈现数亿美元规模且超平均利润率。
- 市场空间及预测:
- Cignal AI预测2029年OCS市场规模超过16亿美元。
- Coherent预计OCS市场潜力高达20亿美元。
- LightCounting市场规模预测显示光交换市场正快速成长,但仍处于以太网、InfiniBand等传统交换占主导地位的早期阶段。
2.5 产业链核心部件解析(第11页)
- 产业链关键环节:
- MEMS芯片:光学微镜阵列,三维角度机械偏转核心器件。
- 光环形器:实现单根光纤双向通信,节省链路资源。
- 光纤阵列单元(FAU):微米级排布光纤,实现高效耦合。
- 滤光片/波分复用器(WDM):控制光波长和复用,提高光路利用率。
- 图表14展示谷歌OCS设备内部横截面,直观表现主芯片和光学模块分布,体现结构复杂性及集成精度。
2.6 风险因素(第12页)
- 主要风险包括:
- OCS技术发展不及预期,特别是切换速度、成本等瓶颈未能克服,导致无法真实替代电交换解决方案,产业渗透受阻。
- 替代技术竞争,如基于电子交换架构的CPO(Co-Packaged Optics)等,若发展超预期,可能占据更多市场份额。
- 在风险提示中并无详细缓解措施,反映行业尚处试验与快速演进期,业务与技术均有不确定性。
---
三、图表深度解读
3.1 图表1(第1页)
对比了OCS与传统电交换机的信号路径。OCS路径中光信号直接输入到输出,无光电转换环节;电交换机中光信号需转为电信号处理,再转回光信号输出。此图表支撑了低时延、低功耗、协议透明性的基础理路。
3.2 图表2与3(第3页)
2D和3D MEMS结构示意,展示通过微米级微镜阵列实现光线路径映射。反映2D方案较为简单,3D方案更适合大规模端口扩展。图3的数字液晶示意图说明光线经过液晶调制控制偏折路径,呈现光交换的另一重要技术路线。
3.3 图表4与5(第4页)
压电陶瓷DLBS光交换原理示意,结合驱动电路展现了机械驱动光纤偏转的构造。技术对比表清晰列出三种技术方案的性能差异,揭示设计权衡和市场选择逻辑。
3.4 图表6-7(第6页)
Apollo项目光纤连接示意及网络拓扑,直观表达了通过OCS实现多速率汇聚交换机之间光路重构,支持动态逻辑拓扑构建。
3.5 图表8-10(第7-8页)
描述谷歌TPU集群规模及光电混合连接架构,图示高维空间cube的物理连接及光纤链路分布。特别是图10展现了Ironwood TPU v7 Superpod的具体硬件结构和3D Torus网络设计,体现OCS在复杂超级计算网络中核心地位。
3.6 图表11(第9页)
Cignal AI关于不同技术厂商在不同应用场景的优劣表现对比,展示了MEMS由谷歌等部署、数字液晶Coherent成熟、机器人技术HUBER+SUHNER优势明显等产业格局。
3.7 图表12-13(第10页)
LightCounting的整体云数据中心交换机市场细分和历史/预测销售额图。可见OCS市场虽目前规模较小(百万美元量级),但预测增长迅速,至2030年超过10亿美元级别。
3.8 图表14(第11页)
谷歌OCS设备内部横截面照片,显示关键光学模块布置,特别标注微镜阵列、光纤准直器和850nm激光二极管光源等,揭露了OCS设备的复杂结构及技术含量。
---
四、估值分析
报告未直接提供具体估值模型及目标价,但通过产业规模预测和厂商营收增长预期暗示OCS领域的市场空间有望达到数十亿美元,对相应企业未来收入增长和利润贡献形成正面驱动力。尤其Lumentum和Coherent提及以数亿美元计的OCS收入预期及高于平均水平的利润率,说明市场重视盈利能力的提升。产业前景明显,投资潜力可期。
---
五、风险因素评估
- 技术风险:OCS切换延时、插入损耗,制造工艺复杂导致成本和质量控制挑战。
- 市场风险:客户采纳率受限,是否能从谷歌主导逐步扩散至更多云服务商和数据中心。
- 替代风险:CPO等基于电子架构光互联新技术,如快速成熟将分流部分市场。
- 风险未见具体缓解对策,投资者需密切关注技术革新和市场接受度的变化。
---
六、批判性视角与细微差别
- 报告高度正面看待谷歌等超级客户布局OCS,有一定引领和未来预判的积极倾向。对此类大型项目投资较重,短期商业化仍存在不确定性。
- 技术选择侧重MEMS方案,数字液晶及压电陶瓷技术提及较少,未深入探讨它们的替代可能性及未来竞争格局变动。
- 报告假设OCS是“AI新型网络架构的创新底座”,在创新性方面视角较为单一,缺少对与传统电交换机、未来CPO等技术的多元、动态对比和风险深入分析。
- 与会计或财务预测无关,未涉及估值敏感性分析和财务风险。
---
七、结论性综合
该报告系统论述了光路交换机(OCS)作为新兴光网络交换技术的原理、优势及技术路线,重点关注其通过省却光电转换,实现低时延、低功耗、跨代兼容等性能突破,尤其适合数据中心核心层及AI大规模集群的稳定高效互联。
谷歌利用OCS技术改造Jupiter数据中心网络架构中的核心层及其TPU v4/TPU v7超级计算集群,实现了显著的性能和能效提升,彰显OCS作为AI计算基础设施的关键创新地位。其它诸如华为、曦智科技、中兴通讯等企业亦在快速跟进,推动全光交换方案的产业化。
三大技术路线(MEMS、数字液晶、压电陶瓷)各有优劣,MEMS因成熟度和扩展性领先,并已率先应用于商业化系统中。产业链包括MEMS芯片、光环形器、光纤阵列、波分复用等多技术环节,系统集成复杂。
市场方面,2025-2029年OCS市场规模有望从数百万美元快速增长至超16亿美元,Coherent等厂商业绩预示良好收入爆发点即将到来,行业生态趋向开放与标准化。
风险主要为技术成熟度、成本和替代技术威胁。报告立场积极,展望OCS技术在AI集群和数据中心网络的渗透潜力,建议投资者关注行业趋势和主要厂商动态。
---
溯源:综合引用全文内容,详见页码标注 [page::0,1,2,3,4,5,6,7,8,9,10,11,12]
---
附图示例展示
- OCS直接光交换示意图
- 谷歌OCS内部横截面

- TPU v4 cube结构示意
- OCS产业规模预测
