数据中心连接,迎来质变?

来源:半导体产业纵横发布时间:2026-06-08 17:43
数据中心
AI
生成海报
过去几年,光链路速度取得了令人瞩目的进步,从 100 Gbps 迅速提升至 400 Gbps、800 Gbps,并逐渐发展到 1.6 Tbps。

人工智能正在从根本上改变数据中心内部连接的角色,以至于数据中心内部网络的重要性与计算本身不相上下。数据中心内部后端网络(将人工智能加速器彼此连接并与内存连接以进行工作负载分配)实际上正在成为计算系统的延伸。

那么,我们面临的是数据中心内部网络的革命还是演进?或许两者兼而有之。

人工智能工作负载的革命性激增推动了新技术的发展,但这些技术利用了现有方法,建立在多年来不断创新的基础上。

几十年来,铜缆一直是数据中心内部连接的默认选择。铜缆价格低廉、易于施工,并且在短距离传输中效果良好。但随着数据传输速率的提高和传输距离的增加,铜缆的劣势就显现出来了,信号完整性会因衰减和电磁干扰而下降。

另一方面,光纤能够在更远的距离上传输更高的数据速率,且信号损耗极小,也没有电磁干扰。目前,几乎所有超过约 5 米的 400 Gbps 数据中心连接(即任何超出单个机架的高性能连接)都已过渡到光纤连接。速度更快的 AI 加速器也正在推动机架内部连接转向光纤。最终,AI 工厂数据中心内的所有连接都将采用光纤。

过去几年,光链路速度取得了令人瞩目的进步,从 100 Gbps 迅速提升至 400 Gbps、800 Gbps,并逐渐发展到 1.6 Tbps。然而,要满足人工智能训练和推理的需求,仅仅提高端口速度是不够的。

人工智能重新定义数据中心网络

历史上,数据中心通常采用纵向扩展策略来实现增长:即在机架中添加更大的服务器或更多处理器。然而,现代人工智能挑战了这种模式。大型人工智能模型和分布式训练需要协调数千个处理器/加速器协同工作。这意味着数据中心的建设需要横向扩展,将机架、行和相邻建筑物中的无数节点连接起来,形成一个统一的计算架构,共同处理各项任务。

分布式计算虽然并非新生事物,但这些人工智能架构的规模和性能却是前所未有的。庞大的人工智能训练集群正在构建中,其横向扩展网络能够以个位数微秒的延迟处理每秒太比特级的流量,连接着数千个机架,每个机架都配备数十个GPU。公开的估算表明,大型人工智能集群(基于整个架构的平均光模块数量)每个GPU可能需要三到六个光收发器。这意味着在一个拥有数十万个GPU的数据中心内,需要超过一百万个短距离光收发器来连接服务器和机架顶部叶交换机,以及机架顶部叶交换机和脊交换机。

事实上,LightCounting等行业分析机构预测,未来五年以太网光收发器和共封装光器件的销量将翻一番,其中数据中心内部应用将贡献大部分增长。预计未来几年全球需求量将达到每年数亿件,以支持人工智能集群的大规模部署。

当今的可插拔光学器件:FRO、LRO、LPO

为了支持人工智能光通信的爆炸式增长,创新不仅着眼于更快的连接速度,更关注光模块本身的设计和部署方式。在数据中心内部,能效和密度至关重要。这催生了新型光架构,它们在降低功耗和缩小体积的同时,增强了部署的灵活性。

传统的可插拔光模块采用全时序光模块 (FRO),将信号处理集成在发送和接收路径上。这虽然能提供强大的性能和远距离传输,但代价是功耗和延迟。而新型方案则更加轻量级。线性接收光模块 (LRO) 通过依赖交换机专用集成电路 (ASIC) 中的信号处理来简化接收路径,从而显著降低模块功耗和延迟。更进一步,线性可插拔光模块 (LPO,或线性驱动) 完全移除了可插拔模块中的主动信号处理,在主机支持该模型的前提下,为短距离链路提供极低的功耗和最小的延迟。

重要的是,这三种方法在现代数据中心网络中并存。FRO 继续服务于对传输距离和鲁棒性要求较高的应用,而 LRO 和 LPO 则在高容量、短距离的数据中心内部链路中迅速发展,在这些链路中,效率和密度至关重要。这些方法共同展现了光通信技术的演进路径,在革命性的数据中心网络为人工智能扩展的过程中,它们在性能和功耗之间取得了平衡。

明日光学发展趋势:NPO、CPO、XPO

光模块技术不断革新。2026年初,一个行业联盟推出了一种名为超高密度可插拔光模块(XPO)的新型概念,旨在显著提升光模块前面板的密度,而光模块密度是数据中心内部连接的关键限制因素。XPO模块可提供前所未有的12.8 Tbps带宽,虽然其尺寸大于八脚小型可插拔模块(OSFP),但与现有可插拔解决方案相比,其前面板密度仍可提升约四倍。由于XPO集成了液冷技术,这些模块还能支持功耗更高的相干光模块。

与此同时,业界也在探索更激进的光集成模型。这种转变的核心是一个简单的想法:将光学器件靠近计算或交换器件,可以减少信号损耗和补偿这些损耗所需的功率,同时克服前面板的空间限制。

近封装光学元件(NPO,也称为板载光学元件)将光引擎从前面板移至更靠近开关硅片的位置,从而缩短电气距离并提高效率。这种方法显著降低了功耗并提高了信号质量,但由于光学元件不再易于更换,因此牺牲了灵活性。

共封装光器件 (CPO) 将这一概念进一步发展,直接将光器件集成到交换芯片封装中。通过大幅减少电气互连,CPO 有望实现超低延迟和卓越的能效。同时,它也挑战了人们对可维护性、制造工艺和互操作性的固有认知。

XPO、NPO 和 CPO 共同表明,数据中心内部光学技术的演进不再仅仅是更快的链路,而是从根本上重新设计光学、电子和计算在人工智能时代如何结合在一起。

人工智能时代的数据中心连接正在经历一场革命,无论是在需求还是规模方面;同时也在数十年的光学技术进步的基础上不断发展演进。

本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。

评论
暂无用户评论