人工智能数据中心正接近“铜缆悬崖”

来源:悦智网发布时间:2026-04-25 20:48
材料
技术进展
生成海报
2026年,初创企业将转向采用传输射频和太赫兹频率的塑料线缆。

训练巨型新人工智能模型的速度可归结为两个关键词:纵向扩展与横向扩展。

在数据中心术语中,横向扩展意味着增加可连接在一起并分段处理大型任务的人工智能计算机的数量;而纵向扩展是指在每一台计算机中塞入尽可能多的图形处理单元(GPU),并将其连接起来,使其像单个巨型GPU一样工作,从而加速处理更大规模的计算任务。

这两个维度依赖两种不同的物理连接技术。横向扩展主要依靠光子芯片与光纤,这两者结合可将数据传输数百米至数千米;纵向扩展则大多采用铜缆这一更简单廉价的技术,虽然其传输距离通常不超过一两米,却能构建起密度达约10倍的网络。

然而,打造更强算力的计算机所需的GPU间数据传输速率正不断逼近铜缆的物理极限。数据中心互连初创企业Point2 Technology的产品营销与业务开发副总裁大卫·郭(David Kuo)指出,当对铜缆的带宽需求进入每秒太比特量级时,物理规律要求铜缆必须更短、更粗。考虑到当今机箱内部已极度拥挤,且人工智能硬件领军企业英伟达计划在2027年前将每个系统的最大GPU数量从72个提升至576个(增幅达8倍),这无疑是一项严峻的挑战。

“我们称这个问题为‘铜缆悬崖’。”郭表示。

为了疏通数据中心拥堵,业界正在寻求多种方式,例如延长铜缆的传输距离以及将纤细的长距离光纤部署至更接近GPU的位置。但Point2 Technology公司与另一家初创企业AttoTude提出了一种介于两者之间却又与之截然不同的解决方案。他们表示,该技术既能保持铜缆的低成本与可靠性,又具备近似光纤的细尺寸与传输距离,这种组合将轻松满足未来人工智能系统的需求。

那么,答案是什么?无线电技术。

2026年晚些时候,Point2 Technology公司将开始生产支持每秒1.6太比特传输速率的芯片。该线缆由8条细长的聚合物波导构成,每条波导通过90千兆赫和225千兆赫频段传输,速率达448千兆比特/秒。波导两端配置了可插拔模块,能在电子比特与调制无线电波之间双向转换。AttoTude计划采用的方案本质上与之相同,但使用的是另一种纤薄柔性线缆,频率则达到了太赫兹级别。

图片

两家公司均表示,其技术能在传输距离上轻松超越铜缆,10至20米内信号无显著衰减,该传输距离完全能满足英伟达已公布的纵向扩展计划。Point2 Technology公司的系统功耗仅为光纤的1/3,成本降低2/3,延迟甚至可缩减至原来的1/1000。

支持者指出,无线电技术比光通信更可靠且更易于制造,这意味着在研发低能耗处理器间连接技术并将其延伸至GPU的竞赛中,无线电可能超越光子技术,甚至有望替代印刷电路板上的部分铜缆。

那么,铜缆有什么问题?只要数据传输率不高且距离不远,铜缆就没有缺陷。但面对高数据速率时,铜等导体材料会受困于所谓的“趋肤效应”。

信号快速变化的电流会导致试图对抗电流的磁场发生变化,因此产生趋肤效应。这种对抗力集中在导线的中间部位,导致大部分电流被挤压至导线外缘(即“肤层”)流动,因而增加了电阻。许多国家都采用了60赫兹频率,此时,电流主要分布在铜缆最外层8毫米的范围内。但频率为10千兆赫时,肤层厚度仅为0.65微米。因此要通过铜缆传输高频数据,就需要更粗的线缆,消耗更多的电力,而这两项要求都不利于将越来越多的连接集成到更小的空间,以实现计算规模的提升。

为了抵消趋肤效应及其他信号降级问题,一些企业开发了两端配备专用电子元件的铜缆。其中最具前景的是有源电缆(AEC),其末端芯片称为“重定时器”。接收到来自处理器的数据信号和时钟信号后,这种集成电路会净化信号,随后通过铜缆的8对线缆(或称通道)重新传输(还有另外一套装置负责反向传输)。在另一端,配对芯片会消除传输过程中累积的噪声和时钟偏差,并将数据送达接收处理器。因此,有源电缆可以延长铜缆的传输距离,但代价是电子复杂度和功耗提高了。

为数据中心提供网络硬件的Credo公司的高级副总裁兼产品负责人唐·巴内特森(Don Barnetson)表示,该公司开发的有源电缆能以800千兆比特/秒的速率实现距离7米的传输。随着计算机GPU数量增至500~600个且部署在多个机架中,线缆很有可能需要达到这一传输距离。有源电缆的首个应用场景可能是将独立的GPU连接到构成横向扩展网络的交换机。巴内特森指出,这是横向扩展网络的第一阶段,这一阶段至关重要,因为“这是网络中唯一无可替代的环节”。失去这一链路,哪怕只是瞬间中断,也可能导致整个人工智能训练任务崩溃。

不过,即便重定时器能将“铜缆悬崖”危机暂时推后,物理规律终究也会胜出。Point2 Technology公司与AttoTude公司认为这个转折点即将到来,并为此投下了赌注。

AttoTude公司源于创始人兼首席执行官戴夫·韦尔奇(Dave Welch)对光子技术的深入研究。韦尔奇是2025年被诺基亚收购的光通信设备制造商Infinera的联合创始人,数十年来深耕光子系统开发。他深知这项技术的弱点:功耗过高(英伟达的数据表明,其功耗预算约占数据中心计算总预算的10%),对温度极度敏感,光子芯片的光耦合需要微米级制造精度,并且该技术长期可靠性不足的问题一直为人诟病,甚至衍生出了“链路振荡”这个专门术语。

“客户青睐光纤,但厌恶光学器件。”韦尔奇指出,“电子器件已被证明本身比光学器件更可靠。”

在诺基亚以23亿美元收购Infinera后不久,韦尔奇在筹划新的创业项目时提出了一个根本性的问题:“如果不必局限于(某个光波长),我应该选择哪个频段?”答案是使用纯电子器件时可实现的最高频段——300至3000千兆赫的太赫兹频段。

韦尔奇和团队随即着手打造一个由3个组件构成的系统:与GPU对接的数字模块、太赫兹频率发生器,以及一个用于将数据编码至太赫兹信号的混频器。天线随后将信号导入纤细的柔性波导。

波导的中心由传导太赫兹信号的电介质材料构成,外面包裹着包层。细窄的空心铜管就是它的一个早期版本。韦尔奇指出,第二代线缆采用了直径仅约200微米的纤维材料,系统损耗有望低至每米0.3分贝,这仅仅是一根传输速率为 224千兆比特/秒的典型铜缆所产生损耗的零头。

韦尔奇预测这种波导能实现20米的数据传输距离,这一距离“恰好是数据中心纵向扩展的理想距离”,他表示。

截至目前,AttoTude公司已制造了各个独立组件:数字数据芯片、太赫兹信号发生器、信号混频电路,以及迭代了几代的波导结构。但该公司尚未将这些组件集成至可插拔的统一模块中。尽管如此,韦尔奇表示,该组合方案能提供至少224 千兆比特/秒的传输带宽,而且2025年4月,该初创企业在旧金山光纤通信大会上演示了在970千兆赫进行距离4米的传输。

Point2 Technology公司布局数据中心无线电技术的历史比AttoTude公司更久远。这家初创公司由美满电子、英伟达和三星的前资深员工于9年前联合创立,已获得5500万美元的风险投资,其中最值得注意的是计算机线缆与连接器制造商莫仕的注资。莫仕的支持“至关重要,因为他们是线缆和连接器生态系统的重要参与者”,郭表示。莫仕已表示,不需要改造其现有生产线即可生产Point2 Technology公司的线缆,而且制造线缆和连接器的鸿腾精密科技也与这家初创企业建立了合作关系。对于可能成为Point2 Technology公司客户的大型企业而言,这种支持将是一个重要卖点。

Point2 Technology公司的线缆名为e-Tube,其两端各有一枚硅芯片和一根天线,芯片可将传入的数据转换为调制的毫米波频率,天线则将信号辐射至波导。波导本身采用了塑料芯材加金属包层结构,最外层是金属屏蔽层。传输速率达1.6太比特/秒的有源射频电缆(ARC)由8条e-Tube芯线组成,其直径仅为8.1毫米,体积比同规格有源电缆小一半。

图片

郭指出,采用射频频率操作的优势之一在于,处理芯片可在标准硅晶圆厂制造。Point2 Technology公司与韩国科学技术院的工程师们开展了合作,采用了28纳米互补金属氧化物半导体(CMOS)工艺,但该技术自2010年起就已不再是业界前沿。相关研究成果于2025年发表在了《IEEE固态电路学报》上。

尽管Point2 Technology和Atto-Tude的技术前景诱人,但他们必须突破数据中心行业长期以来对铜缆的依赖。“这个行业从无源铜缆起步。”Credo的巴内特森指出,“他们会竭尽所能延长无源铜缆的使用周期。”

他表示,数据中心计算领域液冷技术的迅速发展正是例证。“人们转向液冷的根本原因是为了维持无源铜缆(的纵向扩展能力)。”巴内特森解释道。要在采用无源铜缆的纵向扩展网络中连接更多GPU,就必须以极高的密度封装GPU,仅仅使用空气冷却达不到所需的冷却效果。郭认为,如通过毫米波ARC电缆连接较分散的GPU阵列来实现同等规模的纵向扩展,将显著缓解散热压力。

与此同时,这两家初创企业也在竞逐可直接连接GPU的技术版本。

最近,英伟达和博通部署了与处理器封装在一起的光收发器,将电子器件与光学元件的间距从几厘米或几米缩短到了几微米。目前,该技术仅限用于连接横向扩展网络的交换机芯片,但行业巨头和类似的初创公司正试图将其应用延伸至GPU。

图片

韦尔奇和郭均表示,他们的公司开发的技术在此类收发器-处理器共封装方案中比光学技术具有显著优势。英伟达与博通分别投入了海量工程研发资源,才使其系统具备可制造性并且足够可靠,能够与昂贵的处理器共处同一封装内。其中的挑战之一是如何以微米级精度将光纤连接至光子芯片的波导。红外激光的波长较短,因此必须与直径仅约10微米的光纤芯精确对准。相比之下,毫米波和太赫兹信号的波长较长,因此不需要太精准便可与波导连接。郭表示,一款演示系统甚至采用了手工连接的方式。

韦尔奇说,可插拔连接将是该技术的首个应用形态,但实现与处理器共封装的无线电收发器才是“真正的目标”。

本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。

评论
暂无用户评论