像 AMD 这样的芯片供应商可能正在缩小与 Nvidia 在 GPU FLOPS、内存带宽和 HBM 容量方面的差距,但如果没有 NVLink 和 NVSwitch 等高速互连和交换机,他们扩展性能的能力仍然有限。
这些技术使 Nvidia 能够构建拥有 72 个 GPU 的机架级系统,而英特尔和 AMD 仍停留在 8 个 GPU 的水平。为了突破这一限制,许多业内人士纷纷支持新兴的 Ultra Accelerator Link (UALink)协议,这是 Nvidia NVLink 的开放替代方案。
但并非所有人都认同新协议的必要性,也并非所有人都愿意等待首款 UALink 硬件的流片。作为 UALink 联盟的创始成员,博通如今认为以太网完全有能力更快地完成这项工作。
博通Tomahawk产品线经理Pete Del Vecchio告诉El Reg : “在网络的各个部分采用相同的技术会带来巨大的好处。在监控、遥测和调试工具方面,使用以太网有很多好处。这就是为什么我们认为UALink不会消失。”
博通目前还没有交出UALink的会员卡。它在谈判桌上仍然有发言权,而德尔·维基奥也不排除未来转用UALink的可能性。但他表示,就目前情况而言,这还不在路线图上。
“我们的立场是,你不需要拥有一些正在开发的规格,也许几年后你就会拥有一款芯片,”德尔维奇奥说。
相反,博通正在推进一项名为“扩展以太网”(Scale-upEthernet,简称SUE)的竞争技术。博通声称,该技术将支持在任何以太网平台上至少拥有1024个加速器的扩展系统。相比之下,英伟达表示其NVLink交换机技术可以支持576个加速器,但迄今为止,我们尚未发现任何超过72个GPU插槽的部署。
Broadcom 为 SUE 推出的头条芯片是新发布的 Tomahawk Ultra,这是一款 51.2 Tbps 交换机 ASIC,经过专门调整,可与传统超级计算机和 HPC 集群中的 Nvidia InfiniBand 以及类似于 Nvidia 的 GB200 NVL72 或 AMD 的 Helios 的机架规模部署中的 NVLink 竞争。
如果你感到好奇,虽然 Tomahawk Ultra 确实共享相同的封装并且与 Broadcom 的 Tomahawk 5(TH5)引脚兼容,但其内部的硅片却完全不同。
该芯片组不仅具有 512 x 100 Gbps 串行器反序列化器 (SerDes) 的相对较大的基数,还专门针对高性能网络进行了调整,据称可提供低至 250 纳秒的延迟,同时每秒推送约 770 亿次 64 字节数据包。
这一点至关重要,因为这些较小的数据包在高性能计算 (HPC) 系统中很常见,并且对于无法支持随之而来的更高消息速率的网络设备来说,可能会造成问题。Tomahawk Ultra 通过实施优化的以太网报头解决了这个问题,即使在处理较小的数据包时也能承载更大的有效载荷。
该芯片还具有全套拥塞控制机制,包括前向纠错和基于信用的流量控制,以减轻数据包丢失,同时保持与现有以太网 NIC 和 DPU 的兼容性。
该交换机还提供对网络内集体的支持,Nvidia 在其 NVLink 交换机中将其称为 SHARP,并允许将 all-reduce 等操作卸载到网络上,这有利于通过减少完成这些操作所需的带宽来提高网络效率。
说到纵向扩展交换机架构,与英伟达第五代 NVLink 交换机相比,Tomahawk Ultra 提供的带宽略高于后者,分别为 51.2 Tbps 和 28.8 Tbps。这意味着,使用与英伟达 72-GPU NVL 系统相同数量的交换机,博通可以支持包含 128 个加速器的纵向扩展架构。
与 UALink 相比,Del Vecchio 声称 Tomahawk Ultra 已经提供了更好的延迟,尽管在第一台硬件实际发货之前很难评估这一说法。
正如 AMD 架构与战略总监兼 UALink 联盟主席 Kutis Bowman 最近告诉我们的姊妹网站The Next Platform那样,该联盟预计交换机延迟将在 100-150 纳秒范围内,如果他们能够实现这一目标,这可能会使该协议在某些应用中占据优势。
话虽如此,我们仍需拭目以待,看看博通最新的芯片在实际应用中与 NVLink 以及最终的 UALink 究竟有何差距。值得庆幸的是,我们不必等待太久。博通表示,Tomahawk Ultra ASIC 已开始向客户发货,而且由于它们与 TH5 引脚兼容,因此重新利用现有的交换机机箱应该相对简单。
当然,UALink 硬件尚未上市并不意味着 AMD 或英特尔无法使用该协议。早在 4 月份,UALink 联盟就发布了其首个规范;而在今年 6 月份的 Advancing AI 大会上,AMD发布了Helios 机架系统,该系统将同时使用 UALink 和以太网作为其扩展架构。
没错,对于其首批机架式系统,AMD 将通过传统以太网交换机传输 UALink 协议,这意味着当其网络合作伙伴仍在将其首款 UALink 硅片推向市场时,AMD 将开始解决 v1.0 规范中任何潜在的问题。
“其他传输协议,例如 UALink 或 Infinity Fabric,也可以通过以太网传输。如果你已经拥有能够实现低延迟、高可靠性的芯片,那么你就可以进行任何你想进行的操作,只需通过以太网即可。”博通首席产品线经理 Robin Grindley 告诉我们。
然而,通过以太网隧道传输 UALink 并非理想之选。最值得注意的是,你根本无法接近 UALink 100-150 纳秒的目标。另一方面,你无法交付你没有的东西,如果 AMD 等到 2027 年才将其 Helios 机架推向市场,它将不得不与 Nvidia 600 千瓦、144 个 GPU 插槽的 Kyber 系统竞争。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。