Arm公司的 Eddie Ramirez 在 DAC 举办的“Chiplet 的未来”活动上发表讲话,呼吁业界采用强有力的标准,建立真正的 Chiplet 市场,并警告称,当前的半定制方法可能会限制分解式 SoC 的经济可行性。
“我们在过去五年中取得了长足的进步,”Ramirez说,并指出当今大多数数据中心 SoC 都是基于芯片的,尽管它们是半定制设计,由单个供应商设计所有芯片。
他说:“这种模式很棒,但很难获得正的(总拥有成本,TCO)回报,因为你现在所做的就是增加SoC设计的总成本。你得为多个芯片付费,还要对多个芯片进行认证。”
尽管如此,Arm 还是看到了 Chiplet 复用方面的进展,他说道。一些专注于 IO Chiplet 的公司正在涌现,这使得其他公司可以专注于计算或加速器 Chiplet。
“我们希望整个行业拥有更大的市场,这意味着芯片组将被视为一种产品,通过将其视为一种产品,我们可以主动思考如何将这种产品与行业中的其他芯片组结合起来,”他说。“这才是基于芯片组的设计的经济性和总体拥有成本真正开始变得更有意义的地方。”
Ramirez表示,要让小芯片发挥作用,还需要三件事。
“首先要让软件开发者使用起来更方便,”他说,“我们很多人更关注硬件方面,但最终,如果软件开发者使用起来方便,部署规模就能扩大。”
Arm 在这一领域所做的工作之一是研究如何使其计算子系统与整个 AI 堆栈协同工作,这在基本层面上意味着确保软件与硬件(尤其是基于小芯片的硬件)交互的方式有标准。
“我们也在考虑开发模块化固件的方法,”Ramirez说。
分解式设计增加了固件开发人员的复杂性,而 Arm 正是针对这一问题,在 Kleidi AI 中引入了安全、配置和遥测库。这有助于抽象硬件设计中的一些差异,使开发人员能够使用不同的芯片,而无需深入了解其底层属性。
“今天,你可以下载一个 Llama3 模型,在 PyTorch 上运行它,并在从云实例到 Raspberry Pi 的所有设备上运行它,并在各种硅片上部署相同的应用程序,而无需深入研究细节或为每个 SoC 定制软件,”他说。
整个供应链中的合作伙伴需要以整体的方式合作,以便从不同的设计点实现可重复使用的芯片。Arm 为该供应链制定的正式计划名为“Arm Total Design”。Ramirez 表示,公司很高兴看到 OEM 厂商加入这个生态系统。
“我们开始看到OEM厂商开始为Chiplet这个新领域制定RFI和RFQ规范,这意味着他们不再只是为单个SoC提交一份RFI,而是利用我们正在进行的一些标准工作,为Chiplet本身提交RFI,”Ramirez说道。“这是一个好兆头,我们看到OEM厂商和最终客户对能够交付基于Chiplet的设计充满信心,并且相信未来他们能够真正地使用多供应商解决方案。”
一群 Arm Total Design 生态系统合作伙伴启动了 LeapFrog 项目,该项目旨在创建一个大规模 AI 平台,利用来自多家供应商的芯片,在数据中心领域与英伟达的 GPU 竞争。该项目采用了三星代工厂的尖端节点和 3D 封装技术、韩国 ADTechnology 的计算芯片,以及韩国初创公司 Rebellions的 AI 加速器芯片。
Ramirez说:“拥有专注于不同设计领域的公司意味着我们现在可以真正开始在这些不同领域扩大硅片供应基础,并使初创公司、ASIC 设计公司甚至代工厂能够更轻松地与一些进行基于 chiplet 的设计的大型供应商竞争,但他们都是在内部进行设计。”
这个难题的最后一部分涉及标准,从芯片之间的物理接口的 UCIe 和 UA-Link,到系统标准。
他说:“我们需要建立基本标准,以便消除一些碎片化,真正释放使用小芯片构建大量不同设计点变体的潜力,但我们必须以一种消除碎片化的方式来做到这一点。”
Arm 拥有 70 多个合作伙伴为其 Chiplet 系统架构 (CSA) 规范做出贡献,该规范的第一个版本于 1 月发布。
Ramirez说:“我们正在研究如何部署基于芯片的设计,而不仅仅是将 UCIE 添加到两个芯片中。”
例如,CSA 包含安全和遥测所需接口的标准。它包含针对不同类型的基于 chiplet 的设计的不同配置文件,无论是计算到相干加速器,还是基于 IO hub 的设计。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。