生成式AI和各种大模型应用,除了对算力有更高的要求外,对存储也提出了更大的挑战。从架构的角度来说,处理器和加速器之间需要更快的主机连接、更多的内存以及更加连贯的接口。而这需要PCIe Gen6和LPDDR5X和CXL 3.1这些架构的支持。
日前,AMD宣布,推出第二代 Versal Premium 系列,这款自适应 SoC 平台旨在面向各种工作负载提供最高水平系统加速。根据AMD的说法,第二代AMD Versal Premium系列主要有三个领域的创新:加速主机连接、能够释放更多的内存和加强数据安全。
AMD自适应和嵌入式计算事业部( AECG ) 高级产品线经理 Mike Rather 表示:“我们看到有越来越多的数据、越来越大的带宽,还有更高的效率以及不断演进的安全威胁。尽管这些并不是新的趋势,它们在行业里已经存在了几十年,但是由于现在AI的迅速发展和重度使用,使得这些趋势变得越来越重要。”
加速主机连接
连接CXL的内存预计从2024年到2029年会有212% 的年复合增长率。不难看出,今后几年里将有越来越多的服务器会实现CXL的支持和赋能。
第二代 AMD Versal Premium 器件支持业界最快的主机接口 CXL 3.1 和 PCIe Gen 6,可达64Gb/s的速率,实现了行业领先的高带宽主机 CPU 到加速器连接。与支持 PCIe Gen4 或 Gen5 的 FPGA 相比,PCIe Gen6 能提供了 2 至 4 倍的线速率,而运行 PCIe Gen 6 的 CXL 3.1 在类似时延下则能提供使用 CXL 2.1 器件的双倍带宽,以及增强的架构和一致性功能。
此外,通过将第二代 Versal Premium 系列与 AMD EPYC CPU 配对,系统架构师能够利用经 CXL 或 PCIe 连接到高性能 CPU 的最新 AMD FPGA 的器件,以加速数据密集型应用并满足快速的数据增长需求。CXL 还能提供内存一致性的额外益处,有助于实现真正的异构加速计算。
提高存储器带宽及利用率
随着人工智能方面的应用也使得数据的数量越来越多,更快速的释放更多内存显得尤为重要。当前,DDR5已经成为行业最为广泛采用的主流趋势,从今年开始到今后几年的时间里,也会成为市场DRAM类型的主流。
AMD第二代 Versal Premium在DDR5(最高速6400 Mb/s)和LPDDR5(最高速8533 Mb/s)上支持的数据的速率是第一代产品支持的DDR4和LPDDR4的2倍。而且DDR5和LPDDR5相比DDR4和LPDDR4,消耗的功率是有20%到30%的下降。
与 CXL 存储器扩展模块进行连接还可使总带宽较之单独使用 LPDDR5X 存储器高出至多 2.7 倍。此外,第二代 Versal Premium 系列允许为多个加速器实现可扩展的内存池和扩展,进而优化存储器利用率并增加带宽和容量。
通过为多个器件动态分配内存池,第二代 Versal Premium 系列自适应 SoC 旨在提高多头单逻辑器件( MH-SLD )的存储器利用率,使其无需架构或交换机即可运行,同时支持至多两个 CXL 主机。
第二代 Versal Premium 系列也将成为 FPGA 行业首款在硬 IP 中采用 Compute Express Link ( CXL )3.11 与 PCIe Gen6 并支持 LPDDR5 存储器的器件。
加强数据安全
在不断变化的安全形势下,增强数据安全性正变得日益重要。
增强数据安全性方面,AMD在PCIe连接方面增加了PCIe完整性和数据加密,也叫做IDE;增加了硬内联ECC和加密用于DDR存储器;另外还保留了第一代的Versal产品里就引入的400G高速加密引擎确保网络安全性。
增强的安全功能有助于第二代 Versal Premium 系列在传输和静态状态下均可快速、安全地传输数据。而这也是业界首款在硬 IP 中提供集成 PCIe 完整性和数据加密( IDE )支持的 FPGA 器件。硬核 DDR 内存控制器内置的内联加密可助力保护静态数据,而 400G 高速加密引擎则能帮助器件以至高 2 倍的线速率保护用户数据,从而实现更快速的安全数据事务。
据了解,第二代 AMD Versal Premium 系列开发工具预计将于 2025 年下半年提供,随后于 2026 年初提供芯片样片。预计将于 2026 年中开始量产出货。
总体来说,第二代AMD Versal Premium 通过更好地来管理系统的内存来助力计算,而这方面正是现在人工智能模型以及各种数据集成最需要的。在功耗方面第二代 Versal Premium 也有所优化,有些块以2倍的速度来运行,消耗的功耗却比之前要低。之所以能达到如此程度的提升,除了得益于架构的升级,第一代产品采用了7nm制程,而第二代产品采用的是6nm制程,也在于AMD Versal系列的产品总是能够非常精准地去针对一些关键的应用,来确保能够有最合适的关于算力、I/O以及内存的组合,实现最高的性价比。
此内容为平台原创,著作权归平台所有。未经允许不得转载,如需转载请联系平台。