
1月27日,半导体行业相关人士透露,SK海力士将向微软的Maia 200供应HBM3E,且为独家供应。
Maia 200搭载的HBM3E总容量达 216GB,据悉是由 6 颗 36GB 容量的 12 层堆叠HBM3E组成。SK海力士曾于2024年9月宣布启动12层堆叠HBM3E的量产,该产品通过将3GB容量的DRAM芯片进行12层堆叠,最高运行速度可达每秒9.6 Gbps,6颗内存组合后的总带宽为每秒7太字节(TB)。
SK海力士HBM3E得益于先进的 MR-MUF(大规模回流成型底部填充)工艺的集成,其散热性能比其前代产品提高了10%。MR-MUF是SK海力士先进技术的一个关键方面,涉及堆叠半导体芯片并在它们之间注入液体保护材料,以增强散热并确保电路保护。与传统方法相比,这种创新方法显著提高了散热效率。
据微软介绍,Maia 200是一款面向AI模型推理的服务器芯片,具备超高速的推理与数据吞吐能力,采用台积电3 纳米工艺制造,其芯片内晶体管数量超过1400亿个。
芯片内部配置了 272MB SRAM作为临时存储单元,并对内存系统进行了重新设计。SRAM的速度比DRAM更快,且在通电状态下可持续保存数据,支持芯片内部直接进行AI运算,能够减少数据传输瓶颈。微软解释称:“为解决性能瓶颈,我们对内存子系统进行了改进,通过优化与内存直接通信的设备(DMA)及芯片内部网络(NoC)结构,提升了令牌处理速度。”
Maia 200搭载了支持FP4和FP8浮点数运算的张量核心,该核心是专门用于快速处理AI运算所需矩阵计算的硬件单元。以FP4精度计算时,其运算性能可达每秒10 PetaFLOPS;以FP8精度计算时,运算性能为5 PetaFLOPS。
微软强调:“Maia 200还配备了可快速调用大规模AI模型的数据传输引擎,是一款性能超越大型云服务提供商自研芯片的产品,其FP4精度性能是亚马逊第三代 Trainium 芯片的 3 倍,FP8 精度性能优于谷歌第七代张量处理单元(TPU)。” 该公司进一步补充:“Maia 200是微软推出的推理系统中效率最高的一款,相比微软最新一代硬件,其每美元性能提升了30%。” 这款加速器的TDP约为 750 瓦,高于英伟达 RTX Pro 6000 Blackwell 型号的 600 瓦。
Maia 200已在微软美国中部 Azure 数据中心完成部署,微软同时宣布,后续将在亚利桑那州菲尼克斯市的美国西部 3 区数据中心落地该芯片;且随着芯片供货量的增加,更多部署计划也将逐步推进。该芯片还会纳入微软的异构部署体系,与其他多款不同的AI加速器协同运行。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。
