英特尔展示了一款高效异构 AI 系统,这一混合计算基础设施结合了英特尔自家的 Gaudi3 AI 加速器与英伟达的 B200 Tensor Core GPU。
具体而言,在该平台上 B200 负责 AI 模型的预填充而解码部分则由 Gaudi3 负责,相较仅 B200 的同构解决方案在 Llama 开源模型上实现了至高 70% 的同 TCO 性能增益。
据悉,这一混合机架系统采用了英伟达的 ConnectX-7 400GbE NIC、BlueField-3 DPU 和博通的 Tomahawk 5 51.2Tb/s 交换芯片,实现了更大的扩展域。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。