智谱发布Infra新成果,不加一块GPU,算力多出15%

来源:半导纵横发布时间:2026-05-21 14:21
算力
技术进展
生成海报

智谱正式公布已在生产环境完成验证的新型推理集群组网架构 ZCube。该架构在不新增GPU、不更换服务器、不修改代码的前提下,实现集群推理吞吐提升 15%,首Token响应尾延迟(TTFT P99)下降 40.6%。交换机与光模块硬件成本减少三分之一。这意味着,未来大规模 AI 集群的组网采购中,对高端交换机的需求有望向“更少层级、更大端口密度”演进,对光模块的需求则将向更高速率集中。

本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。

评论
暂无用户评论