智谱正式公布已在生产环境完成验证的新型推理集群组网架构 ZCube。该架构在不新增GPU、不更换服务器、不修改代码的前提下,实现集群推理吞吐提升 15%,首Token响应尾延迟(TTFT P99)下降 40.6%。交换机与光模块硬件成本减少三分之一。这意味着,未来大规模 AI 集群的组网采购中,对高端交换机的需求有望向“更少层级、更大端口密度”演进,对光模块的需求则将向更高速率集中。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。
