据称英伟达正在为中国市场准备新的B20计算卡

来源:半导纵横发布时间:2024-07-23 09:58
英伟达
生成海报
知情人士称,英伟达正在为中国市场开发一块基于最新Blackwell架构的计算卡。

根据报道,三位知情人士称,英伟达正在为中国市场开发一块基于最新Blackwell架构的旗舰计算卡,其暂定名为B20,这款计算卡符合当前美国的出口管制要求。

不过,相当重要的规格细节方面,消息人士并没有透露。至于价格和发售日期方面自然也是没有的。

如果算上正在开发的B20在内,自从2023年加强出口管制以来,英伟达已经发布了三款特供中国市场的显卡。剩下的两款分别是RTX 4090 D游戏卡和H20计算卡。

RTX 4090 D搭载了AD102-250 GPU,CUDA核心、Tensor核心和RT核心的数量都有所削减,整卡频率也降至425W。不过显存和售价倒是没变。根据我们的评测,RTX 4090 D的核心规模削减了11%,但性能只降低了5-6%。

至于H20方面,这张卡相比最高配置的H100 SXM5(132组SM),它的内核数量减少了41%,只配备了78组SM,同时显存带宽也被削弱了。在OpenCL基准测试中,H20比起H100 SXM5下降了28%。

虽然还不知道B20的真正规格,但我们可以通过它的原型,在GTC 2024上发布的B200来估计:B200采用了台积电改进的4NP定制工艺制造,整合了两个独立制造的die。它共拥有160组SM,对应20480个核心,并搭配了192GB的HBM3E,提供了高达8TB/s的带宽,功耗可达700W。

H20面临禁售?

为了能将GPU卖给中国市场,英伟达一直在魔改各种特供版,但是每每遭遇美国政府加码,随时都会被再次禁售,H20又要面临同样的命运。

H20只配备了78组SM单元,相当于H100 SXM版本的六成、PCIe 5.0版本的接近七成,而显存为96GB HBM3,只有H100 144GB的三分之二,内存带宽砍半到4TB/s,NVNlink互连带宽为900GB/s,功耗为400W。

它的算力性能也被阉割得一塌糊涂:INT8/FP8 296TFlops,BF16/FP16 48TFlops,TF32 74TFlops,FP32 44TFlops,FP64 1TFlops。

尽管如此,由于国产AI GPU芯片性能还不到位,供应更是严重不足,H20依然销量极好,百度、阿里、腾讯、字节跳动等巨头都在大量采购。

有预测认为,英伟达这个财年有望交付100万颗H20芯片,单价1.2-1.3万美元,销售总额超过120亿美元,约合870亿元人民币。

这自然引发了美国方面的精绝,有报告认为等到10月份美国政府再次审查半导体出口政策的时候,有很大概率会收紧H20的销售。

可能会直接完全禁售,可能会再次阉割性能,可能会精简内存……现在还说不准。

本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。

评论
暂无用户评论