英伟达下场,首次优化DeepSeek-R1

来源:半导纵横发布时间:2025-02-26 17:53
英伟达
DeepSeek
生成海报
B200性能狂飙25倍,碾压H100。

最近,英伟达开源了首个在Blackwell架构上优化的DeepSeek-R1,实现了推理速度提升25倍,和每token成本降低20倍的惊人成果。同时,DeepSeek连续开源多个英伟达GPU优化项目,共同探索模型性能极限。

当FP4的魔法与Blackwell的强大算力相遇,会碰撞出怎样的火花?答案是:推理性能暴涨25倍,成本狂降20倍!随着DeepSeek-R1本地化部署的爆火,英伟达也亲自下场,开源了首个基于Blackwell架构的优化方案——DeepSeek-R1-FP4。

在新模型的加持下,B200实现了高达21,088 token每秒的的推理吞吐量,相比于H100的844 token每秒,提升了25倍。

与此同时,每token的成本也实现了20倍的降低。

通过在Blackwell架构上应用TensorRT DeepSeek优化,英伟达让具有FP4生产级精度的模型,在MMLU通用智能基准测试中达到了FP8模型性能的99.8%。

目前,英伟达基于FP4优化的DeepSeek-R1检查点现已在Hugging Face上开源。

DeepSeek已帮第一批国企“咸鱼翻身”

DeepSeek正在更加广阔地渗透政务和商业体系中。

一位小型视觉技术公司负责人告诉记者:“目前,我们是本地部署DeepSeek的私有模型,然后向算力服务企业租用GPU资源。”

腾讯云、阿里云、百度智能云、火山引擎等国内头部云服务商均宣布支持DeepSeek模型,提供从模型部署到算力优化的全栈服务。

政务系统也对DeepSeek持开放态度。有报道称,辽宁省12345热线、广东省江门市12345热线等政务服务便民热线相继接入DeepSeek。深圳市龙岗区部署上线了DeepSeek-R1模型,内蒙古呼和浩特、江苏无锡、江西赣州等地也陆续宣布完成政务环境DeepSeek系列大模型部署。

DeepSeek横空出世后,在多领域大展拳脚后,社会对算力的需求明显增长。

中国联通方面向记者表示,春节期间,其旗下联通云和智网科技、微信、百度等科技巨头接入DeepSeek的需求急剧增长,DeepSeek运行和推理,都需要强大的算力支撑。

在中国联通进行混合所有制改革时,腾讯、百度、阿里巴巴在内的多家企业就成为中国联通的战略投资者。其与中国联通的算力合作顺理成章。

目前,距离北京较近的是张家口数据中心集群。中国联通在此建设了怀来大数据产业园智算中心,来承接北京及其他周边地区的算力需求。

该智算中心已建成超过6000架功率机柜,并部署了超过1万台服务器,这是在张家口数据中心集群中拥有最多的客户类型和最广的行业覆盖,还是京津冀地区领先的大型智能化数据中心。在网络布局上,由怀来直达北京,将时延降至2毫秒以内,链路可靠性达到99.99%以上。

在中国,智算中心的建设如火如荼,市场规模增长迅速。

据统计,2023年中国智能算力规模达到239 EFLOPS(每秒浮点运算次数),相比2020年的56.2 EFLOPS有了大幅增长。

预计到2025年,中国算力规模将超过300 EFLOPS,其中智能算力占比将达到35%。但是算力闲置问题曾困扰国内不少智算中心。前述央企智算中心工作人员向记者表示:“我们会提前规划和建设,但是需求一直不太明确。”

DeepSeek通过降低AI应用门槛,让更多企业使用,从而产生算力需求。

在“通州全球发展论坛”上,北京大学集成电路学院院长蔡一茂表示:“随着大模型的快速发展,边缘端算力需求急剧增加。”他表示,开源技术和RISC-V等架构的普及,进一步降低了设计和制造成本,使得更多企业能够参与人工智能硬件和生态的建设。

在DeepSeek横空出世后,参与智算中心建设的企业股价也出现了明显提升。

以润泽科技为例,其作为智能算力基础设施服务商,近年来净利润持续攀升,年复合增长率超60%。兴业证券预测润泽科技2025年归母净利润将达32.07亿元。润泽科技与DeepSeek签订了5年长期协议,机柜上架率承诺不低于80%,保障DeepSeek业务发展的稳定性和持续性。

今日,DeepSeek API开放平台宣布,即日起,北京时间每日00:30至08:30的夜间空闲时段,DeepSeek开放平台推出错峰优惠活动。

在此期间,API调用价格大幅下调:DeepSeek-V3降至原价的50%,DeepSeek-R1更是低至25%。DeepSeek称,鼓励用户充分利用这一时段,享受更经济更流畅的服务体验。

本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。

评论
暂无用户评论