摩尔线程实现对DeepSeek蒸馏模型推理服务部署

来源：半导纵横发布时间：2025-02-04 16:20

技术进展

生成海报

摩尔线程宣布，目前实现了对 DeepSeek 蒸馏模型推理服务部署。通过 DeepSeek 提供的蒸馏模型，能够将大规模模型的能力迁移至更小、更高效的版本，在国产 GPU 上实现高性能推理。

开源框架适配：基于 Ollama 开源框架，摩尔线程完成 DeepSeek-R1-Distill-Qwen-7B 蒸馏模型的部署，并在多种中文任务中展现了优异的性能，验证摩尔线程自研全功能 GPU 的通用性与 CUDA 兼容性。

自研引擎加速：通过摩尔线程自主研发的高性能推理引擎，结合软硬件协同优化技术，通过定制化的算子加速和内存管理，显著提升了模型的计算效率和资源利用率。这一引擎不仅支持 DeepSeek 蒸馏模型的高效运行，还为未来更多大规模模型的部署提供了技术保障。

另外，用户也可以基于 MTT S80 和 MTT S4000 进行 DeepSeek-R1 蒸馏模型的推理部署，此前已有用户在 MTT S80 上手动完成实践。

本文转自媒体报道或网络平台，系作者个人立场或观点。我方转载仅为分享，不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益，请及时联系客服，我们作为中立的平台服务者将及时更正、删除或依法处理。

暂无用户评论

联系电话:

010-61853490

新闻投稿:

server@icviews.cn

商务合作:

business@icviews.cn

问题反馈:

19800315212（微信同号）

半导体产业纵横公众号

半导纵横公众号

半导纵横小程序