中星微发布AI芯片新架构,实现单芯片运行大模型

来源:半导纵横发布时间:2025-04-30 15:28
芯片制造
AI
生成海报
中星微AI芯片成功运行DeepSeek 16B大模型。

4月30日,中星微宣布其最新一代AI芯片“星光智能五号”在“数字感知芯片技术全国重点实验室”成功运行DeepSeek 16B大模型,成为首款全自主的能够单芯片实现通用语言大模型和视觉大模型同时运行的嵌入式AI芯片。

据介绍,“星光智能五号”通过采用GP-XPU架构,集成高性能的RISC-V CPU、GP-GPU、NPU,以及面向智能感知领域的图像信号处理器(ISP)、视频编解码器(VPU)、加解密处理器(ECU)等多核心模块,通过专用的HCP(异构计算池)任务调度单元和安全内存管理系统,实现多异构内核之间的算力与存储资源的实时调度与动态共享,大幅提升了算力利用效率和数据吞吐率,从而首次实现了在单芯片上部署运行DeepSeek 1.5B、7B、8B、16B等通用大模型及视觉大模型的能力。

在仅约一张名片大小的处理板中,单颗“星光智能五号”既满足复杂场景下的视频实时检测、识别与跟踪需求,又能实现自然语言处理、任务规划、知识管理、自动控制等智能体功能;通过8颗芯片联合部署,能够支持“满血版”671B参数DeepSeek大模型和视觉大模型运行,彻底打破边缘端算力瓶颈。

作为AI芯片领域的全能型选手,“星光智能五号”具备六大核心优势:

  • 高效率:通过算子级MoE架构与HCP实时调度机制,算力利用效率提升约40%,数据吞吐率提升约50%;

  • 低能耗:通过异构计算资源按需分配,该芯片能耗降低至少30%;

  • 低成本:通过“端-边闭环架构”减少云端资源依赖,综合部署成本约为服务器架构同性能部署的1/3;

  • 体积小:嵌入该芯片的处理板最小仅需要约一张名片大小,可满足多种小型化智能设备的空间需求;

  • 强安全性:采用存储器分区安全隔离技术,支持高性能国密算法计算,实现信源级密码保护,具备原生数据安全特性;

  • 高适应性:支持开放生态与主流AI框架,无缝对接千行百业的各种应用场景;在工作环境适应性方面,“星光智能五号”摆脱了云端大算力设备对机房恒温恒湿环境的依赖,可以在各种生产生活现实环境中完成高性能智能化工作。

在落地场景方面,“星光智能五号”基于国产工艺制程,可构建具有“万物识别”能力和自然语言处理能力的“本地化智能体”,为千行百业的智能化升级提供更优解决方案,可广泛应用于国家战略重要领域以及城市感知、智能制造、智慧农业、智能交通等行业,更好服务于数字中国建设和新质生产力发展。

中星微技术CEO张韵东表示,“星光智能五号”将推动端侧、边缘侧智能化升级,大幅减少对云端算力资源的依赖,节省系统建设成本。传统依赖云端的AI推理流程常面临响应延迟大、成本高、受制于网络环境等问题,而该芯片通过本地化算力与内生安全机制,使大模型推理可直接在边端侧内完成闭环,既节省了云端传输与存储成本,同时极大提升了响应速度,可实现毫秒级响应,同时以信源级密码机制保障数据全生命周期安全。

值得一提的是,今年年初DeepSeek爆火出圈之后,中星微技术宣布旗下星光智能系列AI芯片、解决方案全面融合DeepSeek大模型能力。

其中,星光智能芯片搭载专用XPU(多核异构处理器),支持本地化部署DeepSeek-R1大模型和建立知识库。XPU针对DeepSeek进行底层算子优化,在同等算力下功耗降低30%,并提供多种量化基座模型的部署整体方案,满足用户构建本地化应用的性能、成本和能效需求。同时结合SVAC信源级数据安全保护技术,实现边缘和端侧设备智能化应用性能和数据安全的双重提升。

在张韵东看来,AI芯片的未来不仅是算力的竞争,更是与场景、模型深度融合的生态竞争。与DeepSeek的融合是中星微在AI智能芯片研发路径前进的最新一步。”未来,公司将持续投入大模型与芯片协同设计,并拓展至智能驾驶、低空经济、大数据、工业物联网等万亿级市场,为全球客户提供更高效的智能化基础设施。”

本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。

评论
暂无用户评论