近日,全球首个基于人工智能技术的处理器芯片软硬件全自动设计系统“启蒙”正式发布。该系统能实现从芯片硬件到基础软件的全流程自动化设计,意味着实现AI设计芯片,而且其设计在多项关键指标上达到人类专家手工设计水平。相关研究成果近日发布于预印本网站arXiv。
“启蒙”系统由中国科学院计算技术研究所处理器芯片全国重点实验室联合中国科学院软件研究所推出。依托中国科学院计算技术研究所建立的处理器芯片全国重点实验室,是中国科学院批准正式启动建设的首批重点实验室之一,近年来获得了处理器芯片领域首个国家自然科学奖等6项国家级科技奖励;在处理器芯片领域国际顶级会议发表论文的数量长期列居中国第一。
处理器芯片被誉为现代科技的“皇冠明珠”,其设计过程复杂精密、专业门槛极高。传统设计高度依赖经验丰富的专家团队,往往需要数百人参与、耗时数月甚至数年,成本高昂、周期漫长。与此同时,随着人工智能、云计算和边缘计算等新兴技术的发展,市场对专用处理器芯片及其基础软件适配优化的需求正日益增长。然而,我国处理器芯片从业人员数量严重不足,难以满足这一增长的需求。
面对这一挑战,“启蒙”系统依托大模型等先进人工智能技术,可实现CPU的自动设计,并能为芯片自动配置相应的操作系统、转译程序、高性能算子库等基础软件。
“启蒙1号”实物
在CPU自动设计方面,利用“启蒙”系统实现国际首个全自动化设计的CPU芯片“启蒙1号”,5小时内完成32位RISC-V CPU的全部前端设计,性能达到Intel 486水平,规模超过400万个逻辑门,目前已完成流片。其升级版“启蒙2号”为国际首个全自动设计的超标量处理器核,性能达到ARM Cortex A53水平,规模扩大至1700万个逻辑门。
在硬件代码自动生成方面,实现硬件代码自动生成大模型CodeV系列 ,能同时完成Chisel、Verilog语言的代码自动生成与代码片段补全。其中,CodeV-R1在Verilog硬件代码生成领域达到7B量级国际最优水平,在RTLLM Benchmark上超越671B满血版DeepSeek-R1。
在自动编译工具链设计方面,实现国际首个自动跨平台张量程序转译工具QiMeng-Xpiler ,可在不同的处理器芯片如英伟达GPU、寒武纪MLU、AMD MI加速器、Intel DL Boost,和不同编程模型如SIMT、SIMD之间自动程序转译,性能最高达到厂商手工优化算子库的2倍。
在自动高性能库设计方面,提出国际首个基于大模型的高性能矩阵乘代码自动生成框架QiMeng-GEMM和国际首个基于大模型的高性能张量算子指令级自动生成框架QiMeng-TensorOp,在RISC-V CPU上的最高性能分别达到OpenBLAS的211%和251%,在NVIDIA GPU上的最高性能分别达到cuBLAS的115%和124%。
“启蒙1号”和“启蒙2号”的性能对比
值得注意的是,“启蒙”系统的出现有望改变处理器芯片软硬件的设计范式,不仅能显著减少人工参与、提升设计效率、缩短设计周期,更能针对特定应用场景需求实现快速定制化设计,灵活满足日益多样化的芯片设计需求。
自动的电路逻辑设计长期以来都是计算机科学的核心问题之一,现有自动设计方法通常将AI技术作为工具用于优化芯片设计的某个具体步骤。不同于传统自动设计方法,启蒙系统旨在端对端的实现从功能需求到处理器芯片软硬件的全自动设计和适配优化。
启蒙共包含三个层级。底层为处理器芯片领域大模型,中间层构建芯片和软件智能体,实现处理器芯片和基础软件的自动设计,在最上层应用于芯片软硬件设计的各个步骤。
启蒙系统的结构图
处理器芯片大模型需要充分结合领域特点,掌握处理器芯片设计的领域知识,具备软硬件设计的基础能力。
此外,利用处理器芯片大模型构建反馈式推理流程,包括正确性反馈和性能反馈。通过自动功能验证和基于功能正确性反馈的自动修复,确保生成结果的正确性。同时通过自动性能评估和基于性能反馈的自动搜索,对解空间有效裁剪,实现对高性能设计结果的高效搜索。
启蒙系统中的反馈式推理
在处理器芯片大模型的基础上,为自动设计处理器芯片的软硬件,启蒙系统分别构建了芯片生成智能体和基础软件智能体。结合反馈式推理能力,芯片生成智能体自动完成从功能需求到逻辑电路的设计,基础软件智能体自主完成给定基础软件对目标芯片的自动功能适配和性能优化。基于芯片生成智能体和基础软件智能体,针对多样化的实际应用场景,在最上层全自动完成处理器芯片软硬件设计各个步骤。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。