RISC-V,伏击AI Agent

原创来源:半导体产业纵横发布时间:2026-03-24 17:34
作者:九林
RISC-V
CPU
生成海报
RISC-V正在回答下一代CPU该长什么样?

今日,2026玄铁RISC-V生态大会召开,中电标协RVEI战委会主任倪光南提到:“在物理AI时代,RISC-V拥有模块化、低功耗、定制化、安全性等优势,能更好地满足多样化的算力需求。”

过去两年,整个行业的注意力几乎都被GPU吸走了。

只要谈AI,绕不开的就是H100、B200,仿佛算力只剩下一种形态:大规模并行计算。这不难理解。大模型把计算需求高度集中在训练和推理上,谁能提供更多并行算力,谁就更靠近AI时代的核心舞台。于是,AI几乎被等同于GPU。

相比之下,CPU并没有退场,只是退到了背景里。它依然重要,只是不再是最抢眼的角色。

变化是从Agentic AI开始显现的。前不久,黄仁勋发表署名长文,谈到未来软件形态可能会被智能体重塑;几天之后,英伟达又发布了Vera CPU,并明确把它和Agentic AI放在一起讲。连起来看,这两个动作至少说明了一件事:当AI开始从“生成答案”走向“执行任务”,算力的重心也在悄悄变化。

也正是在这个时间点上,2026玄铁生态大会开了。会场上,达摩院一口气端出了玄铁C950、Flex可扩展平台,以及新一轮生态动作。单看,这是一场RISC-V生态大会;但如果把它放回Agent这条主线里,它讨论的其实是同一个问题:下一代智能系统,到底需要什么样的CPU,什么样的架构。

大模型时代,GPU站在台前;到了Agentic AI时代,CPU的重要性正在重新上升。而比CPU更值得重新估值的,可能是CPU背后的那套架构。

RISC-V,恰好撞上了这个时间点。

01 CPU,收复失地

很多人会疑惑,为什么Agentic AI时代,CPU会重新崛起?因为,Agent不是更长一点的聊天,而是更完整一点的软件。

这一点,已经不只是概念。伯克利的BFCL v4,已经把函数调用、工具调用放到Agent评测的中心;《TheAgentCompany》则把智能体扔进一个模拟软件公司,让它浏览网页、写代码、运行程序和同事协作。结果并不轻松:最强基线Agent自主完成率也只在约四分之一这个量级。换句话说,Agent真正难的,不是把一句话答出来,而是在复杂环境里把一件事做完。

这正是CPU重新变重要的原因。大模型时代,行业追求的是把训练做大、把推理做快,因此GPU天然站在舞台中央;但Agent时代,决定体验的往往不是那段token生成,而是整条执行链:检索、读写、调度、脚本执行、sandbox拉起、数据库访问、状态管理,以及反复重试和结果校验。这些环节并不天然属于GPU的主场。

图片

来源:《A CPU-CENTRIC PERSPECTIVE ON AGENTIC AI》

Georgia Tech与Intel一篇针对Agent系统的最新研究,对Haystack RAG、Toolformer、ChemCrow、LangChain和SWE-Agent五类代表性负载做了系统级剖析,结论是:CPU侧的工具处理,最多可以占到总延迟的90.6%;在大批量场景下,CPU动态能耗最高可占总动态能耗的44%。说到底,GPU决定模型会不会想,CPU决定系统会不会干。

于是,问题也就变了。行业内思考的不只是CPU回来了,还在思考:什么样的CPU架构,最适合Agent?

传统服务器时代,x86的优势几乎没有悬念;手机和PC时代,Arm更占上风。但这是AI Agent时代。Agent不是在旧软件框架上做增强,而是在重写软件本身。它需要的,不是一颗放之四海而皆准的“标准品 CPU”,而是一套能够围绕具体场景快速生长、快速裁剪、快速扩展的底层架构。

这正是RISC-V的本质优势。RISC-V能够迅速回答Agent时代最核心的三个问题:

首先,RISC-V足够灵活。云端智能体、边缘机器人、端侧助手,看上去都叫Agent,但对时延、功耗、吞吐和安全的要求完全不是一回事。Agent负载高度分化,底层架构必须可裁剪。

其次,RISC-V足够开放。AI算法的演进速度是以月为单位的,RISC-V开放的生态意味着,一旦新的算法需求出现,全球的开发者和芯片厂商可以迅速响应,推出定制化的硬件方案,而不必等待某家巨头的排期。这种敏捷性,是封闭架构无法比拟的。

第三,RISC-V天生强调开放互联,更适合做系统整合。Agent不是一个单点功能,而是一整套系统:前面要感知,中间要决策,后面还要调用、执行、校验。很多时候,它不是靠一个计算单元单打独斗,而是CPU、NPU、DSP和各种加速模块一起配合。RISC-V的开放和可扩展,决定了它在这种异构整合上更有空间,也更容易贴着场景去搭底座。

过去很多人看RISC-V,总爱用昨天的尺子:它能不能立刻复制x86?能不能马上对标Arm?能不能一夜之间拥有成熟生态?

AI Agent时代给出的新问题是:谁更适合成为下一代智能软件的底层载体?

在这个问题上,RISC-V反而有一个过去少见的优势:它没有沉重的历史包袱,却有足够大的可塑性;它不是在旧软件时代和x86、Arm拼兼容存量,而是在新软件时代争夺增量。

这就是RISC-V最值得被重估的地方。

正如达摩院首席科学家孟建熠在大会现场所说:“行业需要协同创新、开放、有生态的架构,支撑起未来Agentic AI所带来的新世界。”

02 玄铁C950,越过山脊

这次玄铁生态大会上,最重磅的发布无疑是C950。

图片
图片

RISC-V已走过15个年头,这几年它在MCU、嵌入式、家电、车载、存储等领域快速铺开。RISC-V已正式占据全球处理器市场25%份额。按SHD Group的预测,到2030年全球RISC-V SoC出货量将超过162亿颗。换句话说,RISC-V的问题从来不是不够广,而是还不够高。

真正要从边缘走向主流,RISC-V迟早要打下高性能和AI计算。2024年,RISC-V International批准的25项标准里,超过一半已经与高性能或AI相关,这本身就说明,整个生态都在往这两个方向集体抬升。

图片

达摩院玄铁,正是沿着这两条线一路向上推进的代表。2019年,阿里发布玄铁C910。今天回看,C910最重要的意义,不只是当年的性能数字,而是它第一次让行业相信:RISC-V具备迈向高性能通用计算的可能。后来的如意BOOK甲辰版笔记本,以及法国云服务商Scaleway推出的全球首个RISC-V云实例,底座都选了C910。某种意义上,C910吹响了RISC-V冲击高性能的号角。

服务器芯片,是检验一套架构性能成色最严格的考场。到2025年,达摩院推出C930,性能达到SPECint2006 15/GHz左右,并在今年迭代中提升到约17/GHz,第一次真正跨过了服务器级高性能CPU的门槛。

今年玄铁生态大会上,达摩院把这条线继续推高:新一代旗舰CPU玄铁C950。按大会披露,C950在SPECint2006基准测试中突破70,单核性能超过22/GHz,最高主频达到3.2GHz,成为目前性能最强的RISC-V CPU。

把这个标准放到行业坐标里看,C950已经可以对标X86、Arm最新一代面向云计算和机器学习场景的主力高性能核心。也就是说,C950进入的,已经不是RISC-V内部比较,而是主流高性能CPU的核心战场。

更关键的是,C950不是一颗只会冲分的CPU。在MySQL、Redis、Nginx、OpenSSL这些最典型的服务器工作负载下,C950同样跑出了行业第一梯队的表现。这比跑分更有说服力,因为它说明,C950在数据库、缓存、Web服务、密码运算等真实系统场景中,已经具备了正面竞争力。

玄铁在C950上加入了自研Matrix加速引擎,C950已经能够顺利运行Qwen3最强开源模型和DeepSeek V3“满血版”,输出速度分别达到34 Tokens/s和18 Tokens/s,首Token延迟分别为3.4秒和1.7秒。这也是RISC-V CPU第一次真正跑通千亿参数级模型。再加上C950支持RVA23.1全部标配和可选扩展,进入服务器、AI、汽车等平台,以及Linux、Android等系统环境的门槛也被进一步降低。

因此,C950的出现对RISC-V行业至少有三重意义。

第一,它证明RISC-V开始真正进入高性能和AI计算的腹地。过去大家总说RISC-V“有潜力”,但潜力这件事说久了,很容易变空。C950的价值,在于它将这种潜力转化为可验证的产品能力。它不再只是向前试探,而是已经能够与Arm Neoverse V2、AMD Zen5、Intel GNR这一类主流高性能核心放在一张桌子上讨论。这对于RISC-V而言,不只是信心提升,更意味着技术路线获得了更明确的产业确认。

第二,它给整个RISC-V高性能发展树立了新的标杆。C910让行业看到高性能的可能,C930让RISC-V迈过服务器门槛,而C950则首次把“高性能旗舰产品”真正做了出来。过去两年,RISC-V在高性能方向持续推进,但始终缺少一颗足够有代表性产品。C950的出现,把全球RISC-V高性能的基准整体向上抬升了一档。此后,无论国内还是海外,围绕高性能RISC-V的竞争都很难再绕开这条新基线。

第三,它的前瞻性不只在于性能,而在于它是按AI Agent时代的CPU逻辑做出来的。AI Agent时代所需要的,不只是传统意义上的通用CPU,也不只是单点AI加速器,而是一种既能承载复杂系统负载,又具备原生AI处理能力的新型CPU。C950的重要性,正在于它已经开始回应这一问题:面向未来Agent,CPU应当具备怎样的能力结构。从这个角度看,C950并不只是“今天最强”,更是在向下一代CPU的形态靠近。

放回玄铁自身的路线图中,这条演进线就更清晰了。C925、C930、C950,从12分、17分到22分/GHz,玄铁已经逐步铺开了自己的高性能产品谱系。再加上此前的中低性能产品,玄铁显然要做的,不是一颗孤立的明星芯片,而是一整套覆盖不同场景的RISC-V处理器矩阵。

03 Flex,RISC-V的“外挂”

如果说C950解决的是一个问题:RISC-V能不能做出高性能、能跑AI的旗舰CPU。那么Flex回答的,其实是另一个更关键的问题:就算玄铁做出来了,行业能不能跟着做出来。

这恰恰是RISC-V和x86、Arm最不一样的地方。

在传统架构里,客户买到的往往是一个相对完整的标准答案;但RISC-V的价值,从来不只是“有一颗现成CPU”,而是它允许用户围绕具体场景继续往下做。AI、存储、车载、工业控制,每个行业的负载都不一样,真正能把RISC-V差异化拉开的,也不是通用部分,而是定制能力。

玄铁这次发布Flex,本质上就是把这种定制能力,从“各家自己摸索”变成“官方给一套台阶”。Flex提供了处理器建模、开发环境和软件工具链等整套框架,客户既可以直接选用成熟的玄铁CPU IP,也可以基于Flex做自定义加速,打造更贴近垂直场景的处理器。Vector加速、Matrix加速等AI能力,客户也可自行通过Flex平台来实现。

Vector解决通用向量计算,Matrix往大模型推理再走一步。这样一来,客户不必从零起步,而是在一个已经跑通过模型、已经有工具链和软件栈支撑的平台上继续做专用化。这也是Flex真正像“外挂”的地方。它不是替客户把所有事情做完,而是先把最难的80%做掉。剩下那20%,交给客户结合自己的Know-how去完成。

玄铁这几年的策略其实越来越清楚:自己往上走,去啃高性能和AI这些最难的共性能力;合作伙伴往下沉,去吃具体行业、具体场景、具体产品

2024年,玄铁推动成立无剑联盟;到2025年大会上,无剑联盟又吸纳了西门子EDA、网易有道、普华基础软件、经纬恒润、南瑞瑞腾、Cadence等新成员;2026年,玄铁生态大会又把国芯科技、Canonical、千问、天翼云、SGS等真正拉到一张桌子上。RISC-V生态的落地也在进一步推进,我们在现场了解到南芯RISC-V出货量已经超过1亿颗,未来三年电源品类有望做到10亿美金。

C950是在立标杆,Flex是在搭台子,无剑联盟则是在把台子变成产品。

04 中国开源,会师RISC-V高性能

如果说玄铁C950证明了RISC-V已经开始摸到高性能和AI计算的门槛,那么更值得注意的是,这件事已经不再只是单点突破,而是中国开源力量开始在RISC-V高性能生态上会师。

一端是标准。玄铁已经在RISC-V基金会技术委员会及10多个技术小组担任主席或副主席,持续参与高性能和AI相关标准推进;另一端是底层技术,北京开源芯片研究院披露,其“香山”高性能RISC-V路线已经形成从“南湖”到“昆明湖”的持续演进,并明确朝着服务器级高性能和虚拟化能力推进,未来玄铁也会参与进来;再往下,则是软件和应用生态的补齐,玄铁积极投入OpenRuyi社区,patch贡献排名第一,并与中兴等伙伴在服务器开源组件、存储和编解码优化上持续推进。这意味着,今天的RISC-V已经不只是某一颗芯片、某一家公司的故事,而是在标准、处理器、操作系统、基础软件和行业应用之间,慢慢形成一条完整链路。

过去很多年,RISC-V更像一种开放的可能:灵活、可扩展、可定制,但离主流高性能计算,总像还隔着最后一道门。

Agentic AI的到来,让这件事第一次有了新的判断标准。从这个角度看,2026玄铁生态大会真正重要的,不只是发布了一颗C950,也不只是拿出了Flex和无剑联盟,而是把一件事讲得更具体了:

RISC-V不是赶上了Agentic AI。恰恰相反,Agentic AI正在证明,RISC-V才是更像下一代CPU的那套架构。

此内容为平台原创,著作权归平台所有。未经允许不得转载,如需转载请联系平台。

评论
暂无用户评论