对话阿里孟建熠:做了20多年芯片,终于可以跟x86和Arm最高端产品较量下了

来源:新皮层NewNewThing发布时间:2026-04-22 17:30
芯片设计
AI芯片
生成海报
孟建熠
RISC-V工委会会长、知合计算CEO
平头哥不是阿里芯片布局的全部,之外还有达摩院下面的玄铁。

从2003年和博士导师浙江大学严晓浪共同创办芯片IP设计公司中天微开始算起,孟建熠在芯片领域从业超过20年了。

第一个10年,他经营的中天微和当时几乎所有的中国芯片设计公司一样,IP设计出来了,找不着客户愿意集成和量产,因为当时的市场主流PC芯片由英特尔的x86架构主导,手机芯片由Arm公司的Arm架构主导。「除了『坚持』这一个故事之外,(整个行业)没有别的故事」。

今年3月,完成玄铁C950的开发后,孟建熠终于第一次有了「顶天立地」的感觉——「天」指的是云端芯片,「地」是边缘芯片(注:用于一般消费电子产品比如家电、小型可穿戴设备等产品中的芯片)。「边缘早就搞定了,但高性能的芯片做到跟x86和Arm同样的水平,这在RISC-V领域是第一次。」孟建熠在发布玄铁C950前对记者说。

玄铁C950是一款可以用来构建高端CPU的IP,原生集成了Matrix矩阵运算引擎,可以直接支持千亿参数模型计算,打破「AI计算必须依赖GPU」或者「AI芯片就等于GPU」的行业惯例。

在评价CPU最核心的指标「单位频率性能」上,玄铁C950达到了22分/GHz,远超上一代产品C930的15.2分,逼近x86最高性能CPU的24-25分和Arm最高性能产品的26+分——跑分越高,意味着芯片架构越先进、指令执行效率越高。拿到22分,意味着玄铁C950已经能胜任车载、机器人等端侧千亿参数模型计算,如果堆叠多个C950核,它就能胜任云端数据中心的CPU计算了。在此之前,云端CPU是x86和Arm的天下。

从「除了坚持没有别的故事」到「顶天立地」,转折出现在第二个10年。2016年,中天微开始接到阿里投资,2018年被阿里整体收购,孟建熠随着收购加入阿里达摩院并成立玄铁团队,开始主导以RISC-V为架构的IP开发和生态构建。

对任何开发芯片IP的团队来说,阿里本身就是个生态。

阿里芯片最广为人知的业务是平头哥,其旗下的AI推理芯片含光和训推一体芯片真武PPU系列已经在阿里云的云服务中提供给客户商用。鲜为人知的是,平头哥也是玄铁的「客户」,其多款产品中都用到了玄铁的IP——IP是芯片的上游,一颗芯片通常包含从CPU、图像处理器到存储控制器、通信模块等多个IP。

众多IP中,玄铁主攻CPU,目前已推出16款RISC-V CPU IP。玄铁C950已原生支持Qwen3、DeepSeek V3等千亿参数模型,并已开始探索应用于云服务器。

在阿里外部,玄铁目前服务了超过400家下游芯片和硬件设备厂商,其中「不少」客户已量产,代表产品包括用于多个AI眼镜品牌的全志科技芯片,以及用于机器人运动控制的瑞芯微芯片。

阿里达摩院首席科学家孟建熠

以下为记者与阿里达摩院首席科学家孟建熠的对话,经删减和编辑:

从ChatBot到Agent,CPU也需要重构

记者:这里面(指钉钉AI录音笔)的芯片是你们设计的吗?

孟建熠:这个是恒玄的。现在很多AI眼镜里面有些IP是我们做的,但这个不是。

记者:但你们可以做?

孟建熠:可以做。玄铁这个业务主要就是做IP。

记者:如果钉钉或者千问眼镜要用芯片,只要用玄铁的IP去构建芯片就可以了?

孟建熠:中间还需要芯片公司,IP模式就是我们设计芯片的IP Core,然后由芯片公司去把芯片造出来。我们设计的不是整个SoC,而是其中最有意思的模块——CPU。除了CPU,一个SoC里面还会包含其他模块,比如你有一个摄像头,就要有个读取和分析摄像头的模块,存储也是个模块。这些模块都是死的部件,只有CPU上面会接软件。

记者:你们上个月发布的产品中有个面向云计算的CPU玄铁C950,云计算场景中最近两年最火的是用于AI训练或推理的GPU,你为什么还要做CPU?

孟建熠:过去几年传统的CPU增长并不快,但跟AI结合的这部分CPU增速非常快。去年开始,大家发现AI不再只是用来问问题,而是可以让它去做很多工作,从Chatbot到Agent,就需要CPU了。

记者:Agent的工作为什么需要更多CPU?

孟建熠:原来的Chatbot其实只有一个任务,就是聊天,它没有编排任务的需求,用GPU就行了。但Agent有很多任务要编排,这部分工作更适合CPU做,剩下的计算任务再让GPU去做。CPU是通用计算,GPU是加速特定任务的计算。黄仁勋在GTC大会上也发布了一个叫Vera的CPU,全新架构(注:Vera CPU实为基于Arm架构的定制处理器)。

记者:在面向Agent任务的完整AI芯片解决方案中,CPU跟GPU的占比会变化吗?

孟建熠:CPU是运行任务的,GPU是运行算法或者模型的,两者任务不一样。原来的时候,AI几乎全部任务(注:指聊天)都在GPU上运行,现在变成了好几个任务了,好几个任务中间有时候要给模型输入新数据、有时候要到网上去搜索、或者要查本地数据库。如果这个过程很慢,CPU就要等待,整体效率就会低。所以要让CPU也做得很快,就要新架构的CPU。

另外,GPU是graphic(图像)处理器的一种说法。AI芯片其实早就不是GPU原本的概念,只是还用了GPU的一些技术。很多人可能认为GPU等于AI,当然可以这么说,但GPU更准确的说法是专用加速器。

记者:GPU在AI时代就是AI计算的加速器?

孟建熠:是的。

记者:之前主导CPU市场的老产品,比如英特尔的x86架构或Arm架构,还能支持Agent需要的新任务吗?

孟建熠:能支持,但效率不是很高。除非它也去做升级、做适配,才能更好地支持AI时代Agent范式的计算。

记者:这个产品什么时候立项的?

孟建熠:两年前。

记者:那时候「龙虾」还没火,AI范式也还没从Chatbot进展到Agent吧?

孟建熠:那个时候还没有龙虾,但那个时候我们认为,未来如果要做到AGI,CPU上面的任务一定会成为瓶颈,只是GPU实在太火了,但我们坚信GPU是一定要配CPU干活的。所以我们当时就决定要把CPU做强。

玄铁与平头哥,其实是上下游

记者:阿里被外界熟知的芯片业务主要是平头哥,它旗下也有多个产品系列,包括含光、真武、倚天等,玄铁和平头哥是什么关系?

孟建熠:平头哥全是芯片,没有IP,玄铁全是IP。

我们2018年就开始做AI芯片了,含光是我们第一个NPU,并行地我们开始组队做玄铁,RISC-V架构。两个团队都在2019年发了第一个产品,玄铁是当年7月阿里云上海峰会发的,含光是云栖大会发的。平头哥一开始主要围绕阿里云做定制化芯片,玄铁业务第一天就是要面向全行业,做对外IP授权。

记者:平头哥会用玄铁的IP吗?

孟建熠:阿里别的业务当然都是玄铁的客户,包括平头哥。IP比芯片更基础。

记者:为什么战略上会有这样的布局?

孟建熠:整个RISC-V生态到今天还在发展过程中,当时用IP的方式做是因为这是能让生态最快成长的方式,它让人人都可以用,如果你只做一款芯片,生态成熟度就很慢。

记者:哪个生意更大呢?

孟建熠:从钱的角度来讲,芯片更大。

记者:那你为什么不做那个更大的生意?

孟建熠:大的东西在这个阶段其实是不适合的,就是先有鸡还是先有蛋的问题,你要做个大东西,肯定要有生态。黄仁勋原来做CUDA,也不是为AI做的,他是针对科学计算抽象出来了一套东西,刚好在2012年、2013年AI起来的时候,有人用它去做了AI的算法,结果就他的产品好,所以他才慢慢起来。英伟达真正起来其实是2018年之后。所以,做芯片,生态建立要经历漫长的时间,要等。

记者:还要押对方向?

孟建熠:对,还要押方向,大部分是押错的,因为你怎么能够穿越这么长一个周期呢?

记者:AI刚起来的时候市场很混沌,你不知道哪个终端会爆,但到了现在这个阶段,你是不是有个更清晰的方向可以判断出来了?

孟建熠:即便AI也仍然多条路都在走。当年没有人会为它去做芯片,所以用英伟达就比较好。现在AI真正起来之后,有很多人觉得英伟达芯片不够好,所以很多人在那里干,但没有一个干出自己的生态来。这意味着生态一旦形成,你要再去改它是很难的。所以生态要很早布局,所以阿里布局了这么久。

记者:所以你不觉得现在到了一个可以选择一个场景重点押注的时候?

孟建熠:场景我们也还是在选择的,我们也会有云计算的产品发布,但不是玄铁,玄铁只做IP。

记者:我们的主语是谁?

孟建熠:阿里巴巴。

记者:但通过IP做生态让一个架构成为主流的先例并不多,无论x86还是CUDA,都不是通过IP授权做大生态成功的,而是通过软硬一体化。

孟建熠:它们是这个模式,但这个模式有个问题,它们的芯片只能在某个领域里做事,比如x86就进不了手机。

记者:但只要那个场景够大就可以成功构建生态,车也是如此。

孟建熠:这是一种方式,Arm是另一种方式,它的IP可以用在很小的芯片里,也可以用在数据中心。

记者:玄铁更想走Arm模式?

孟建熠:早期是这样,可能走着走着就要跟Arm不一样。现在我们就跟Arm不一样了。Arm还是在提供标准化的产品,我们提供的是可扩展的能力。Arm是我授权给你,你不能改动我任何一行代码,我们恰恰支持这种定制化,你可以拿我这个东西在上面改。

记者:那你的品牌在终端的存在感会不会不一样?

孟建熠:会相对弱一点,但面对的生态都是一样的。

RISC-V:从边缘到核心,玄铁C950是里程碑

记者:玄铁团队最早来自阿里2018年收购的中天微,你们在中天微阶段的时候是做IP还是芯片?

孟建熠:也做IP,但那个时候不是做RISC-V,而是做一个自主指令架构的IP,自己设计的架构。

记者:为什么要自研指令集,这是当时的常态吗?

孟建熠:每个软件都要基于芯片的指令集开发(注:指令集相当于芯片的词典,芯片执行操作时只听得懂指令集里定义的动作)。最早的时候设计芯片都要自研指令集,后来Arm出现后提供了IP授权模式,芯片厂商就不需要开发了,可以直接买一个授权。

记者:英伟达的GPU也有自研的指令集,这个东西对英伟达建立芯片护城河有多关键?

孟建熠:很关键,如果你不知道它的芯片指令集是什么,你做出来的芯片效率就会差。它是不公开的。

记者:如果这个东西很关键,为什么你们(中天微)在2018年被收购之后,反而放弃了自研,转而用RISC-V的架构和指令集?

孟建熠:我们倒也没有放弃,原来产品还继续维持,而且我们把部分东西贡献到RISC-V里面去了。有些东西原来RISC-V里没有,我们有,我们就把它们贡献到RISC-V里去形成生态。

记者:对于RISC-V,玄铁想要在这个方向探索的目标是什么?

孟建熠:一个目标是探索RISC-V在高性能场景的能力,二是探索RISC-V在新场景,比如AI领域的计算,这是最大目标。所以玄铁的定位,就是在计算架构仍然不断变化的过程中,找到真正面向未来的新架构并据此形成一个生态。

记者:现在探索到了什么阶段?

孟建熠:一来从产品进程的角度,RISC-V已经从一个原来的学术产物变成一个完全可用的产品。现在应该已经有400到500家客户在用玄铁IP了,不少已经量产。第二,从应用领域,原来大家认为RISC-V就只能做低端场景,但我们的嵌入式模块已经可以走向云计算场景了,云计算是所有场景中复杂度和性能要求最高的。

记者:所以玄铁C950算是一个里程碑?

孟建熠:是一个里程碑,也是RISC-V领域非常重要的里程碑。

记者:有多重要?

孟建熠:是我们所有产品里性能最高的,性能高到可以跟x86和Arm的最新产品去比。

记者:从2018年到现在,外界变化很多,AI变化尤其快,你们2018年设定的战略后来有什么变化?

孟建熠:玄铁的定位就是做IP,这个没有动摇过;玄铁一定要往高性能方向走,目标要进数据中心,也没有动摇过;还有,玄铁要往AI的方向走,也没有动摇过。这些方向都没有变化,只是在不断推出新产品。

记者:会有阶段性的侧重点?

孟建熠:阶段性的重点有点不一样。性能就是「高中低」,「低」早就搞定了,玄铁第一步就是做低性能的IP。然后我们很快就做了高性能的玄铁C910,当时是全球最领先的RISC-V处理器,但它还没法跟国外的先进产品比。刚发布的C950是全球最领先的64位处理器,已经能跟x86和Arm在一个水位上。

记者:高中低中的「中」是还没解决的?「中」端市场是指什么?

孟建熠:比如机器人、手机、汽车……大脑什么的很容易,做完了高性能,中端性能就是一个降维的概念,剩下的就是成本问题,技术上没有难点。

记者:国内手机公司为什么要花那么多钱去买Arm的IP,而不是自己去开发,RISC-V已经开源的话?

孟建熠:还是生态,你买了Arm IP之后,它上面积累了很多很多软件和优化过的硬件配套,就叫生态。所以很多游戏在Arm上面跑得很流畅,如果你换了硬件架构,即便你的架构支持安卓,也可能没有开发者给你优化产品。一个游戏公司迭代产品时肯定会针对Arm做优化,但不一定会为你的新平台优化。

记者:x86和CUDA会是你的竞争对手吗?

孟建熠:应用领域不一样。RISC-V在这几个领域都在,但每个领域的情况不一样。

建生态还是要背靠大厂

记者:你在芯片行业20多年,如何总结自己做的事?

孟建熠:我从业这么多年只干了一件事,就是CPU,后面大半生涯在基于RISC-V构建CPU。

记者:你2003年就和导师(浙江大学教授严晓浪)一起创业设计芯片了,那时候的芯片潮是什么背景?

孟建熠:第一拨芯片潮是2000年左右,然后2010年是一个低谷,当时应该说大家都不太想做芯片了。芯片太难做了,大家做不出来,没法量产。

记者:做了那么多年,为什么2010年才难做?

孟建熠:产业化难做,就是芯片设计出来之后,让大家用很难。当时我们做了挺多产品,面向各种各样的消费电子、工业控制之类的。

记者:没有PC和手机?

孟建熠:PC和手机更难,那个年代PC和手机都在高速增长,没办法加入。2001年就是三星诺基亚最火的时候,诺基亚用的是Arm,按一下很慢的,我们2001年就想做手机里的核(CPU),但太难了。生态上x86也不给你机会,除了英特尔和AMD可以做,别人做不了,美国别的公司也不行。

记者:你们当时做的产品想卖给谁呢?

孟建熠:卖给国内的手机芯片公司。

记者:它们不用吗?

孟建熠:它们自己的能力整体也还不行,国内外差距还比较大,然后你市场又是开放的,所以(国产)芯片就很难真正做到量产。

记者:还是说你们只做IP,他们没有办法基于IP做进一步的工作?

孟建熠:他们基于别的IP也做不出来,也是要量产的。展讯也是后来才能慢慢做起来。

记者:除非你IP能做到联发科那种开箱即用的交付程度?

孟建熠:这样当然最好了。

记者:那你们当时为什么没这么做呢?

孟建熠:当时有很多条件,要有投资各种条件,这东西挺复杂。而且联发科2006年才火,在那之前大家都是模模糊糊的,讲不清楚。那个时候对中国整个半导体行业来讲都是一段黑暗的历史。

2018年之后,我们可以清晰地看到,RISC-V肯定要来了,所以一定要做开源的有生态的东西,这是第一个(我们意识到的)。第二,我们一定要往高性能这个方向打。

记者:你们怎么度过那段黑暗的时期呢?

孟建熠:只能说坚持,除了坚持这一个故事之外,没有别的故事。

记者:阿里来投钱给你的时候,你是什么心情?

孟建熠:2016年阿里先第一轮投资了我们。当时阿里有OS,就说这件事情大家一起做,可以做得更好。从我们的角度,你要做生态,就一定要背靠一个大生态、一个有生态能力的公司,阿里是一个生态型的公司。

记者:但阿里不做硬件啊。

孟建熠:对,所以那个时候内部说了很久才要做(硬件),现在平头哥是所有互联网公司里硬件(注:指芯片)做得最好的。

记者:2018年的时候,RISC-V在全球是什么状态?

孟建熠:RISC-V是2010年伯克利大学的一个项目,2015年成立了国际基金会,开始推广。2017年进入中国来推广,2018那个时候还不能说是一个很流行的架构,还是个学术的产物。

记者:当时抛弃自研的C-SKY指令集转RISC-V是个困难的决定吗?

孟建熠:RISC-V是我们的新篇章。那个时候阿里从IoT到云全面发展,我们在这个大背景下开始做RISC-V的research,大幅投入,然后发现这东西还比较新,面临非常大的软件生态壁垒。所以当时想先从小的IP做起,IP是整个芯片里最核心的内容,我们想先把这个东西做好,再去做产品(注:指芯片)。

记者:你当时认为做IP就要做生态,做生态就要仰赖大公司投入资源,那为什么2022年又要创业做知合计算(注:为孟建熠和严晓浪共同创办)?

孟建熠:那是另外一个尝试嘛。知合做的还是玄铁IP的下游,紧密合作的。

记者:那三年里边,你在下游做的体会是什么?

孟建熠:体会就是还是要把生态做好。因为如果生态没做好,在下游做产品还是卖不出去,这是最大的挑战。所以如果阿里和达摩院把这个生态建好,是能帮大家在RISC-V里真正产生价值的基本盘。如果没有这个工作,跳过生态去做市场还是很难。

记者:怎么衡量这个生态现在做得好不好?

孟建熠:比如你用苹果的东西,你就选择了苹果的生态。如果你用华为,就跟苹果是完全不一样的,这就是生态的概念。客户如果选择一个生态,是要在上面投资的。一定要选择了这个生态之后,给他带来了商业价值,他才会去做这个事儿。

他可以从你生态里面获取的东西可能有很多,比如原来你用Arm做是多少成本、多少功耗、性能怎么样。然后你要他用RISC-V做,就得比Arm做得更好,没有这个东西,人家就不会选你。

记者:RISC-V已经建立了它的优势了吗?

孟建熠:成本、能效、功耗啊,以及帮助客户定制化,都已经有优势。Arm在手机侧成功的最重要一点是它比x86功耗低多了,所以大家愿意用它。

记者:在AI时代,Arm也会有x86曾经的困境吗?

孟建熠:Arm就是个标准化产品,人家在上面要再切割一下,再弄一弄,就不行了,它没法定制化。

记者:Arm的专利费是厂商可能抛弃它的理由吗?

孟建熠:专利费不是主要的,最主要的是它能不能定制出更有竞争力的产品。

记者:RISC-V能提供更好的定制化?

孟建熠:用RISC-V做一个芯片,就是把很多个模块搭在一起,用户用不用另当别论,用户可能说我用你三个模块,那就用三个。

记者:AI的终端形态可能有很多,是个长尾市场,很多有潜力的公司可能并不显眼或还未出现,你怎么让你的生态影响到他们?

孟建熠:这个行业你首先要有一拨人尝试,这拨人也没有标准答案。可能弄着弄着,它就起来了,是有时代的历史机遇在里面。

记者:一个标杆性的量产客户有多重要?

孟建熠:非常非常重要。

记者:现在找着了吗?

孟建熠:已经挺多了。有一个芯片公司,比如全志。你现在用到的除了笔记本之外的所有终端设备里面,大部分都有全志的芯片。瑞芯微也是我们客户。

记者:机器人的大脑还是由英伟达的芯片主导?

孟建熠:英伟达在主导,国内也有不少公司在做。

记者:会是你们想做的场景吗?

孟建熠:我们会做IP,芯片公司自己去组装,看他们组装出个多大的。有人认为只要64个t就可以了,有人认为要640t。但是你组装用的基本单元,每一个就是8t。我给你基本单元,你自己组装。

下一代架构,英伟达也还没找着

记者:你怎么看待OpenClaw对终端硬件形态的改变和带给你的新机会?

孟建熠:是我们非常重要的机会。产品重新做了之后,新芯片就有机会进去,如果产品已经很成熟了,你就没办法再改变。OpenClaw只是一个现象,背后是Agent、AGI(Artificial General Intelligence,通用人工智能)或者是未来发展到ASI(Artificial Superintelligence,超级人工智能),在这个发展路径里,今天的整个计算架构都会发生变化,你的芯片也会发生变化。

记者:你认为适合跑AGI的终端硬件应该是什么样的?

孟建熠:处理任务的能力要很强、很快。Mac mini为什么比别人好,就是因为它性能好、内存大、能跑一些本地模型。

记者:你们会做苹果那样的芯片吗?

孟建熠:我们现在不会做,现在的方向还是云端。

记者:之前有市场预判说计算和交互解耦、算力都会上云,终端不再需要那么多算力,你判断不会这样?

孟建熠:其实你看Mac mini的迭代方向,性能还是非常不错的。它就是性能驱动,所以它芯片工艺越来越先进、内存很大。它就是个牛刀,今天龙虾来了,它就很轻松。所以一定还是往高性能做的。

记者:你在这个行业这么多年,经历多个浪潮,从PC到移动再到云、AI,你在这个领域最想追求的目标是什么?

孟建熠:未来的世界毫无疑问要往人工智能这个方向走,我自己的目标还是要去探索,在人工智能这个大背景下,怎么样才能做出更好的计算架构。

RISC-V只是一个开源的基础架构,但是到底做多少个核,CPU里多少、GPU里多少,今天还没有明确。就像通用还是专用,他们吵明白了吗?肯定没有。这也是技术有意思的地方,技术永远在演进,你也不知道哪条路径一定是对的。

记者:你觉得英伟达或者其他更强的芯片公司找到这个更合理的计算架构了吗?

孟建熠:他们有严重的路径依赖。英伟达肯定是按照自己的方式在找,但它成本很高。

记者:你的目标不包括取代或者颠覆CUDA生态吗?

孟建熠:没有,我认为CUDA还会存在很长一段时间,就像Arm也没有瞬间颠覆x86生态。它们是并存逻辑,但Arm找到了x86做不进去的地方,比如手机。我不是说一定要把谁颠覆掉,我认为我一定会找到他们做不了的地方。

本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。

评论
暂无用户评论
icon
最新资讯
更多