
最开始紧缺的是GPU,随后是内存,而如今紧缺的矛头转向了CPU。受Agentic AI爆发式增长影响,CPU正面临严重短缺。
据半导体行业分析机构Semianalysis Dylan Patel指出,GPU已不再是云厂商的瓶颈,这一角色现已转移至CPU。此前,用于AI的GPU仅执行简单推理任务,随着新模型推出,任务形态发生根本性变化。Agentic AI如今被大量用于数据库调用,以及物理仿真、模拟运算等高度依赖CPU的任务。这些频繁的数据库访问与CPU密集型运算,导致云数据中心CPU使用率急剧飙升。
尽管GPU在AI云端服务器中仍占据主导地位(例如单机柜1个CPU搭配 8 个GPU),但如今这一配比差距正在大幅缩小,GPU与CPU在服务器中趋于接近1:1配比,无论是强化学习训练还是智能体推理均是如此。
这种爆发式需求已导致GitHub等数据库服务出现不稳定。多名用户反馈频繁宕机、代码提交频繁失败。情况非常糟糕。而造成这些情况的原因在于微软将几乎所有富余CPU资源全部外售:一部分用于内部实验室,但更多是供给与 OpenAI、Anthropic签约的外部机构。最终导致微软几乎无CPU可用。其他多家厂商也出现相同状况。
以往配置通常是:少量CPU支撑大量GPU,例如100兆瓦GPU算力仅需1兆瓦甚至更少的CPU支撑。而如今,无论是RLHF训练还是智能体推理,CPU与GPU功耗/算力配比已大幅趋近。结果就是:所有厂商的CPU都耗尽了,包括亚马逊的CPU服务器规模。
Dylan表示,亚马逊、微软已将全部CPU供给卖给OpenAI、Anthropic 等AI公司。情况严峻到,尽管亚马逊CPU服务器规模同比增至三倍,仍出现供应耗尽,无法满足未来新增需求。此外,随着OpenAI从x86转向Arm架构,Arm CPU受到的冲击更为严重。此前亚马逊Arm CPU资源相对充裕,而x86供给偏紧,企业便将代码从x86迁移至 Arm。这一调整如今让AI公司陷入被动。
云CPU短缺正倒逼各厂商大幅扩产以应对爆发式需求,一场围绕三大架构的三足鼎立之争,已然箭在弦上。GPU巨头英伟达在进行CPU战略布局,2021年英伟达发布了首款数据中心CPU Grace,当时不少分析师认为此举只是分散精力。如今看来,这一决策极具先见之明。新一代Vera CPU已投入量产,英伟达在2026年2月与Meta达成多年协议,其中包括首次大规模部署独立运行的Grace CPU,不与GPU搭配,而是单独为Meta的个人智能体AI提供算力支撑。英伟达还做出了意外的选择:采用Arm架构,而非统治服务器市场数十年的x86指令集。这带来了更优的能效比,在数据中心向吉瓦级规模扩张、电力成为核心制约因素的当下,这一点至关重要。
AMD意外成为CPU需求爆发的最大受益者。其采用小芯片架构的EPYC “Turin” 处理器,产能供不应求。“过去6至9个月,需求增幅前所未有。”AMD数据中心业务负责人福里斯特・诺罗德认为,短期内需求没有任何放缓或停止的迹象。
过去英特尔服务器市场份额一直在持续被AMD蚕食,如今正试图发起一场绝地反击,与英伟达合作,推出集成NVLink的定制版至强处理器,让x86核心可在 Blackwell、Rubin GPU集群中担任一致性主控节点。x86生态在AI时代依然具备不可替代的价值,企业向智能体AI转型并非从零开始,而是基于现有x86基础设施演进。
这次CPU供应紧张是始料未及的,英特尔此前承认公司产能完全受限,2026年第一季度库存将降至历史最低水平。作为应对,英特尔已降低低端消费级PC市场优先级,将晶圆产能转向数据中心产品。投行KeyBanc分析师则表示,AMD EPYC 服务器CPU 2026年全年产能近乎售罄。高端EPYC处理器交期已拉长至8–10周。
值得关注的是,AMD、英特尔为云厂商供应绝大部分x86芯片,英伟达也在加速扩产其Vera CPU机柜,而这些都意味着DRAM供给仍将高度向AI倾斜,CPU产能也将全面向AI倾斜。这会直接导致面向消费端、企业级的CPU生产线受挤压,产能优先供给AI领域。最终结果是:普通市场CPU供应紧张、价格上涨,价高者得芯片。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。
