CPU告急，Agentic AI耗尽云端算力

来源：半导纵横发布时间：2026-04-15 13:39

CPU

行情

生成海报

亚马逊CPU服务器规模同比增至三倍，仍出现供应耗尽。

最开始紧缺的是GPU，随后是内存，而如今紧缺的矛头转向了CPU。受Agentic AI爆发式增长影响，CPU正面临严重短缺。

据半导体行业分析机构Semianalysis Dylan Patel指出，GPU已不再是云厂商的瓶颈，这一角色现已转移至CPU。此前，用于AI的GPU仅执行简单推理任务，随着新模型推出，任务形态发生根本性变化。Agentic AI如今被大量用于数据库调用，以及物理仿真、模拟运算等高度依赖CPU的任务。这些频繁的数据库访问与CPU密集型运算，导致云数据中心CPU使用率急剧飙升。

尽管GPU在AI云端服务器中仍占据主导地位（例如单机柜1个CPU搭配 8 个GPU），但如今这一配比差距正在大幅缩小，GPU与CPU在服务器中趋于接近1:1配比，无论是强化学习训练还是智能体推理均是如此。

这种爆发式需求已导致GitHub等数据库服务出现不稳定。多名用户反馈频繁宕机、代码提交频繁失败。情况非常糟糕。而造成这些情况的原因在于微软将几乎所有富余CPU资源全部外售：一部分用于内部实验室，但更多是供给与 OpenAI、Anthropic签约的外部机构。最终导致微软几乎无CPU可用。其他多家厂商也出现相同状况。

以往配置通常是：少量CPU支撑大量GPU，例如100兆瓦GPU算力仅需1兆瓦甚至更少的CPU支撑。而如今，无论是RLHF训练还是智能体推理，CPU与GPU功耗/算力配比已大幅趋近。结果就是：所有厂商的CPU都耗尽了，包括亚马逊的CPU服务器规模。

Dylan表示，亚马逊、微软已将全部CPU供给卖给OpenAI、Anthropic 等AI公司。情况严峻到，尽管亚马逊CPU服务器规模同比增至三倍，仍出现供应耗尽，无法满足未来新增需求。此外，随着OpenAI从x86转向Arm架构，Arm CPU受到的冲击更为严重。此前亚马逊Arm CPU资源相对充裕，而x86供给偏紧，企业便将代码从x86迁移至 Arm。这一调整如今让AI公司陷入被动。

云CPU短缺正倒逼各厂商大幅扩产以应对爆发式需求，一场围绕三大架构的三足鼎立之争，已然箭在弦上。GPU巨头英伟达在进行CPU战略布局，2021年英伟达发布了首款数据中心CPU Grace，当时不少分析师认为此举只是分散精力。如今看来，这一决策极具先见之明。新一代Vera CPU已投入量产，英伟达在2026年2月与Meta达成多年协议，其中包括首次大规模部署独立运行的Grace CPU，不与GPU搭配，而是单独为Meta的个人智能体AI提供算力支撑。英伟达还做出了意外的选择：采用Arm架构，而非统治服务器市场数十年的x86指令集。这带来了更优的能效比，在数据中心向吉瓦级规模扩张、电力成为核心制约因素的当下，这一点至关重要。

AMD意外成为CPU需求爆发的最大受益者。其采用小芯片架构的EPYC “Turin” 处理器，产能供不应求。“过去6至9个月，需求增幅前所未有。”AMD数据中心业务负责人福里斯特・诺罗德认为，短期内需求没有任何放缓或停止的迹象。

过去英特尔服务器市场份额一直在持续被AMD蚕食，如今正试图发起一场绝地反击，与英伟达合作，推出集成NVLink的定制版至强处理器，让x86核心可在 Blackwell、Rubin GPU集群中担任一致性主控节点。x86生态在AI时代依然具备不可替代的价值，企业向智能体AI转型并非从零开始，而是基于现有x86基础设施演进。

这次CPU供应紧张是始料未及的，英特尔此前承认公司产能完全受限，2026年第一季度库存将降至历史最低水平。作为应对，英特尔已降低低端消费级PC市场优先级，将晶圆产能转向数据中心产品。投行KeyBanc分析师则表示，AMD EPYC 服务器CPU 2026年全年产能近乎售罄。高端EPYC处理器交期已拉长至8–10周。

值得关注的是，AMD、英特尔为云厂商供应绝大部分x86芯片，英伟达也在加速扩产其Vera CPU机柜，而这些都意味着DRAM供给仍将高度向AI倾斜，CPU产能也将全面向AI倾斜。这会直接导致面向消费端、企业级的CPU生产线受挤压，产能优先供给AI领域。最终结果是：普通市场CPU供应紧张、价格上涨，价高者得芯片。

本文转自媒体报道或网络平台，系作者个人立场或观点。我方转载仅为分享，不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益，请及时联系客服，我们作为中立的平台服务者将及时更正、删除或依法处理。