
国家统计局副局长毛盛勇在国新办新闻发布会上表示,我国人工智能商业化规模化应用取得阶段性突破,到今年3月份,日均词元调用量突破140万亿,比上年末增长超40%。与此同时,3月中旬以来,多家国内云厂商发布调价公告,上调AI服务价格。
3月中旬以来,阿里云、腾讯云、百度智能云等头部厂商密集发布调价公告,上调AI服务价格,涨价幅度从5%到34%不等。
在海外市场,英伟达H100等高端图形处理器(GPU)的一年期租赁价格涨幅已接近40%;在国内市场,大模型厂商智谱AI在短短两个月内连续三次上调应用程序编程接口(API)价格,其GLM-5-Turbo模型在特定场景下的价格涨幅甚至接近翻倍,直接对标海外头部厂商。
4月15日,阿里云再度宣布将对部分MU(ModelUnit)模型单元的服务价格进行适度调整。影响产品为大模型服务平台百炼,上调幅度为2%至7%不等。4月9日,腾讯云发布公告,自5月9日起对AI算力、容器服务、大数据分析工具等三类产品价格统一上调5%,已购用户在当前计费周期内不受影响。
科大讯飞智算平台于3月底宣布AI推理服务涨价8%,商汤科技SenseCore通过调整算力套餐定价模式,使单次大模型训练的费用平均上浮12%。智谱AI在4月8日再度提价10%,这已是其近期的第三次涨价。
行业分析师表示,此前云厂商为了抢占市场份额,往往通过巨额补贴将算力价格压至“白菜价”。然而,随着AI应用从“玩具”向“工具”转型,尤其是AI智能体(Agent)爆发,海量并发调用带来的电力、带宽及硬件折旧成本已远超厂商的补贴上限。
当算力成为决定企业竞争力的核心要素时,其定价逻辑便不再单纯锚定硬件成本,而是取决于其所能提供的商业价值与稀缺程度。
本轮涨价的核心引擎,在于推理端词元调用量的爆发式增长。随着多模态大模型和AI智能体的普及,AI的应用场景已从简单的对话框,延伸至复杂的办公、编程及创意生成等多个领域。
全球AI大模型聚合平台OpenRouter最新数据显示,3月16日至3月22日,中国AI大模型词元调用量连续第三周超越美国,国产词元正成为全球开发者的主流选择。从长期数据来看,2025年3月24日前一周顶尖模型词元调用量为1.62T,到2026年3月16日前一周,这一数字升至18T,近一年增幅约1011%。
推理任务对内存带宽的要求已超越了对算力本身的追求,海量并发请求使得云厂商的电力和带宽成本急剧上升。这种从“训练主导”向“推理主导”的需求结构转变,使得算力消耗呈现出持续性运营支出的特征,彻底改变了过往“一锤子买卖”的商业模式。
在需求井喷的同时,供给端却面临着严峻的物理瓶颈。首先是存储供应的极度紧张。随着模型参数规模扩大,推理任务对高带宽内存(HBM)的需求甚至超过对GPU核心算力的需求,导致HBM价格在半年内大幅上涨,成为推高算力成本的首要推手。
硬件成本的上涨,叠加需求结构的改变,迫使厂商必须通过提价来覆盖昂贵的算力折旧,实现从亏损获客向质量增长的转型。
算力紧张的另一个侧面,是中国AI芯片市场格局正在发生深刻变化。据IDC数据,2025年中国市场AI加速卡总出货量约为400万张。英伟达出货约220万张,市场份额55%;AMD出货约16万张,市场份额4%。中国本土厂商合计出货约165万张,市场份额约41%。
在中国厂商阵营中,华为处于领先地位。据IDC数据,2025年华为出货约81.2万颗AI芯片,约占整体市场20%,接近国内供应商总出货的一半。阿里巴巴旗下平头哥以约26.5万颗居次,市场份额约7%。百度昆仑芯与寒武纪各约11.6万颗,并列第三。
本土厂商的崛起,正在逐步改变中国AI芯片市场的供给格局,为缓解算力缺口提供了新的可能。
在全产业链涨价的背景下,算力资源的稀缺性日益凸显,催生了算力租赁市场,成为AI产业发展的新风口。
对于大多数企业而言,自建数据中心正变得愈发困难。一方面,高端GPU采购周期被拉长至数月甚至一年以上;另一方面,建设一个具备规模化效应的智算中心,从规划、采购、部署到调试,周期动辄超过一年,且需要数亿元乃至数十亿元的巨额资本投入。这对于追求敏捷迭代和成本控制的中小企业乃至部分大型企业来说,是难以逾越的门槛。
在“自建难、买不起”的困境下,算力租赁凭借其“即取即用、按需付费”的灵活性,成为企业获取高端算力的最优解。
值得关注的是,面对持续的算力缺口,租赁厂商的议价权显著提升,其业务模式正从单纯的“裸算力出租”向更高附加值的“模型服务”或“词元分成”模式转变。具备技术对接能力与优质客户资源的头部租赁厂商,正通过提供更具性价比的国产算力方案或边缘计算服务,在巨头林立的市场中抢占一席之地。
算力短期价格上涨会带来产业阵痛,但长期来看,将推动AI产业务实发展。政府算力超市、算力银行等普惠政策落地,叠加算力租赁市场的资源优化配置,将推动算力回归核心生产要素本质,助力具备实际价值创造能力的企业发展,淘汰低质算力依赖型创业项目。
小米集团MiMo负责人罗福莉在社交平台发文指出,从宏观角度看,全球计算资源增长的脚步已跟不上Agent带来的Token需求增长。真正的出路不是提供更便宜的Token,而是让“更高效的Agent框架”ד更强大且更高效的模型”协同演进。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。
