多协议竞逐时代,AI为何反倒利好PCIe?

来源:半导纵横发布时间:2026-06-10 17:18
标准/协议
技术进展
生成海报
在AI领域,PCIe非但没有被逐步取代,反而进一步巩固了其市场地位。

长期以来,PCIe始终是处理器与外接设备之间数据传输的主流互联方案,当下数据中心面向AI扩容的新型网络也延续了这一应用逻辑。外界曾认为,各类新型网络的出现意味着PCIe已难以满足现有需求,但事实恰恰相反:在AI领域,PCIe非但没有被逐步取代,智能体AI及各类新型AI应用的兴起,反而进一步巩固了其市场地位。

CXL与PCIe联系紧密,它构建在PCIe协议栈之上。受厂商评估落地价值影响,CXL初期发展节奏缓慢,甚至有人质疑其能否普及。不过随着相关交换芯片陆续上市,系统厂商也逐步理清应用场景,CXL如今已显现出更强的发展活力。

悠久积淀与起步困境

PCIe于2003年正式推出,作为串行互联标准,它彻底取代了传统PCI并行接口,成为计算机外设连接的主流选择。初代标准单通道速率为2.5吉比特每秒,16通道配置下最大吞吐带宽可达4吉字节每秒。

此后PCIe不断迭代,7.0版本于2025年发布,单通道速率提升至128吉比特每秒(含纠错比特),综合净吞吐带宽达到242吉字节每秒。

楷登电子(Cadence)硅解决方案集团设计IP高级产品营销总监Arif Khan表示:“PCIe速率持续翻倍,行业发展曲线在近几年迎来爆发式增长。”

几乎所有计算机相关设备都在采用PCIe互联。该标准最初面向个人电脑设计,而新一代版本的性能早已超出PC的使用需求,如今更多落地于数据中心场景。

时隔多年,计算快速互联(CXL)1.0标准在2019年问世。CXL本质是在PCIe基础上拓展的内存一致性扩展协议,1.0版本与PCIe5.0同期推出;最新的CXL4.0版本发布于2025年,基于PCIe7.0打造。

CXL包含三大核心功能模块:CXL.io:基础非一致性标准,用于设备初始化、管理与设备发现等基础操作;CXL.cache:支持外接CXL设备缓存主机内存,并维持内存数据一致性;CXL.mem:可像访问服务器本地内存一样,通过加载/存储指令调用外接内存。

CXL落地进度偏慢,也让其普及前景饱受质疑,行业对这项技术的认知仍存在滞后性。新思科技(Synopsys)PCIe产品营销高级总监Antonio Costa称:“目前业内对CXL的理解尚不深入,随着应用场景不断丰富,大家才会逐步掌握它的使用方式。”

而近期行业动态表明,CXL的发展态势正持续向好。

新兴互联方案登场

AI热潮让面向模型训练与推理任务的数据中心成为行业焦点,GPU更是占据核心地位。业内各方都在全力优化GPU集群系统性能,设备互联技术也随之迎来变革。

市场逐渐分化出不同的网络架构,形成三类主流扩容模式:

  • 纵向扩容(Scale-up):将多颗GPU整合为一个拥有统一内存空间的巨型虚拟GPU,依托内存语义实现协同工作;

  • 横向扩容(Scale-out):借助远程直接内存访问(RDMA)机制,调用远端算力与资源;

  • 跨域扩容(Scale-across):架构逻辑与横向扩容相近,可实现更远距离的资源调度。

UALink是适配纵向扩容的全新标准;英伟达自研的NVLink也提供多种互联方案,同样支持纵向扩容场景。

横向扩容需要实现远距离网络通信,该领域长期由以太网主导。但以太网存在明显短板,尤其会拉高尾延迟,因此行业也在不断对其优化升级。

各类AI扩容网络吸引了绝大多数关注,老牌互联技术PCIe一度淡出大众视野。过去,设备本地处理器互联的纵向扩容场景基本依赖PCIe,如今这一应用场景被逐步分流。那么PCIe的价值体现在哪里?

互联对象决定技术选择

如果仅关注AI领域的新技术,很容易片面认为GPU就是核心,纵向扩容网络将全面主导市场,但实际并非如此。GPU主要承担AI海量数学运算任务,专属纵向扩容网络仅用于多颗GPU直连,全程无需CPU中转,这和绝大多数需要CPU参与的互联方案有着本质区别。

“CPU与加速卡之间依靠何种芯片协议通信?多数情况下,加速卡都是插在PCIe插槽中使用。”Arif Khan说道。

这正是PCIe不可替代的核心场景。CPU与GPU的通信不会借助UALink这类方案,但凡涉及CPU的数据交互,基本都依靠PCIe完成。

这一特性也直接作用于基于以太网衍生方案的横向扩容架构。Rambus硅IP产品营销高级总监Lou Ternullo表示:“PCIe非常适配横向扩容架构的搭建。”

PCIe负责连接CPU与网卡(NIC),即便讨论横向扩容时很少提及这一点,但PCIe始终是链路中不可或缺的一环。Arif Khan补充道:“智能网卡的进出带宽需求极高,这也是新一代高速PCIe至今仍被广泛应用的重要场景。”

楷登电子高速串行接口产品营销总监Hui Wu也持相同观点:“横向扩容反而拓宽了PCIe的市场空间,因为该架构高度依赖网卡,而网卡的底层支撑正是PCIe。”

横向扩容模式兴起已久,而AI技术的迭代正在重塑行业格局。传统AI业务以GPU为核心,CPU仅负责调度与辅助工作;但智能体AI彻底改变了这一格局。

智能体AI离不开CPU

AI智能体可自主执行任务,帮助人类提升决策效率与工作产出。这类应用主要在CPU上运行,仅将部分推理任务分流至GPU。智能体需要不断做出决策,而分支跳转这类运算并不适合GPU处理。这就导致在任务执行过程中,负载会在CPU与GPU之间频繁交互。

“AI加速器负责完成运算步骤,后续执行动作则交由CPU处理。”Antonio Costa解释道,“智能体AI应用越多,对CPU的需求就越大,整体算力规模也需要同步扩容。”

Efinix企业营销副总裁Bob Beachler提到:“以往行业内GPU与CPU的配比约为8:1,而在智能体AI场景下,二者比例变为1:1,CPU与GPU一一搭配。”

PCIe是实现这类互联的天然选择,这也意味着PCIe在AI领域的应用价值还将持续提升。

PCIe同样可支撑纵向扩容

UALink的出现,初衷是弥补PCIe在纵向扩容场景下的性能短板,这一点在部分场景中确实成立。但并非所有系统都追求极致吞吐能力,PCIe同样能够满足纵向扩容需求。

Lou Ternullo表示:“目前几乎所有终端设备都支持基于PCIe与CPU互联。抛开NVLink不谈,市面上几乎全部加速卡都将PCIe作为主互联方案。凭借极高的通用性,借助PCIe交换芯片连接多颗GPU加速卡,成为纵向扩容场景里最简便的选择。虽然UALink等新兴标准带宽更高,但PCIe完善的生态、出色的兼容性,使其在GPU、专用芯片加速卡的纵向扩容项目中极具竞争力。我认为PCIe标准迭代速度不断加快(目前已推进至PCIe8.0/0.5版本),核心目的就是进一步强化其纵向扩容能力。”

UALink会在适配的纵向扩容架构中发挥价值,但PCIe兼容全品类终端设备,在多数环境中落地门槛更低。同时也要明确,性能最优的技术未必能成为行业通用标准,成本与落地便捷性往往比单纯的硬件性能更具话语权。

边缘侧的多元协议生态

前文讨论的扩容方案主要面向数据中心,而AI应用同样在边缘端快速发展。边缘场景会用到多种不同协议,搭载传感器的设备尤为典型。

图像摄像头就是典型案例,MIPI协议专门用于传输摄像头数据。半导体企业Silvaco旗下Mixel公司营销销售总监Justin Endo介绍:“MIPI主要应用在边缘设备,包括摄像头、显示屏、传感器、移动存储等。该协议专为流式数据设计,具备低功耗、低延迟、协议栈精简的特点。”

这类场景并非PCIe的强项。“PCIe与CXL主要负责通用计算、存储芯片之间的大数据交互。二者与MIPI存在少量应用重叠,例如移动存储领域基于M-PHY的UFS和基于PCIe的NVMe,但它们分属协议栈不同层级,并非直接竞争关系。”

边缘端采集的原始数据最终大多会回传至数据中心,但直接传输原始数据会占用海量带宽。“以手机、汽车、无人机、工业视觉设备中,通过MIPI物理层传输摄像头数据的MIPICSI-2协议为例,绝大多数推理场景都无法将完整原始图像直传数据中心,带宽、功耗与延迟都会严重超标。”

Justin Endo解释道:“借助CSI-2协议,图像数据先在边缘片上系统(SoC)中完成处理,图像信号处理、环境感知、传感器融合、端侧推理等对时效要求高的任务,都可在传感器本地完成。最终通过PCIe向上游传输的,是经过提炼的特征数据、嵌入向量与元数据,而非原始像素信息。也就是说,数据在进入PCIe链路前就已完成精简。这也让PCIe、CXL、UALink、超以太网等技术可以专注于核心能力:模型训练、内存池化、机架级加速卡互联。”

老旧PCIe版本仍有广阔使用空间

尽管AI场景对带宽要求不断拉高,但大量常规应用依旧可以平稳运行在旧版PCIe之上。

“对于固态硬盘及各类消费级设备而言,PCIe2.0、3.0的速率完全够用,这类应用还将长期存在。”Arif Khan说道。

部分设备需要更高传输速率,但也未必追求顶配标准。“目前市场上还未出现搭载PCIe6.0的商用CPU系统,主流原始设备制造商仍处于内部测试或客户试点阶段。即便PCIe5.0标准正式落地后,AMD、英特尔的相关终端产品也时隔许久才推向市场。”

固态硬盘正逐步向更高版本PCIe迁移,但并非一味追求最新标准。“如今PCIe6.0固态硬盘已较为普及,不少厂商也已启动PCIe7.0相关产品研发,以此匹配高端系统的性能需求。”

CXL发展态势回暖

PCIe地位稳固,也使其持续作为CXL的底层物理层(PHY)。不过标准迭代节奏,曾拖累CXL的普及进程。

Arif Khan分析:“CXL依托PCIe5.0物理层搭建,但搭载该标准的终端产品上市周期漫长;与此同时,CXL自身标准又快速更新。当行业厂商刚完成CXL3.0产品设计、准备量产时,新的CXL4.0标准又已推出。”

除此之外,CXL不同应用场景的落地进度也参差不齐。行业将CXL设备划分为三类形态,对应不同功能:

  • Type1设备:支持加速卡接入,并实现内存一致性;

  • Type2设备:可访问主机内存;若设备自带存储,主机也可反向读取其内存;

  • Type3设备:支持主机对远端内存进行一致性访问与管理,可作为内存扩展组件或参与内存池化部署。

受延迟性能限制,CXL在缓存拓展场景的落地阻力较大。Antonio Costa表示:“行业普遍希望借助CXL拓展缓存与主存容量。但缓存对延迟要求极致严苛,因此很少有客户用CXL扩容缓存。不过在内存扩展领域,CXL广受欢迎。当系统内置高带宽内存(HBM)、DDR内存容量不足时,CXL凭借低延迟优势,成为扩容内存的优质选择,拓展的数据也能高效载入缓存。”

内存池化引发行业争议

业内对于CXL内存池化方案的实际效果仍存在争议。这类分歧也延缓了CXL的整体普及速度,厂商仍在摸索该技术的最佳应用方向。

即便如此,CXL生态仍在持续壮大,也让开发者对其发展前景更有信心。Lou Ternullo称:“PCIe与CXL互联生态不断成熟,进一步放大了内存扩展方案的价值。目前CXL交换芯片市场出货量持续增长,而PCIe传输距离的拓展技术,也为规模化内存池化架构提供了有力支撑。”

智能体AI同样有望拉动CXL需求。Antonio Costa表示:“我们认为下一代CXL标准的重要性将进一步提升。智能体AI对算力的需求持续攀升,CXL也必将在其中扮演重要角色。”

技术迭代持续推进

PCIe与CXL的市场需求还将在长期技术迭代中得到延续。按照规划,PCIe8.0预计2029年推出,带宽将在PCIe7.0基础上再翻一倍。

“PCIe8.0单通道速率将达到256吉比特每秒,依旧保留16通道配置。”Antonio Costa介绍,“该版本信号机制、控制器数据包架构均保持不变,不会出现颠覆性改动。”

CXL也在研发5.0版本,不过CXL联盟尚未公布具体上市时间。

与此同时,行业也在研发新型线缆标准,以此延长PCIe的传输距离。两年前推出的CopprLink标准,可在PCIe5.0、6.0速率下实现最长两米的传输。目前该标准正适配PCIe7.0,但PCIe行业兴趣小组(PCIeSIG)暂未公布落地时间。

除铜质传输介质外,基于光传输的PCIe方案也处于前期探索阶段,同样暂无明确上线时间表。

Lou Ternullo总结道:“PCIe重定时器、交换芯片的应用日益广泛,叠加CopprLink、光电传输等新型线缆技术,PCIe网络的传输范围不断延伸,全面赋能横向扩容与纵向扩容两大架构。”

发展前景展望

种种迹象表明,AI非但不会冲击PCIe的地位,反而会推动其进一步发展。消费类设备仍会长期沿用老旧版本,高带宽特性则主要服务于数据中心,但市场对高速互联的需求始终强劲。

CXL虽然起步缓慢,但目前增速明显。现阶段还不能断言其已完全成功,但向好趋势愈发清晰。

整体来看,各类新兴互联标准并非为了取代现有技术,而是对现有生态的补充。多样的选择让网络架构变得更为复杂,但各技术的应用边界也十分明确:诸如UALink这类标准有其专属场景;而无论数据中心是否为AI业务扩容,PCIe都将是绝大多数系统的标配。

本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。

评论
暂无用户评论