与其他行业类似,半导体领域的产品开发周期也呈现出周期性迭代特征:每隔数年便会出现一次较大变革,而几乎每年都会有小幅更新。以智能手机处理器为例,这类产品虽每年都会推出新款,但细究之下便会发现,许多所谓的新款其实仅涉及知识产权(IP)模块的替换——比如更新CPU或GPU的版本,这便是行业内常说的大变化或小变化的具体体现。
智能手机处理器的集成度极高,除了核心的CPU、GPU和NPU之外,还包含众多辅助功能模块。其中既涵盖视频处理、音频处理、显示控制等基础多媒体功能单元,也集成了安全引擎、传感器中枢控制器等专用组件,这些模块共同构成了一颗完整的芯片。
若将芯片的构成划分为两大部分:一部分是CPU等核心处理器,另一部分则是上述各类外设功能模块。通常而言,外设模块的技术成熟度较高,多已实现商品化,因此在芯片迭代时往往可以直接沿用,无需随主芯片同步更换。我们通过持续对最新芯片进行开箱解析发现,当深入观察芯片的内部架构时,各家厂商在技术路线上的重大调整与差异化创新,都会变得清晰可辨。
每隔几年,芯片行业便会迎来一次标志性的技术革新——各家企业会对芯片的内部功能布局及终端配置进行全方位的重大调整。最具代表性的案例当属苹果芯片的迭代:从A12 Bionic到A13 Bionic,CPU的物理布局发生了显著重构(类似的重大调整在A16与A17芯片中同样可见)。联发科的Dimensity系列也呈现类似特征,从1000系列升级至9000系列时,不仅芯片外观焕然一新,各IP模块的布局也实现了突破性重构。
这类重大变革之后,芯片往往会进入持续演进阶段,主要通过升级CPU、GPU等核心IP(即“替换式演进”)实现性能提升。这一过程通常会整合Arm等IP供应商的CPU/GPU开发路线图,以及DRAM接口等底层技术的演进成果,最终形成一套适配多产品线的布局规划——这种模式对IP替换而言效率极高。NVIDIA与AMD的GPU产品同样遵循类似规律,每隔数年便会迎来或大或小的技术迭代。
2025年正是这样一个变革节点。据行业动态显示,NVIDIA计划在2025年第一季度推出基于全新Blackwell架构的GPU,AMD也将同期发布采用RDNA 4新架构的产品——两家企业的上一代产品均于2022年第四季度问世。本文将聚焦这两款新GPU展开解析,需要说明的是,文中将暂略VRAM接口通道数等细节参数,重点聚焦核心技术演进。
近年来,“由高至低” 的发布策略已成为行业常见模式 —— 不仅是芯片领域,智能手机市场亦是如此。苹果、谷歌、三星电子等企业均采用这一路线:先发布 Pro 等高端机型,间隔数月后再推出入门款。例如,苹果 iPhone 16 Pro 计划于 2024 年 9 月发布,而 iPhone 16e 则预计在 2025 年 2 月登场;谷歌 Pixel 9 系列也将遵循类似节奏,先推出 Pixel 9 Pro,再发布 Pixel 9a。
就目前情况而言,截至 2025 年第一季度,NVIDIA Blackwell GPU 仅采用了三星的 GDDR7 产品;不过据行业动态显示,2025 年下半年美光等厂商的 GDDR7 产品也将陆续上市。
图 3 呈现了 NVIDIA Blackwell 架构下,中端型号 GeForce RTX 5060(5060Ti 采用同款芯片)与中高端型号 RTX 5070 的封装形态及芯片型号标识。NVIDIA 延续了 “从高端到入门级” 的芯片命名逻辑:GB205 对应 RTX 5070,GB206 对应 RTX 5060,而计划 7 月发布的入门级型号 RTX 5050 则以 GB207 为芯片标识。这些型号的芯片均标注了流片年份,且统一为 2024 年。作为全新研发的产品,其在 2024 年完成原型设计与性能评估后,已正式进入量产阶段。
Blackwell 架构的应用场景十分广泛,NVIDIA 不仅将其用于游戏 GPU 领域,还将其拓展至生成式 AI 领域(如 GB200、GB300)、汽车领域(DRIVE Thor)以及工作站领域(DGX SPARK),实现了同一架构在多领域的部署落地。
即便是定位中端的 RTX 5060,其芯片引脚也达到 2088 个球,这一设计旨在提升 VRAM 带宽与供电能力。值得注意的是,该GPU的球数已超过台式机 CPU:英特尔最新的 Arrow Lake 为 1851 个球,AMD 的 AM5 则为 1718 个球。
RTX 5080 与 RTX 5070 的引脚数量相同,不过 RTX 5070 存在部分未启用的球脚。这种设计被认为是通过封装标准化来实现成本控制的策略。而超高端的 RTX 5090,其引脚球数更是高达 5775 个,处于高端显卡中的顶级水平(不过我们已确认,目前球数最高的是 Apple M3 Ultra,达到 7478 个球)。
图5 展示了四款 NVIDIA Blackwell 芯片,入门级的 RTX 5050(GB207)未包含在内。这是一套由精简元素构成的可扩展芯片体系,其运算核心与缓存的数量、VRAM 接口通道数量均会根据型号定位进行缩减。而单个核心与 PHY(物理层接口)则保持不变,通过调整规模来形成不同版本。这种扩展设计还具备可复用测试模式的优势,能提升研发效率。四款芯片对比
在这一系列中,定位最高的RTX 5090(GB202)芯片设计难度最大。它包含海量晶体管,随着芯片面积增大,功耗控制、噪声抑制以及时钟偏移调整等问题的复杂度也会同步上升。因此,最合理的研发路径是先攻克难度最高的芯片设计,再以此为基础进行精简调整—— 通常来说,芯片面积越大,功耗下降幅度越明显,时钟偏移调整也越棘手,这使得高端大芯片的产品频率往往会略低于小芯片型号。
图6显示了目前市场上两款晶体管密度最大的芯片。两款芯片的晶体管密度均超过920亿个。虽然由于制造工艺不同,两者并非同轴比较,但晶体管密度都超过了每平方毫米1亿个。对于智能手机而言,每平方毫米晶体管密度超过2亿个的芯片已经上市,而且我们可能很快就会看到2纳米和1.4纳米制程工艺的芯片密度超过3亿个。
尽管CHIPLET 有其优势,但毫无疑问,芯片种类的增加会增加复杂性。虽然由于制造工艺不同,两者无法进行同轴比较,但通过使用单芯片,集成度提高了 90% 以上。目前,有必要具备一定的灵活性,以便在某一代芯片上使用 CHIPLET,然后在可行的情况下恢复到单芯片。AMD 拥有足够的灵活性。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。