跟手机行业一样,汽车的主芯片步入SoC时代后,造芯片越来越像“高级组装”。ARM这样的底层技术公司,提供标准的CPU、GPU等处理器IP。
SoC芯片厂在购买了IP核心后,把CPU、GPU、NPU等处理器核心连接起来,再加上内存、电源、I/O接口等辅助模块,就设计出一颗SoC芯片了。
现在,ARM要更进一步,推出面向汽车市场的计算子系统(Compute Subsystems,CSS),直接把CPU核心,以及电源/时钟、IO、安全岛等基础计算组件,还有GPU和ISP等视觉处理器一块打包,做成标准件提供给SoC芯片公司。
这样一来,SoC公司只需专注在差异化的部分:研发或采购NPU以及其他加速器,然后将其与CSS子系统进行连接即可。
在日前的ARM年度技术大会上,我了解到ARM计划在2025年将汽车CSS推向市场。
这一举动将大幅减少汽车SoC开发过程中的“基础性”、“重复性”工作,加速芯片设计速度,减少所需的工程师数量,并降低开发成本。
更为重要的是,汽车CSS系统同时支持单芯片和Chiplets技术。基于标准的UCle接口,可以将两颗SoC芯片拼成一颗,实现更强大的性能。
当前半导体行业的制造工艺越来越难突破,单一芯片性能难以取得重大进展,通过Chiplets技术将两颗芯片“拼”起来提供了解决方案。在消费电子领域,苹果M系列芯片的Max和Ultra版本,就是通过“拼接”方式提升芯片性能的典型案例。
在汽车领域,瑞萨刚刚发布的3nm汽车SoC X5H便是支持Chiplets技术的先行者。该芯片在本身已经拥有400TOPS的片上NPU的基础上,还可以通过UCle接口连接外部NPU,将AI性能提升3~4倍。
将Chiplets技术引入汽车领域,为芯片制造商提供了新的可能——既可以“拼接”出性能更强的芯片,也可以通过UCle接口灵活搭配不同的组件,以应对不同的使用场景。
为了进一步加速汽车芯片的研发进程,ARM还提供了云端的虚拟原型解决方案。
车企或Tier 1在开发SoC芯片时,在芯片设计完毕之前即可开始为其编写基础软件。而如果没有该解决方案,按照传统的流程,则需要等芯片设计完毕且流片回来后,才能开始编写各种软件。
ARM方面宣称,基于云端虚拟原型开发解决方案,可以将芯片的上车时间最快缩短2年。
随着智驾算法全面拥抱端到端和Transformer,SoC芯片对CPU的要求日益提升。
ARM在今年年初也推出了3个全新的汽车CPU IP核心,分别为Neoverse V3AE、Cortex-A720AE和Cortex-A520AE。这三个CPU IP均采用了ARM最新的V9架构,相比此前的A78AE、A55AE等核心,在基础性能和AI性能上都有明显提升。
经过ARM的测试,在激光雷达点云转换和生成BEV视图两个常见的自动驾驶任务中,新款CPU相比老款都有明显提升。
AI能力方面,ARM的汽车CPU IP也在不断进化。A76AE通过NEON SIMD指令集加速矢量运算,支持实时 AI 推理;A78AE 增强了Hybrid Mode,可灵活切换计算模式,同时计算单元翻倍,大幅提升性能;最新的A720AE 基于Armv9-A 架构,支持 SVE2 提升并行计算能力,I8MM 优化深度学习推理,BFloat16 支持低精度 AI 运算,并通过 Flop-Parity 提高浮点计算精度。
随着功能安全和性能的持续优化,这些升级使 ARM CPU 更加适用于下一代自动驾驶和智能座舱的复杂计算需求。
纵观国内的芯片公司,虽然目前各家已发布的汽车SoC芯片,大部分还在使用A78AE或者A55AE等上一代CPU IP。但据我了解,在新一代产品中,已经有两家公司确定采用Neoverse V3AE和A720AE。
从各种标准化的IP核心到到CSS计算子系统,再到Chiplets技术的应用,ARM不断降低汽车芯片开发的门槛,并大幅提升设计效率。这些技术革新不仅加速了汽车电子领域的技术进步,也推动了汽车行业向智能化、自动化方向迈进。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。
