产品咨询
产品咨询

芯来科技UX1030H,全面支持RVA23

芯来科技新一代高性能处理器IP —— UX1030H严格遵循RVA23 Profile规范,全面支持虚拟化及向量计算扩展,并在此基础上进一步提供对IOMMU和AIA(Advanced Interrupt Architecture)的支持,面向新一代高安全、高扩展性的应用场景,标志着国产RISC-V高性能处理器IP在生态融合与系统适配能力上迈出关键一步。

logp

芯来科技

在线客服
微信咨询
产品海报

产品详情

过去几年,RISC-V架构在中低功耗处理器市场快速落地,特别是在对标Arm Cortex-A53/A55级别的通用计算场景中,已实现从产品化到规模化部署。当前,RISC-V CPU IP在智能终端、边缘网关、低功耗AI等领域形成了较为成熟的生态与工具支持,此级别的处理器的典型代表是芯来科技的UX900系列处理器IP。

在此基础上,市场正加速迈向对标Cortex-A72级别的中高端RISC-V处理器IP需求阶段,典型应用主要包括:

1)边缘AI计算与语义识别引擎

2)智能汽车域控制器与车载虚拟化平台

3)高性能边缘服务器与工业智能设备

4)多核异构SoC中的主控核心或虚拟化运行环境

借助RISC-V Vector扩展标准,RISC-V在AI推理与并行计算场景中展现出更高的灵活性与性能潜力。当前正是RISC-V从“控制类芯核”向“主控级通用处理器”升级的关键节点,具备标准化、商用能力和生态兼容性的高性能RISC-V处理器IP,将成为推动下一阶段产业突破的核心力量。

严格支持RVA23,生态性能兼顾

芯来科技推出的UX1030H处理器IP,严格遵循RVA23 Profile规范,兼顾生态完整性与高性能演进,是RISC-V高端应用领域的重要基础组件。

RVA23 Profile是RISC-V软件生态面向64位高性能通用处理器场景的重要标准,明确要求处理器必须支持包括Hypervisor和Vector在内的关键扩展。UX1030H完全符合RVA23规范,具备运行通用操作系统与虚拟化环境的能力,并可无缝对接RISC-V日益成熟的开放软件生态体系。

特别值得强调的是,RVA23已被明确作为未来主流RISC-V平台运行Android操作系统的基本架构基线,包括Google、Red Hat、Canonical等关键厂商正在围绕RVA23构建下一阶段的系统软件支持。RVA23的标准化正在成为RISC-V生态突破桌面级和移动级平台的重要起点。

在此基础上,UX1030H额外提供:

IOMMU支持:

实现外设访问隔离与内存管理能力,增强系统安全性与资源隔离能力。

AIA支持:

为RISC-V系统提供高性能、可扩展且支持虚拟化的中断处理框架,显著优化多核与虚拟化场景下的中断效率和灵活性

图片

该组合能力使UX1030H不仅满足RVA23软件栈的基本运行要求,也具备支撑复杂虚拟化系统、高可靠设备接入和高并发中断调度的硬件能力,为Android在RISC-V架构上的广泛部署打下坚实基础。

架构升级,延续UX1000优势

UX1030H基于芯来科技自研的UX1000系列微架构平台,在原有成熟设计的基础上,进一步增强计算性能、并行能力和可扩展性,面向高性能RISC-V处理器的实际部署场景。

该处理器采用3译码宽度乱序执行架构,具备深度流水线设计,面向高负载、密集调度场景,提供出色的单核性能与执行效率。微架构内核可灵活配置性能参数,兼顾不同SoC平台对算力、功耗、面积的平衡要求。

1)12级乱序执行流水线,支持复杂指令调度与乱序重排,提高指令吞吐效率

2)每周期最大支持6条标量指令与2条矢量指令并行发射,释放计算资源

3)全面支持RISC-V Vector 1.0标准,并可配置最高256位(VLEN=DLEN=256)的向量处理能力,适用于AI推理、图像处理、信号分析等计算密集型场景

4)支持L1 I/D Cache、ILM/DLM片上内存配置、Cluster Cache

此外,UX1030H支持多核扩展架构,单个Cluster最多可配置16个核心,并支持多级缓存一致性机制,适用于面向高并发、高吞吐量系统的集群化部署需求。该设计为处理器在数据中心加速卡、智能汽车控制器及高性能边缘平台中的集成使用提供了可靠基础。

目前,UX1030H已进入客户导入阶段,多个合作项目正在进行SoC集成验证与平台适配。在T22工艺下可达1.6GHz。以下为UX1030H典型配置下的Floorplan示意图,展示其在面积优化与功能集成方面的布局特性。

图片

单核FloorPlan 

图片

四核Cluster Floorplan

标准指令,跑分性能领先

在RISC-V CPU IP市场中,性能评估的准确性和可比性是客户决策的重要参考。

在当前典型配置下,UX1030H核心取得如下性能表现:

1)在遵循Dhrystone Ground Rule,不启用内联优化(编译选项 -fno-inline)的前提下,Dhrystone跑分达到5.35 DMIPS/MHz;

2)CoreMark跑分达到8.5 CoreMark /MHz

注意:芯来科技在UX1030H的性能测试中,坚持采用完整标准RISC-V指令集进行编译与执行,未引入任何自定义指令刻意提升跑分,确保性能结果具有开放性、公平性与平台可迁移性。

该成绩在同类RISC-V高性能内核中处于领先水平,充分体现出UX1030H在指令调度、执行通道、Cache体系与流水线深度设计上的综合优化能力。

相较于部分依赖自定义指令集扩展以提升理论跑分的RISC-V处理器方案,UX1030H在标准RISC-V规范之内实现高性能输出,更利于后续操作系统、编译器、库文件等软件生态的直接兼容和长期维护。

同时,UX1030H内建的VPU(矢量处理单元)在图像计算、张量运算、加密等负载下提供了显著的性能加速能力。

图片
图片


独特特性,具备创新设计

UX1030H在延续UX1000系列微架构可扩展性优势的基础上,集成了多项系统级功能特性,进一步提升处理器在复杂SoC系统中的集成能力与实际应用效率,适配虚拟化、高吞吐外设访问、实时处理等关键需求场景。

支持双运行模式

UX1030H支持Linux通用操作系统运行模式与实时处理模式双模式运行配置,可在不同应用场景下灵活切换处理器特性,满足控制类任务的低延迟响应需求,同时也适配完整的操作系统和应用软件栈,适用于智能边缘、工业控制、车载计算等多样化场景。

支持Cluster Local Memory(CLM)

UX1030H支持将集群缓存配置为Cluster Local Memory(CLM),并提供CLM接口,供集群内多个核心或其他计算模块共享访问,提供更强的实时计算能力。

CLM设计适配SoC中典型的AI协处理器、图像引擎、DSP模块等场景下的片上数据共享需求。

可配置IO一致性接口(IOCP)

UX1030H提供可配置的IO一致性接口(IOCP),用于支持系统中多个外部主设备与处理器之间的数据一致性共享:

1)支持外部 Master(如 NPU、加速器、PCIe 控制器、DMA 等)访问处理器

2)Core和Cluster Cache

3)在不需软件干预的情况下保持缓存数据一致性

4)降低I/O访问延迟,提高异构系统的整体带宽与响应性能