芯片设计AI化,数据才是真难题

来源:半导纵横发布时间:2026-03-17 17:08
AI
芯片设计
生成海报
数据之乱,正在拖慢整个芯片AI。

将人工智能融入芯片设计流程,正推动企业全面重构数据管理策略,从被动存储转向主动、结构化、机器可读的系统。随着训练与推理负载不断增长,数据迁移、拥堵和能效已成为核心挑战,其重要性甚至超过了单纯的算力。EDA专用且复杂的数据格式,加上公开数据有限,使得针对半导体设计的AI模型微调变得非常困难。无论是用于RAG还是模型微调,都需要大量解析工作和深厚的领域专业知识。AI正迫使半导体企业从底层重新思考数据管理,将其从被动存储转变为一门主动的工程学科。

工程团队首先必须将分散的日志和设计成果整合到机器可读的数据湖中,用元数据和本体论进行丰富,并在工具之间搭建稳定的数据流管道。为此,他们会使用智能助手、检索增强生成(RAG)和微调模型,而这一切都必须在严格安全与本地部署的约束下完成。随着数据量增长,企业将需要新增EDA数据管理员这类角色,并持续投入数据结构与质量建设。无论工程团队使用RAG、训练模型还是微调数据,数据如果只是躺在那里,就毫无价值。历史数据与现有数据必须从不同集群、工具和项目中收集,再按项目、流程阶段和团队进行清洗与整理。此外,代码、文本、图像、时序数据和二进制格式都需要解析与分块。这些需求共同推动团队转向集中式数据湖和向量数据库,取代临时文件共享,数据管理也更强调机器可读性与检索能力。这也解释了为什么如今围绕AI设计的数据管理活动如此活跃,而仅仅一年前,行业还更关注可以使用哪些AI工具。

是德科技EDA部门IP与数据管理业务总经理Simon Rance表示,当时大家问的问题是需要在方法或设计流程中做哪些改变,才能融入并利用AI,他们也在思考如何训练AI。随着企业开始真正思考并着手落地,这个领域不断发展。企业面临数据安全挑战、算力问题、AI计算的能耗问题。现在人们越来越了解AI幻觉及其成因,也想知道如何缓解或减少幻觉。当前的重点大量集中在数据安全上。相比于创建大语言模型或训练方法,数据编排的优先级变得更高。大家都想直接深入应用,但如果基础没打好,就会在各种地方卡住,很多企业确实卡住了,某种程度上就像陷入瘫痪。这不是只改一个点就能解决的问题,会引发一连串连锁反应。

西门子EDA生成式AI产品总监Niranjan Sitapure也持相同观点。从AI设计对数据管理的影响来看,主要可以分为两类,一类是训练新AI模型、大模型或微调现有模型,另一类是检索增强生成(RAG),不需要训练或微调模型,也能利用已有数据。第三类,对半导体设计尤其重要,是前两类都共用的数据格式问题。像ChatGPT、Gemini这类大模型非常擅长文本、代码和多模态处理,因为它们在互联网上有大量这类格式的数据。但在EDA领域,代码高度专有,存在专用语言,很多EDA工具还有自己的语法且不对外公开,即便是最新模型也很难获取这些信息。部分EDA数据的格式甚至不支持机器读取,即便有图像和表格,也都是极其复杂的电路图、原理图,当前AI模型很难理解其含义。这直接影响模型微调和RAG两类应用。

Sitapure指出,在微调方面,现有模型并没有EDA数据,它们可能很擅长写Python代码、回答光刻原理这类通用问题,但并不真正懂如何深入设计电路。此外,微调需要大量数据,而很多芯片设计数据并不在EDA厂商手里,而是在客户和代工厂手中,它们不会公开。想要微调当前顶尖模型,既要解决EDA文件格式解析问题,又要面对公开数据不足的问题。而在RAG方面,比如在工具里打开一个设计做DRC,想理解设计状态或从日志文件排查错误,这类场景用RAG会更可行、更直接。

工程团队主要有两种应对方式。第一种是为所有数据搭建智能助手,配合RAG使用,相当于EDA领域的ChatGPT,厂商提供模型、RAG管道和友好界面,用户直接提问即可。另一些用户则希望拥有自己的微调AI模型,他们希望搭建训练或微调管道,在不同设计上运行仿真,让本地AI模型理解仿真数据,预测运行时间、内存占用,甚至预估PPA。目前EDA厂商会向用户提供这类技术。用户将信息集中到自己的机器可读数据湖中,再整体迁移到EDA厂商的AI服务基础设施里,但数据保留在本地、完全物理隔离,既保证安全,又能精准响应用户需求。换句话说,AI芯片与系统设计迫使数据管理从孤立、基于文件的结果,演进为云原生、大数据基础设施,能够承载跨物理域模型、减少昂贵的数据迁移,最终将设计阶段与运行阶段数据整合为统一、可扩展的系统。

部分企业已采用大数据技术,打造专门面向芯片设计的数据基础设施,例如如今并入新思科技的Seascape数据库。新思科技产品营销总监Marc Swinnen表示,他们重写了大量工具,让它们直接运行在Seascape之上,通过MapReduce等大数据技术,部分工具可以原生部署在云端。在EDA行业,通常是先做数据库或工具,再考虑如何上云,而Gear创始人的思路相反,是云优先,算法再去适配。当多个工具都在Seascape上时,可以实现传统系统无法做到的深度数据融合与联合分析。

工程数据价值极高,但过去长期处于高风险、弱治理状态。ChipAgents首席执行官William Wang表示,RTL、规格书、波形、日志、ECO历史都极度敏感、碎片化且难以审计。数据质量,而非模型质量,才是瓶颈。无论模型多大,错误上下文都会导致智能体输出错误。这意味着安全与溯源比规模更重要。用户不再只关心大数据,更关心数据来源、权限、被哪些模型使用过。为解决数据质量、安全与溯源问题,有效的做法是嵌入工作流的数据治理,数据管理必须融入工程流程,而不是放在独立平台里。每份成果都需要归属、溯源和权限,溯源与访问控制必须默认开启,现在还可以通过智能体介导访问,由智能体自动管控可见范围与安全使用规则。

弗劳恩霍夫研究所研究员Martin Neumann-Kipping认为,今天谈AI,必须抛弃大数据就是答案的观念,大数据热潮已经在退去,单纯收集尽可能多的数据不再是终极目标。企业需要的是有信息含量的数据,描述清晰、关联充分、上下文准确。大多数企业的问题不是数据不够,而是数据被锁在竖井里,每个竖井本身都有价值,但真正的潜力在于打通它们,把生产系统看作整体,从而建立关于系统的真实知识库。要做出优秀的AI方案,仅仅拥有数据远远不够,必须精确知道数据代表什么,需要语义描述、本体论、统一的数据语言。企业现有数据管理系统可以是很好的基础,但需要扩展语义层,跨源连接信息。AI时代的数据管理不是独立话题,而是前提条件。如果不投入精力去描述、结构化、关联数据,就永远只能做狭隘、局部的优化。如果把数据当作系统数字孪生的一部分,就能优化整个流程,而不只是孤立环节,这才是AI在工业界真正的长期价值。

几年前,英伟达CEO黄仁勋曾说,未来工程师会成为AI智能体的管理者。沿着这个方向,EDA数据管理员的需求正在快速增长,其职责是确保数据结构化、配有正确元数据、格式合规、目录清晰、权限合理等。西门子Sitapure表示,这类角色的重要性正在显著提升,它可能看起来不那么光鲜,处于设计后端,但却是基础性角色,必须有人搭建这套体系,并且需要大量投入。从企业级AI视角来看,全行业都必须加大数据管理与结构化投入,否则就是垃圾进,垃圾出。

企业规模越大,数据越容易碎片化,并购后尤其严重。是德科技Rance表示,不同部门用着不同的数据管理系统,有些甚至不用系统,只用Confluence、SharePoint、文件服务器,没有索引、没有目录、没有版本控制。当数据到处分散时,AI会出现延迟、重复,进而因数据质量、位置、可达性、算力等问题引发幻觉。找数据和数据质量本身才是很多问题的根源。过去企业没有专人来清理数据,现在必须有这类角色和数据治理团队,明确如何结构化数据、存储位置、唯一可信源、数据安全、加密、防泄漏以及算力支撑。

历史上,很多数据管理系统都运行在普通服务器或工作站上,但要真正支撑模型训练、推理和流程编排,数据必须放在高性能计算平台上。Rance表示,底层也存在IT和基础设施问题,现在大家都聚焦于如何创建和管理模型,却发现必须先整理数据、存储位置、算力资源和安全问题。把基础打好后,下一个挑战就是建立唯一可信源,并在设计流程中保留以往从未保留过的数据,用于机器学习,这会让数据量暴增,而传统IT服务器根本没有为这种海量存储做过配置。

向全新数据管理理念转型,也带来了独特的组织挑战。Rance说,以前合作的主要是工程师、架构师、CAD团队、工程管理层,现在还要加上IT、安全工程师、安全专家,在大型客户那里甚至需要法务团队参与,评估数据风险、分级规则,确保受出口管制的内容不会进入机器学习。这些工作以前由不同团队在后台分别完成,现在所有角色都要参与整体方案评估,事情明显变得更复杂。

本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。

评论
暂无用户评论