
人们普遍认为先进材料在实验室中的表现与在生产中的表现相同,但这种假设现在正面临严峻挑战。
通常情况下,实验室检测结果会成为产品规格,进而成为鉴定基准。而鉴定基准又会成为评判现场性能的标准。在行业发展的大部分历史时期,这套推论体系都相当有效。当时材料种类较少,叠层结构较为简单,层间相互作用也足够可预测,因此规格表中的数据能够合理地反映实际生产情况。
但随着异构集成从工程上的新奇想法发展成为高性能计算的主流架构,单个封装中的材料数量急剧增加。它们之间的相互作用更加复杂,影响也更大,而且这些封装的运行环境比当初设计用于验证其性能的测试条件更为严苛。
“现在的情况和过去不一样了,以前只要有了单个芯片,了解了它的工艺流程,就可以直接投入生产,” Amkor芯片和FCBGA集成副总裁Mike Kelly说道。“现在大多数封装在机械结构上都相当复杂,电气方面更是如此。要开发出一个完善可靠的解决方案,需要大量的现场测试和开发工作。这一点的重要性怎么强调都不为过。”
一种材料在孤立环境或受控实验室条件下的表现,越来越难以准确预测其在与其他不同材料共存、经历多阶段热历史以及需要在数百万小时运行中保持可靠性能时的性能。如今,先进人工智能硬件所需的封装在机械和电气方面都比前几代产品更加复杂,曾经使设计决策变得简单的生产经验如今已不再适用。简而言之,实验室与工厂之间的差距并非新鲜事,但正在日益扩大。
材料在生产过程中出现不良性能的最直接解释,也是最令人难以接受的解释。如今构建的系统过于复杂,任何人都无法事先进行全面建模,而导致问题的相互作用往往是任何一个学科都未曾想到要检查的。
“当你把各种不同的材料、各种不同的硅片集成在一起时,所有这些都会带来固有的变异性,”Critical Manufacturing 的项目经理 Tiago Tavares 说。“指望我们能在设计阶段就预测并控制所有这些变异性是不现实的。你需要模拟几十年才能涵盖所有情况。这种方法已经行不通了。”
半导体制造一直以来都涉及对变异性的管理,但如今的变化在于,单个封装内相互作用的因素数量激增,且这些相互作用的耦合程度也显著提高。传统的单芯片采用单一材料组合、单一工艺流程,以及一套经过数十年生产经验积累而具有相当可预测性的相互作用。而现代多芯片封装,例如堆叠式存储器、异构芯片组和有机中介层,则随着堆叠中每引入一种新材料,潜在的相互作用就会呈爆炸式增长。
“你们在夹层材料里越来越多地使用一些比较特殊的材料,”塔瓦雷斯说。“这就好比做三明治,你根本无法预知火腿和奶酪的成分会有什么变化。所以,流程执行和流程设计仍然至关重要,但它们已经远远不够了。你们需要持续不断地监控生产过程。”
由于封装组装方式的根本性结构转变,监控难度进一步增加。在整体式工艺流程中,工艺工程师可以将每个步骤视为一个相对独立的优化问题:调整蚀刻配方,测量结果,然后再次调整。由于一个步骤的改变对后续步骤的影响有限,因此自由度是可控的。但在异构封装中,这种独立性不复存在。每个工艺步骤都会继承前一步骤的机械、热学和化学历史,每一次调整都会产生影响,而这些影响往往要到很久以后才能显现。
塔瓦雷斯补充道:“你不能再像分析孤岛一样分析一个过程了。其中的相互作用越来越明显,也越来越复杂。因此,你不能仅仅因为改变了A步骤就贸然做出改变,而不去考虑B、C、D步骤之后会发生什么。”
如果复杂性问题仅仅是运行更全面的模拟,那么原则上是可以解决的,即使计算成本很高。模拟工具的构建基于对哪些效应被视为一级、二级或可忽略效应的明确选择。在大多数情况下,这些选择是合理的。但是,先进封装中遇到的情况并非总是典型的,在简单封装中出现的二级效应,在更复杂的封装中可能成为主要的失效机制。
Synopsys产品营销总监Marc Swinnen表示:“机械应力不仅会影响可靠性,还会改变受力器件和导线的电气参数。但机械应力和电气应力很少被同时考虑。任何仿真器都基于对哪些效应需要纳入考量的基本选择。由此产生的问题是,在某些情况下,一个微小的影响实际上会被放大很多。”
因此,封装器件可能通过了电气和机械仿真,但在生产中仍然会失败,因为这两种效应之间的相互作用从未被建模。这是由于仿真工具的历史发展方式造成的,这些工具由一些团队开发,而这些团队在相邻领域的专业知识有限,因此只针对特定的物理领域进行优化。芯片设计师没有接受过电磁仿真方面的培训,封装工程师也没有接受过静态时序分析方面的培训。这些领域之间的界限,恰恰成了模型与现实最容易出现偏差的地方。
“芯片、封装和电路板的设计通常是分开进行的,但它们之间却有着密切的联系,”斯温宁说道。“这种联系往往被大量的安全裕度所掩盖,这些安全裕度是为了应对连接芯片、封装和电路板可能带来的未知影响。但安全裕度并非没有代价。它们会降低性能并增加成本。”
即使物理模型设定正确,仿真也难以有效处理变异性问题。例如,在标称温度下性能符合规格的设计,在受到相邻部件的热梯度影响时,其性能可能会发生改变。此外,一种材料在制造装配过程中可能承受远超实际应用环境中的应力,即使其机械应力极限被设定为特定值。这些变量在生产过程中可能同时出现,即使使用先进的仿真工具,也很难对其进行全面验证。
仿真挑战背后隐藏着一个更为根本的问题。用作仿真输入的材料属性值通常是错误的,或者至少是不完整的,而如果没有制造商不愿分享的数据,这些问题很难得到纠正。
知识产权问题是弥合仿真与生产实际情况之间差距的核心障碍之一。仿真工具从数据库中获取材料属性,这些数据库汇总了已发表的测量数据、科学文献或代工厂提供的规格说明。对于硅和铜等特性明确的材料,这些数据库相当准确。但对于新型材料,例如新型玻璃成分、特种介电材料和专有聚合物粘合剂,数据库条目稀少,有时甚至过时,偶尔还会出现错误。
Synopsys产品管理负责人郎林表示:“仿真工具会从互联网或科学测量数据中获取一些通用属性,或者使用代工厂提供的数据。制造商必须向我们的仿真工具提供或披露其材料的特定属性,这样我们才能说仿真结果具有良好的相关性。否则,就不存在相关性。”
问题在于,最精确的材料属性数据往往也是最具商业敏感性的。一家玻璃基板制造商花费数年时间研发出特定的材料成分和抛光工艺,却没有动力将该材料的精确机械和热学性能数据分享给整个行业。这些数据所蕴含的竞争优势正是其研发投入的根本所在。结果就是结构性错配。最需要精确材料数据来构建可靠模拟的工程师们,却只能使用精度最低的版本,而掌握精确数据的机构也有充分的理由不予公开。
对于处于包装工艺前沿的新型材料而言,这个问题更为根本。对于成熟材料,其材料性能随温度变化的非线性行为已得到充分理解,但对于新型材料,这种行为往往难以捉摸。
林说:“你必须对材料的力学性能随温度变化的非线性行为进行建模。我们可能很了解纯铜。但对于具有某种改性材料特性的玻璃来说,其温度依赖性会是什么样的呢?它可能以我们未知的方式呈现非线性特征。”
当现场发现实验室遗漏的问题时,这些建模缺陷的后果就会在生产中显现,有时甚至会进一步蔓延到下游,导致难以追溯根源的现场故障。故障到达现场的方式存在着一定的规律。主要原因很少是材料本身未能达到标称规格,而是制造过程中引入的潜在缺陷,而这些缺陷并非认证流程所能检测的。
“许多现场问题都源于制造过程中引入的潜在缺陷,”安靠公司负责引线键合和BGA产品的副总裁Prasad Dhond表示。“污染、工艺偏差和设备故障都是潜在缺陷的来源,这些缺陷在现场可能会加剧。除了产品认证之外,生产控制以及工厂和装配线的运营方式也至关重要。”
难点在于,潜在缺陷并非总是一开始就以缺陷的形式显现出来。最终会导致良率损失的信号可能在工艺流程早期以模糊不清的形式出现:例如轻微的颜色变化、光学异常,或者看起来更像是干扰而非失效机制的现象。早期可见的现象与后期会产生影响的因素之间的联系,只有在积累了足够的数据后才能明确。
这是复杂制造流程的一个结构性特征。缺陷显现、可测量以及导致故障的时间点各不相同,通常相隔数周的处理时间和数十个中间步骤。鉴定测试位于该流程的末尾,仅询问器件是否合格。它并不探究故障的根源,而这才是真正能够弥合实验室模型与工厂实际生产之间差距的关键所在。
“你会发现缺陷,有时很难发现,分析结果可能只显示为变色。如果只是外观上的瑕疵,其实没什么大碍,” Microtronic的应用总监Errol Akomer说道。“但当这批产品进入检测阶段时,就检测不合格了。这样你才能知道哪些缺陷会造成损失,哪些不会,哪些可以忽略,哪些需要仔细检查,因为确实存在问题。”
生产中故障分析的经济性问题使这一挑战更加严峻。当芯片在现场发生故障时,人们的第一反应往往是更换芯片并继续生产,而不是将其回收进行分析。原本可以帮助工程师了解故障原因并构建更完善模型的数据,却随着故障部件一起被丢弃了。
Amkor公司的Kelly表示: “只有当有故障发生时,收集数据来确定故障原因才有意义。 故障越少,数据越少,模型就越不准确。这是一个悖论。在某个阶段,你会停止建模,开始构建,然后在早期生产环境中不断改进,最终达到你真正想要的目标。但仍然存在差距。”
案例研究揭示差距:在生产线中间金属化过程中引入钼来替代钨,这说明了从实验室到制造环节的差距,而这与封装无关,却与表征材料和集成材料之间的根本区别息息相关。
在逻辑、DRAM 和 NAND 等器件目前追求的小尺寸特征范围内,钼相比钨具有显著的电阻率优势。更短的平均自由程意味着钼能够在更小的尺寸下充分发挥其导电优势,而钨则越来越难以做到这一点。此外,由于钼直接粘附在氧化层上,不会渗透到介电层,因此无需单独的阻挡层和衬垫层,从而使更多可用空间能够填充功能金属,而不是高电阻率的支撑材料。在实验室中,根据单元工艺验证的关键指标进行测试,钼的性能表现良好。
但将新材料投入生产则是一个不同的问题。开发单元工艺——包括沉积工具、薄膜性能、均匀性和颗粒行为——需要材料工程师和工艺工程师的通力合作。单元工艺开发无法在获得生产数据之前解决的是,新材料在特定客户的工艺流程、周围材料和集成方案中的具体表现。
“当我们进入测试阶段,客户开始尝试采用这款薄膜时,真正的挑战在于如何将薄膜集成到他们的工艺流程中,” Lam Research公司副总裁兼总经理 Kaihan Ashtiani 表示。“薄膜的各项要求,例如运行速度、触点填充效果、电阻率是否符合规格、均匀性以及颗粒行为——这些都是我们在设备开发方面需要关注的。但如何将薄膜集成到客户现有的工艺流程中,才是真正需要学习的地方。DRAM、NAND 和逻辑芯片的要求各不相同,这些都是我们在进入测试阶段乃至最终量产阶段时面临的挑战。”
关键不在于钼本身存在任何根本性缺陷,而在于任何新材料在生产中的表现都取决于其与特定工艺环境的相互作用,而这种环境无法在材料表征的开发环境中完全复制。每个客户的集成都有其自身的热预算、相邻材料和工艺顺序限制。在单元工艺开发中看似微不足道的薄膜特性,一旦与下游特定的蚀刻化学反应发生相互作用,或者沉积在经过一系列实验室从未模拟过的预处理步骤的表面上时表现出与预期不同的行为,就可能成为首要考虑因素。Lam公司多年来在钼的单元工艺开发上投入巨资,最终获得了特性明确的薄膜。但它无法获得预先表征的集成方案,因为每个集成方案都因客户和器件类型而异。实验室结果与生产环境的最终交汇点,正是差距所在。
面对这些挑战,业界并未袖手旁观。目前,大量的工程研发工作正致力于通过机器学习来构建虚拟世界和物理世界之间更紧密的联系,从而探索纯粹基于物理建模无法触及的设计空间,并将制造车间视为模型校准的持续源泉,而非下游终点。
然而,不受约束的机器学习应用于制造数据时,它本身并不了解它所处的物理空间,这意味着它可以在其训练数据中进行激进的优化,但产生的结果却会在生产中失败,而失败的原因正是该模型从未被训练去考虑的。
“你可以用现有的数据集进行训练,但机器学习实际上并不了解它所处的空间,也不知道如何在该空间内进行优化,”Lam Research旗下Semiverse Solutions的总经理Joseph Ervin说道。“使用虚拟硅可以为机器学习空间引入约束和物理规律,从而指导工艺步骤和参数在哪些方面能够真正取得成果。”
该方法包括构建正在建造的设备的三维虚拟表示,将其与实际生产过程中的在线计量数据对齐,并使用对齐的虚拟模型来指导机器学习优化,同时针对多种良率失效模式进行优化。
数据问题依然难以解决。弥合实验室与工厂生产之间差距所需的数据至少在理论上是存在的。真正的挑战在于,收集、解读这些数据并将其与正确的工程决策联系起来,需要一定程度的机构知识和协作意愿,而这方面目前仍在发展之中。
“人们仍在了解各种影响和组合,”关键制造公司的塔瓦雷斯说。“这需要一段时间才能被人们接受。数据是存在的,但首先你需要知道自己在寻找什么。数据并不等同于信息。将数据转化为信息的能力仍然是一个挑战。”
用于弥合实验室到工厂差距的工具正在不断改进。我们拥有更完善的仿真框架、受物理约束的机器学习、更丰富的在线计量技术以及更先进的数字孪生模型。然而,这些新环境下需要发挥作用的材料确实是全新的,它们之间的相互作用也仅被部分理解,而用于可靠表征其在生产中性能的经验基础仍在积累之中。这种差距的存在是因为材料应用的速度超过了我们充分理解其后果的速度。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。
