近日,D2S 首席执行官 Aki Fujimura、ASML Brion 负责人张友平、KLA 高级副总裁兼 BBP 和光罩产品部门总经理 Yalin Xiong 以及Synopsys工程副总裁 Kostas Adam 一起讨论了 GPU 加速对掩模设计和生产以及其他工艺技术的影响。以下是该对话的摘录。
机器学习和 GPU 的采用似乎同步增长。是机器学习的需求推动了 GPU 的采用,还是 GPU 为机器学习创造了机会?
Adam:人工智能/移动计算革命是 GPU 发展的重要推动力,而人工智能/移动计算的重大进展也得益于更强大的 GPU。鉴于其所产生的巨大动力,这种影响现已得到广泛认可。因此,我们行业内的活动也随之增加,包括硬件的定制化、芯片数量的增加以及节点复杂度的提高。我们目前面临的情况是,处理单个掩膜的复杂性显著增加。我们用处理一平方毫米掩膜所需的 CPU 小时数来衡量这种计算复杂性。所需的 CPU 小时数越多,相关成本就越高。随着计算挑战的增加,这一指标也在持续上升。此外,这些复杂的解决方案现在需要多层处理,而不仅仅是单层掩膜,这进一步增加了我们任务的复杂性。
为此,我们中的许多人正在利用机器学习来有效管理和驾驭这种复杂性。通过结合 ML,我们可以加速我们所依赖的物理模拟。从本质上讲,我们利用机器学习从这些物理模拟中学习,然后应用在这些模拟器上训练过的更快的 ML 模型。这样,我们就能加快整个模拟过程,更快地得出最终解决方案。我们在采样结果上运行密集模拟,通过深度学习模型从中学习,然后应用这些知识来加快多个掩模的处理过程。因此,虽然我们不是人工智能和 ML 增长的主要推动者,但我们肯定会从这些技术中受益,聪明地采用和调整这些技术,以满足我们在半导体行业的特定需求。
Zhang: GPU 使机器学习和人工智能的广泛应用变得更加实用。基于 CPU 的复杂神经网络训练一直是一个令人头疼的缓慢过程,而且仅限于极少数用途。然而,有了 GPU,这些任务只需几个小时就能完成,这极大地改变了不同应用的可行性。得益于 GPU 成本的降低和效率的提高,从事各种项目的可行性大大提高。这种效率使我们在工作中更具探索性。现在,将机器学习应用到更广泛的应用中已变得切实可行,因为成本门槛大大降低了。所有厂商都已接受这一转变,将机器学习模型和算法应用于各种应用中。如果没有 GPU 的帮助,不断上升的成本和复杂性几乎不可能实现这一点。至于处理复杂计算,方法也发生了转变。以前,由于成本过高,人们可能不会考虑执行某些类型的计算密集型任务。现在,有了 GPU,我们可以卸载这些任务,大大加快速度,或者训练复杂的神经模型,以获得更好的结果。这使得机器学习应用不仅实用,而且成本低廉,并可广泛使用。
Xiong:从检测设备的角度来看,利用 GPU 的主要原因集中在深度学习应用上。过去,GPU 在灵活性和成本之间的权衡并不那么明确。然而,随着深度学习越来越多地集成到检测算法中,使用 GPU 已成为一个显而易见的决定。深度学习需要强大的计算能力,而 GPU 完全有能力提供这种能力。这使我们能够更高效地处理复杂数据和执行复杂分析。
Fujimura: 一般来说,GPU 的应用范围很广,包括模拟自然和图像处理。深度学习的兴起大大加快了 GPU 的应用。以检测为例,对自动分类等应用来说是一个很好的例子。人类会疲劳,但机器不会,这就提高了效率,减少了错误。在识别任务中,比如识别缺陷或对物体进行分类,深度学习的作用举足轻重。例如,六年前,区分猫和狗的图像就是深度学习应用的经典案例。同样,通过深度学习,识别材料或产品中不同类型的缺陷也得到了极大提升,这说明了深度学习的实用价值。基于GPU的计算尤其能增强深度学习网络的训练。事实证明,深度学习尤其适用于需要迭代优化的软件。例如,在通常需要 50 次迭代的过程中,深度学习可以加快速度,让我们通过推理跳过前 30 次迭代,从而使过程更快。
在回答是机器学习的需求推动了 GPU 的应用,还是反之亦然(即先有鸡还是先有蛋)的问题时,深度学习得益于经济上可行的 GPU 的出现。经济实惠的 GPU 实现了计算的民主化,使广大用户都能获得强大的处理能力。例如,40 年前,一台 Cray-2 超级计算机(额定功率为 1.9 GFLOPS)可能需要花费 150 万美元,而如今,研究人员只需花费大约 2000 美元,就能为个人电脑购买到 42,600 个单精度 GFLOPS GPU。这种便利性改变了游戏规则,让更多个人和组织有能力从事高级计算任务,包括模拟自然过程。神经网络也是我们大脑中的自然过程,因此 GPU 也擅长深度学习也是合情合理的。计算的民主化不仅推动了深度学习的发展,也改变了技术创新的格局。
制造商将 GPU 纳入工艺线需要哪些条件,又面临哪些挑战?
Fujimura: 在我看来,将 GPU 纳入生产线所带来的挑战微乎其微,尤其是在软件供应商方面。我们都要为 GPU 提供支持,并且已经在我们的流程中广泛使用 GPU。设备供应商也已经加入进来。台积电等公司已经将 GPU 无缝集成到他们的设备中。在硬件集成方面,制造商只需在其工艺中添加服务器或其他能够支持 GPU 技术的硬件即可。例如,在最近的 Synopsys 技术论坛上,台积电讨论了他们大量的 GPU 基础设施,强调了他们的 “大型 GPU 农场”,以及由于 GPU 提供的优势而进一步扩大这种能力的计划,特别是对于涉及曲线掩模形状的处理。总之,对于希望有效处理曲线掩膜形状的制造商来说,主要要求是使用 GPU 加速,而许多制造商已经开始有效地使用 GPU 加速。
Zhang:从深度学习模型训练到检测应用,GPU 已经在各种应用中得到广泛应用。然而,将 GPU 集成到生产环境中的决定取决于几个因素。在经济上,整合必须具有经济意义。如果采用 GPU 不能降低成本,往往会犹豫不决。此外,还有更广泛的应用考虑因素,例如过时问题。GPU 供应商通常每隔几年就会更新一次硬件,淘汰老一代产品。这种快速的周期可能会破坏长期的可用性和兼容性,因为旧型号变得不可用,而新型号可能无法提供一致的输出,尤其是在一致性至关重要的应用中,如光学近场校正(OPC)。
此外,还有集成技术方面的问题。最初为 CPU 编写的软件可能需要进行大量修改才能在 GPU 上有效运行。这种调整可能需要软件供应商和客户付出巨大的努力,他们可能需要专门为 GPU 的使用重写现有代码。决定将哪些进程卸载到 GPU,将哪些进程保留在 CPU 上是集成的关键部分,因为并非所有任务的转换都具有成本效益。此外,GPU 的集成还涉及有效处理与 CPU 之间数据通信的额外开销,而这在仅使用 CPU 的设置中是不存在的。在进行这种过渡之前,客户需要评估投资是否能在降低成本和提高效率方面获得回报。虽然 GPU 集成可以带来显著的效益,但在决定是否采用这种技术时,必须仔细考虑其经济合理性、过时的可能性、软件重写的必要性以及总体投资回报。这些因素共同导致一些企业对全面采用 GPU 持谨慎态度。
Adam: 客户对将 GPU 集成到生产环境中非常了解和关注。他们既兴奋又谨慎。采用 GPU 的决定在很大程度上取决于此举的成本效益。每个客户都会计算自己的拥有成本,以及投资 GPU 在经济上是否可行,除了考虑 CPU 与 GPU 的成本比较外,还要考虑其他各种因素。他们考虑的一个重要方面是生产线的长期稳定性。例如,如果一条生产线预计要稳定运行 10 年,那么客户就需要确保在整个期间都能采购到所需的 GPU。此外,过渡还涉及重大的软件调整。客户需要评估调整其软件框架以兼容 GPU 所需的投资。这包括考虑不同电子设计自动化(EDA)供应商提供的编程层,并确定哪一个最符合他们的需求。同样重要的是要考虑那些需要长期高稳定性的应用,如光学近似校正(OPC)和反向光刻技术(ILT)。GPU 凭借其无与伦比的计算能力,在训练模型和图像到图像比较等任务中已被广泛接受,但在 OPC 或 ILT 等更关键的应用中,是否完全采用 GPU 仍在斟酌之中。
在哪些领域您看到了 GPU 加速的机会,但尚未得到应用?
Adam: 对于未来的 GPU 加速应用,我们正在考虑一些创新的想法。不过,这些想法的实现还取决于一些尚待展开的因素。我们的团队由才华横溢的人才组成,他们不仅为眼前的未来制定计划,还着眼于未来五年甚至更长的时间。随着 GPU 架构的不断发展和采用率的不断提高,无疑会出现新的、引人入胜的机遇。这些发展前景广阔,我们正密切关注着这一趋势,以确定可以进一步利用 GPU 加速的领域。
Zhang: 人工智能的总体前景涉及操作流程的重大转变。具体来说,我们正在研究人工智能如何借助 GPU 的计算能力,取代目前由人类执行的任务。这不仅仅是用 GPU 取代 CPU。而是利用 GPU 增强的处理能力,结合机器学习的进步,实现复杂任务的自动化。虽然这种转变可能还需要一段时间,但技术发展的速度表明,这种转变可能会比预期的更快。我们以前见过快速转型,就像移动技术快速发展并显著改变了日常生活和业务运营的许多方面一样。一些行业已经开始采用这种人工智能驱动的应用。因此,我们确实有机会考虑如何进一步利用 GPU 加速的人工智能来取代或增强人类在某些领域的工作,从而有可能提高各个领域的效率和创新。
Xiong:近年来,机器学习的普及凸显了众多机遇的存在。问题不在于是否存在机遇,而在于如何确定机遇的优先顺序。虽然某些应用因其直接相关性或潜在影响而处于开发的最前沿,但这并不意味着其他领域不为人知。它们只是被视为次要或第三优先领域。各个领域的专业人士对机器学习的持续关注和日常思考,反映了他们对机器学习潜力的广泛认可。每个人都在思考如何将这些技术整合到自己的业务中,这表明随着优先级的变化和发展,机器学习在探索较少的领域的应用也会随之变化。
Fujimura: 半导体掩模制作的主流方法主要基于传统的曼哈顿风格,但人们一致认为,向曲线掩模制作的转变即将到来。鉴于 GPU 的超强处理能力和处理复杂计算的能力,这种转变很可能需要使用 GPU。向曲线设计的转变不仅涉及技术方法的转变,还涉及支持这些设计的计算数学的转变,也就是我所说的'有用的浪费'。此外,深度学习在各个领域的应用日益增多,进一步放大了 GPU 的重要性。深度学习本质上需要大量的计算资源,而 GPU 完全有能力提供这些资源。因此,随着我们在掩模制造领域实现这一转变,并继续扩大深度学习的应用,GPU 在电子设计自动化 (EDA) 中的价值和必要性变得更加明显。这是一个关键的转变,它突显了我们行业不断发展的需求,也彰显了 GPU 在满足这些需求方面日益重要的作用。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。