人工智能 (AI) 的蓬勃发展导致数据中心数量激增,从而推动了对运行和冷却数据中心内部服务器的电力的巨大需求。
虽然全球有超过 8,000 个数据中心,其中大部分位于美国,但未来几年这一数字将大幅增加。
根据波士顿咨询集团的估计,到 2030 年,数据中心的需求将每年增长 15% 至 20%。届时,该公司预计数据中心将占美国总电力消耗的 16%,而 OpenAI 于 2022 年发布 ChatGPT 之前的这一比例仅为 2.5%。
与此同时,国际能源署(IEA)今年发布的《 能源与人工智能》特别报告预测,到本世纪末,全球数据中心的电力需求将至少翻一番,达到约945太瓦时。这几乎相当于日本目前的用电量。
这家总部位于巴黎的组织报告称,人工智能是这一市场激增的最大驱动力,预计到 2030 年,人工智能优化数据中心的电力需求将增加四倍以上。
具体来说,在美国,从现在到2030年,数据中心的电力消耗将占到电力需求增长的一半左右。报告显示,受人工智能应用的推动,到那时,美国经济处理数据所消耗的电力将超过生产所有能源密集型产品所消耗的电力总和。
这种对能源的无止境的渴求,给人工智能的发展和应用带来了巨大的挑战。然而,令人欣慰的是,越来越多的研究人员和公司正在致力于降低人工智能的功耗,提高其能源效率。
这些努力的有趣之处在于,其中许多都利用人工智能来解决自身的能源挑战。
就在本月,一个研究小组展示了一款新型芯片,该芯片利用人工智能将大型语言模型 (LLM) 的能耗减少 50%,这标志着 LLM 在成本效益和运行可持续性方面取得了重大进展。
俄勒冈州立大学工程学院的研究人员开发了这种新型高效人工智能芯片,以解决 OpenAI 的 GPT-4 和谷歌的 Gemini 等 LLM 人工智能应用的大量耗电问题。
大型语言模型 (LLM) 是一种机器学习 (ML) 模型,它经过大量数据的预先训练,可以执行自然语言处理 (NLP) 任务,例如文本生成、摘要、简化、文本推理、语言翻译等。
目前最流行、使用最广泛的聊天机器人包括 OpenAI 的 GPT-4o、o3 和 o1、谷歌的 Gemini 和 Gemma、Meta 的 Llama、DeepSeek 的 R1 和 V3、Anthropic 的 Claude、亚马逊的 Nova、微软的 Phi 以及 xAI 的 Grok。
过去几年,LLM彻底改变了人工智能领域,使机器能够更准确地理解和生成类似人类的文本。然而,LLM 的这种演变也导致其规模呈指数级增长。
LLM 的大小(以参数数量衡量)是其能耗的主要驱动因素。这意味着模型越大,其训练和推理所需的计算能力就越大。
例如,ChatGPT-1 的参数略低于 1.2 亿个,而到了 GPT-3,参数数量激增至 1750 亿个,到了 GPT-4,参数数量则激增至大约 1.8 万亿个。
LLM 规模和能力的大幅提升意味着其能耗也以前所未有的速度增长。除了模型规模之外,用于训练这些 LLM 的硬件类型、训练过程的时长、基础设施(例如数据中心)、数据处理、模型优化以及算法效率等因素都会影响 LLM 的能耗。
因此,俄勒冈州立大学的研究人员开发出了这款新芯片。俄勒冈州立大学电气工程副教授、混合信号电路与系统实验室主任 Tejasvi Anand 表示:“问题在于,传输单个比特所需的能量并没有随着数据速率需求的增长而减少。这就是导致数据中心消耗如此多电力的原因。”
为了克服这个问题,该团队设计并开发了一种新芯片,与传统设计相比,其能耗仅为后者的一半。
Anand 和博士生 Ramin Javad 在上个月于波士顿举行的 IEEE 定制集成电路 (CIC) 会议上展示了这项新技术。该会议以论坛、小组讨论、展览和口头报告等形式举办,致力于集成电路 (IC) 的开发。集成电路 (IC) 通过在紧凑高效的封装中提供功能和处理能力,是现代电子系统的基石。
这项最新技术是在泛在连接中心(CUbiC)、半导体研究公司(SRC)和国防高级研究计划局(DARPA)的支持下开发的。Javadi 还获得了本次大会最佳学生论文奖。
Javadi 指出,对于新芯片,研究人员实际上利用了人工智能原理,减少了信号处理的用电量。
他解释道,LLM 通过有线连接(数据中心内基于铜缆的通信链路)发送和接收大量数据。整个过程需要消耗大量能源,因此一个潜在的“解决方案是开发更高效的有线通信芯片”。
Javadi 进一步指出,高速发送时,数据实际上会在接收端被损坏,因此需要进行清理。为此,大多数现有的有线通信系统都使用均衡器,但这会消耗大量功率。“我们正在利用片上人工智能原理,通过训练片上分类器识别和纠正错误,以更智能、更高效的方式恢复数据。”
虽然这是一个重大进展,但这仅仅是该芯片的初始版本。下一代芯片目前正在研发中,以进一步提高其能效。
总体而言,这项正在进行的研究展现出巨大的潜力,将对未来人工智能基础设施和数据中心运营产生深远的影响。但这当然需要该技术能够大规模成功实施,而这绝非易事。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。