2024年,AI带来的十大突破与争议

来源:半导纵横发布时间:2024-12-26 15:34
AI
芯片设计
生成海报
2024年,AI产业发展如何?

2024 年将被铭记为人工智能(AI) 超越炒作并展示其多种实际应用的一年。

从苹果在生成人工智能领域的突破到量子计算的突破,从专业化的人工智能代理到具有里程碑意义的法规,这一年标志着从理论可能性到实际现实的转变,改变了我们工作、创造和解决问题的方式。

然而,不克服一些障碍就不会取得任何成就。因此,在本文中,将探讨 2024 年在人工智能发展史上留下印记的关键人工智能突破以及它们引起的争议。

2024 年十大人工智能发展

1.Apple Intelligence 发布会

2024 年,苹果将通过Apple Intelligence进军生成式人工智能领域,这一举措备受期待。在竞争对手纷纷进入市场的同时,苹果却花时间打造了一个以隐私为中心的框架,该框架可跨设备无缝集成。从增强的 Siri 功能到 Genmoji 的创建,苹果展示了人工智能如何在以数据保护为核心的同时增强用户体验。

然而,此次发布很快就暴露出平衡创新与可靠性的挑战。

数周之内,Apple Intelligence 就引发了几起引人关注的错误信息事件。这些错误被错误地归咎于 BBC News 等新闻来源,促使无国界记者组织呼吁删除该功能。他们表示:“这起事故表明,生成式人工智能服务仍不成熟,无法为公众提供可靠的信息,不应被允许在市场上用于此类用途。”

与此同时,一些技术挑战也随之出现。例如,许多 iPhone 用户无法使用承诺的功能。苹果还难以根据当地法规在中国实施该系统,而该公司在这些问题上的一贯沉默只会加剧关于人工智能是否已准备好进行主流新闻摘要的争论。

2. Nvidia 的 Blackwell 芯片

Nvidia 的 Blackwell 芯片彻底重新构想了 AI 处理架构的可能性。Blackwell 拥有2080 亿个晶体管、提供高达2.5 petaFLOPS 的性能、将超过100,000 个芯片联网。

但真正重要的不是规格,而是它们所实现的功能。该芯片能够处理数据中心规模的生成式 AI 工作流,同时能耗比其前代产品低 25 倍,这代表着效率的巨大飞跃。

早期的生产挑战导致了Nvidia 首席执行官黄仁勋坦率地承认这是“100% Nvidia 的错误”,从而造成了最初的延迟。

服务器机架过热问题和供应限制也导致需求“远高于供应”,这表明当新技术遇到现实世界的实施挑战时会发生什么。

然而,尽管存在这些障碍,微软和Meta等大型科技公司依旧纷纷争相抢占这些芯片的市场份额。

与此同时,数据中心开始重组其基础设施,以适应新技术的冷却要求。由于该芯片的成功,Nvidia 的市值飙升至 3 万亿美元以上。

3. Claude 3.5 Sonnet 开发

当 Anthropic 推出Claude 3.5 Sonnet时,业界得到了一个新模型,它不仅速度更快或更准确,而且在解决问题的方式上也更加周到。相比之下,通过这些模型进行复杂的推理让以前的模型显得很原始。

Claude 3.5 Sonnet 在内部评估中破解了 64% 的复杂编码难题,将其前身 38% 的成功率远远甩在身后。

Anthropic 还发布了Artifacts 功能,该功能改变了我们与 AI 协作的方式。它支持实时文档生成和更新,感觉更像是与技术娴熟的同事一起工作,而不是与传统的聊天机器人一起工作。

另一个重大发布是实验性的计算机使用功能,它允许 Claude 真正控制桌面环境。

所有这些都展示了人工智能可以跨应用程序处理复杂、多步骤任务的未来。

Anthropic 首席执行官达里奥·阿莫迪 (Dario Amodei)在他的文章《充满爱意的机器》中预测,人工智能可以在 5 到 10 年内实现 50 到 100 年的生物学进步。

根据 Amodei 的说法,“强大的人工智能”,即AGI,不仅将与人类智力相当,而且将“比大多数相关领域的诺贝尔奖获得者更聪明”,包括“生物学、编程、数学、工程学、写作等”。

4. 欧盟人工智能法案实施

2024年欧盟《人工智能法案》的实施标志着一个分水岭时刻——这是世界上首次全面尝试规范人工智能的发展和部署。

可以将其视为人工智能的 GDPR,但对于构建和部署 AI 系统具有更广泛的影响。

该法案基于风险的分类系统从根本上改变了我们对人工智能使用的看法。由于人工智能系统现在被分为不可接受、高风险、有限风险或最小风险类别,公司被迫重新考虑其整个人工智能开发方法。突然之间,曾经匆忙推向市场的功能需要严格的合规性评估和文档记录。

Calypso AI 首席技术官 James White表示,“在欧盟运营的组织的影响可能取决于公司如何使用人工智能模型,以及该用例属于该法案所确定的风险类别。这些类别(禁止、高风险、低风险或无风险)只是描述,而不是定义,对于边缘案件来说,仍然有点模糊。但这个层次结构是该法案的核心,决定了将应用的低监管审查水平以及必须满足的合规要求。”

该行业面临的适应挑战十分严峻,罚款金额从 750 万欧元到 3500 万欧元不等(或高达全球营业额的 7%)。这意味着企业必须开始调整其 AI 开发以适应新要求。

5.OpenAI 的 o1 模型

当OpenAI于 2024 年 9 月推出o1 模型时,它引入了一种全新的 AI 推理方法。虽然之前的模型专注于快速响应,但o1 引入了一种“思维链”方法,使其能够逐步思考问题,然后再提供答案。

该模型在科学、编程和数学方面表现出非凡的实力,在完成具有挑战性的任务时表现堪比博士生的水平。

OpenAI 还通过该模型引入了“reasoning_effort”API 参数。该参数让用户能够更好地控制模型的思考时间,同时使用的推理令牌比预览版少 60%。

这种方法也带来了一些重大的权衡,例如扩展的推理过程导致模型难以完成创造性任务。

6.谷歌Gemini 2.0

Gemini 2.0是 Google 对 AI 如何处理我们世界的大胆重新构想。它由庞大的 Trillium 基础设施(一个由 100,000 多个专用芯片组成的网络)提供支持,引入了一种统一的方法来处理文本、图像、音频和视频,这让之前的多模式尝试显得很原始。

技术架构确实开辟了新局面。Gemini 2.0 不再将不同类型的数据类型视为单独的流,而是通过统一的嵌入空间同时处理所有内容。凭借原生的图像和音频生成功能,它为 AI 理解树立了新标准。

然而,谷歌最有趣的举措不仅仅是技术上的,更是战略上的。引入Jules等专门的代理进行代码开发,以及引入Mariner 项目进行网络导航,标志着谷歌不再采用千篇一律的人工智能。

当竞争对手竞相打造更大的模型时,谷歌却押注于专业化的卓越。

7.Perplexity AI 的崛起

Perplexity AI经历了令人难以置信的增长,从一家估值 5.2 亿美元的初创公司成长为估值90 亿美元的巨头。通过重新构想用户与信息的互动方式,他们从根本上改变了用户对搜索的期望。

增长数字令人印象深刻:每月用户数量将从2023 年底的400 万增至2024 年初的1500 万;
每日查询量从250 万增至 2000 万。

这一成功也引发了关于内容权利和归属的激烈争论,这些对于当今的人工智能系统来说变得越来越重要。

《福布斯》和新闻集团等主要出版商提起诉讼,指控“窃取大量版权材料”。

这场争议在 Perplexity 和新闻集团之间的法律纠纷中达到了顶峰。Perplexity 通过与出版商引入收入分成模式来应对这场争议,试图在创新和内容权利之间取得平衡。

8. Agentic 工作流和 AI 代理

如果说 2023 年是人工智能聊天机器人的时代,那么 2024 年则是自主人工智能代理的时代。这一转变令人瞩目:Salesforce 的 Agentforce 2.0、SAP 的 Joule、CrewAI和谷歌的 Project Astra向我们展示了人工智能如何超越简单的响应,真正自主地完成复杂的任务。

企业界热切地接受了这一转变。Agentforce 2.0 展示了人工智能如何增强 CRM 系统的推理和集成,而 SAP 决定使用开源 LLM为 Joule 提供支持,则展示了一种可定制企业人工智能的新方法。这些数字同事能够理解上下文并执行多步骤工作流程。

由于这些系统可以自主运行,而且功率很大,许多人对其控制和安全性提出了严重的质疑。

随着这些代理的能力越来越强,辅助和自动化之间的界限变得越来越模糊,迫使组织重新考虑其人工智能实施和治理方法。

9.谷歌的Willow量子芯片

谷歌的Willow 芯片拥有105 个相连的超导量子比特,工作温度略高于绝对零度,实现了量子研究人员近三十年来的追求。

这项技术成就令人惊叹:仅用五分钟就能完成当今最快的超级计算机需要十的亿亿年才能完成的计算。但真正让 Willow 脱颖而出的是它在纠错方面的突破。使用更大的纠错码,该系统可以使单个逻辑量子位保持稳定一小时——与以前每隔几秒钟就会失效的设置相比,这是一个巨大的进步。

然而,实现实用量子计算的道路仍然充满挑战。尽管 Willow 显示出巨大的潜力,但它仍然需要数百万个量子比特来解决重大的工业挑战。

极端的冷却要求和维持量子态的困难对扩展构成了严重的障碍。

10.谷歌Veo 2

当Google DeepMind于 12 月初推出Veo 2时,他们提高了AI 视频生成的标准。

当竞争对手还在为基本的动画而苦苦挣扎时,Veo 2 已经制作出了超过两分钟的 4K 分辨率视频,并配有复杂的摄像技术和电影效果。

技术成果令人印象深刻。例如,Veo 2 展现了更好的物理建模、更细致入微的人类表情以及更好的运动和光照处理。

在与其他领先模型的正面比较中,人类评分者一致认为 Veo 2 的输出更现实、更接近他们的预期提示。

然而,谷歌的谨慎推出向我们展示了部署如此强大的人工智能视频技术时存在的各种挑战。通过实验性的 VideoFX 工具,访问仍然仅限于 18 岁以上的美国用户,该工具最初将输出限制为 720p 分辨率和 8 秒剪辑。Veo 2 生成的每个帧还包括SynthID 的隐形水印,我们现在知道这对合成媒体很重要。

局限性同样明显。尽管 Veo 2 性能出色,但它在处理复杂场景和快速动作序列时却举步维艰。

当这些挑战与 Google 的慎重扩张方式结合起来时,用户就可以开始认识到如何平衡技术创新和负责任的部署。

本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。

评论
暂无用户评论