OpenAI正全力投入目前人工智能领域最热门的趋势:AI agents,即AI智能体,能代表用户完成复杂、多步骤任务的工具。该公司首次推出了ChatGPT智能体,并将其宣传为一种能使用自己的“虚拟计算机”为用户完成工作的工具。
在一次演示中,ChatGPT智能体的产品负责人Yash Kumar和研究负责人Isa Fulford表示,它由OpenAI专门为该产品开发的新模型提供支持。该公司表示,这款新工具可以执行诸如查看用户日历以向其简报即将到来的客户会议、规划和购买食材制作家庭早餐,以及根据其对竞争公司的分析创建幻灯片演示文稿等任务。
ChatGPT智能体背后的模型(尚无具体名称)通过强化学习在需要多种工具的复杂任务上进行训练,如文本浏览器、视觉浏览器和用户可以导入自己数据的终端。OpenAI表示,ChatGPT智能体结合了其现有AI工具Operator和Deep Research的功能。
为了开发这款新工具,该公司将Operator和Deep Research背后的团队合并成一个统一的团队。Kumar和Fulford透露,新团队由产品和研究部门的20到35人组成。
在演示中,Kumar和Fulford展示了ChatGPT智能体的潜在用例,例如要求它通过连接Google日历查看用户何时有空闲的晚上来规划约会之夜,然后交叉引用OpenTable来查找某些类型餐厅的空位。他们还展示了用户如何通过添加(例如)另一个要搜索的餐厅类别来中断该过程。另一个演示展示了ChatGPT智能体如何生成一份关于Labubus与Beanie Babies崛起的调研报告。
Fulford表示,她喜欢将其用于在线购物,因为Deep Research和Operator背后的技术组合效果更好,也比单纯使用Operator进行该过程更彻底。Kumar则表示,他已开始使用ChatGPT智能体来自动化生活中的一小部分,例如每周四请求OpenAI的新办公室停车位,而不是周一才想起请求但却没有停车位的情况。
Kumar表示,由于ChatGPT智能体可以访问“一整台电脑”而不仅仅是浏览器,他们“大大增强了工具集”。
然而,根据演示,该工具可能会有点慢。当被问及延迟时,Kumar表示他们的团队更专注于“优化困难任务”,并且用户不应该坐着观看ChatGPT智能体工作。
Fulford说:“即使需要15分钟,半小时,与你自己做需要的时间相比,这也是一个很大的提速。”她补充说,OpenAI的搜索团队更专注于低延迟用例。“这是那种你可以在后台启动,然后回来查看的事情。”她还表示,在ChatGPT智能体做任何“不可逆转”的事情,比如发送电子邮件或进行预订之前,它会先征求许可。
由于该工具背后的模型能力有所增强,OpenAI表示已激活了为“高生物和化学能力”创建的安全防护措施,尽管该公司表示没有“直接证据表明该模型能够有效帮助新手制造严重的生物或化学危害”(以武器形式)。Anthropic在2024年5月为其Claude模型Opus 4的发布激活了类似的安全防护措施。
当被问及该工具是否允许执行金融交易时,Kumar表示这些操作“目前”已被限制,并且还有一项额外的保护措施称为“观察模式”(Watch Mode),即如果用户导航到某些类别的网页(如金融网站),他们就不能离开ChatGPT智能体正在操作的选项卡,否则该工具将停止工作。
OpenAI将从今天开始向Pro、Plus和Team用户推出该工具——在工具菜单中选择“agent mode”或输入“/agent”即可访问——该公司表示将在今年夏天晚些时候向ChatGPT Enterprise和Education用户提供。欧洲经济区和瑞士目前没有推出时间表。
AI智能体的概念多年来一直是行业热门趋势。开发者们正在努力实现的理想是类似于钢铁侠的J.A.R.V.I.S.,一个可以执行特定工作职能、查看人们的日历以找到安排事件的最佳时间、根据朋友的喜好购买礼物等等的工具,但目前,它们在辅助编码和编译研究报告方面仍有些受限。
“AI智能体”这个词在2023年开始在投资者和科技高管中变得更加常见,并迅速流行起来,特别是在金融科技公司Klarna于2024年2月宣布,其自己的AI智能体在短短一个月的运营中处理了三分之二的客户服务聊天——相当于700名全职人类员工。此后,亚马逊、Meta、谷歌等公司的高管开始在一次又一次的财报电话会议中提及他们的AI智能体目标。从那时起,AI公司一直在进行战略性招聘以实现这些目标:例如,谷歌上周聘请了Windsurf的首席执行官、联合创始人以及一些研发团队成员,以帮助进一步推进其智能体型AI项目。
OpenAI首次推出ChatGPT智能体之前,其在今年1月发布了Operator,该公司将其宣传为“一个可以访问网络为你执行任务的智能体”,因为它经过训练,能够处理互联网上的按钮、文本字段等。这也是人工智能领域更大趋势的一部分,大大小小的公司都在追求能吸引消费者注意并理想地成为习惯的AI智能体。去年10月,亚马逊支持的AI初创公司Anthropic发布了一款名为“Computer Use”的类似工具,该公司将其宣传为一款能像人类一样使用电脑为用户完成任务的工具。包括OpenAI、谷歌和Perplexity在内的多家AI公司也提供了一款AI工具,这三家公司都将其命名为Deep Research,表示该AI智能体可以撰写关于用户想要的任何主题的大规模分析和研究报告。
本文转自媒体报道或网络平台,系作者个人立场或观点。我方转载仅为分享,不代表我方赞成或认同。若来源标注错误或侵犯了您的合法权益,请及时联系客服,我们作为中立的平台服务者将及时更正、删除或依法处理。