AI第二波浪潮:代理式人工智能

最近,一款名为Manus的AI代理人产品引发关注,号称“全球首款通用型智能体”。它能自主执行复杂任务,如筛选简历、规划旅游、分析股票、寻找供应商等,像人一样思考和行动。虽然它还在测试阶段,但似乎预示着,AI应用范式的变革正在到来。

AI代理是新的数字劳动力 

如果说,生成式人工智能(generative AI)是2022年以来卷起的AI浪潮的第一波,那么,代理式人工智能(agentic AI)则毫无疑问是第二波。

生成式AI擅长于创造力和自动化,而代理式AI更像是数字帮手,能够处理工作流、解决问题,并在各个领域(如人力资源、软件工程、数字营销和客户服务等)中提供实时支持。

CES 2025黄仁勋在演讲中表示,我们正式进入了代理式AI的时代。他认为,“AI代理是新的数字劳动力”,“未来,每家公司的IT部门都将成为AI代理的人力资源部门”。人工智能代理产业将是一个“万亿美元级的机会”。

2025年预计将成为企业充分利用AI代理的一年。根据ChatGPT的说法,“在许多情况下,AI将接管常规或重复性的任务,从而解放人类员工,让他们专注于战略性和创造性的活动”。ChatGPT自身就处于迈向个人代理的过程中。 

2025年一开年,山姆·阿尔特曼(Sam Altman)称:“在2025年,我们可能会看到首批AI代理加入劳动力市场,并实质性地改变企业的产出。我们仍然相信,将强大的工具迭代地交到人们手中,将带来广泛分布的卓越成果。” 

接下来,市场迅即看到了OpenAI在这方面的第一次认真尝试:

1月14日,OpenAI宣布推出名为Tasks的测试版新功能,为ChatGPT增加了一些基础的自动化功能。无论是一次性提醒还是周期重复性任务,现在只需说明需求和完成时间,ChatGPT就能自动定时实现。 

1月23日,OpenAI推出一款名为Operator的通用型 AI代理的研究预览版,能够控制网页浏览器并独立执行某些操作。Operator首先面向ChatGPT的200美元包月Pro订阅用户在美国推出,公司计划未来将其集成到所有ChatGPT客户端中。

Tasks让ChatGPT在实用性上更接近Siri或Alexa,而Operator展示了传统虚拟助手所无法实现的新能力。据OpenAI介绍,Operator旨在自动化各种任务,例如预订旅行住宿、预约餐厅以及在线购物。在Operator界面中,用户可以选择多个任务类别,包括购物、外卖、餐饮和旅行等,每个类别都支持不同类型的自动化操作。

当ChatGPT用户启用Operator时,会弹出一个小窗口,显示该智能代理用于完成任务的专用网页浏览器,并附带对其执行的具体操作解释。在Operator运行期间,用户仍然可以控制自己的屏幕,因为Operator使用的是独立的浏览器。

OpenAI在支持文档中补充道:“目前,Operator无法可靠地处理许多复杂或专业化的任务,例如创建详细的幻灯片、管理复杂的日程系统,或与高度定制化或非标准的网页界面交互。”此外,出于谨慎考虑,OpenAI要求对某些任务进行监督,例如银行交易。 

Operator进入了一个高度竞争的领域,但其优势在于ChatGPT的广泛应用以及OpenAI强大的模型集成能力。然而,Google、Microsoft和Meta等公司同样拥有深厚的资源和庞大的用户基础,而Rabbit、Adept和Perplexity等初创公司则在AI自动化方面不断创新和突破。

如今的竞赛核心在于,谁能打造出最可靠、安全且高效的AI代理,并顺利融入现实工作流程。 

未来,AI代理将如何发展,以及谁能在代理式人工智能竞赛中保持领先地位,将会是人工智能产业的一大看点。 

Posted in Tech.