最近读了不少跟AI Agent相关的文章,也陆续翻译了一些与Agent相关的材料,但在翻译的时候,我发现对于 AI Agent 和Agentic AI System 这两个概念究竟有什么区别,好像业界并没有一个统一的定义,翻译时到底什么时候用中文“AI代理”什么时候用“智能体”也不确定,直到这周我读了这篇在 arxiv 上刚发布不久的论文-《AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges》,才有种豁然开朗的感觉。
这篇综述性论文的主要作者Ranjan Sapkota 和 Manoj Karkee来自美国康奈尔大学(Cornell University)的生物与环境工程系(Department of Biological and Environmental Engineering),论文旨在严格区分“AI Agents”与“Agentic AI”这两个在后 ChatGPT 时代日益受到关注的概念。其主旨是提供一个结构化的概念分类法、应用场景映射和挑战分析,以厘清两者在设计理念和能力上的差异,它希望解决的问题是当前领域内对于 AI Agents 和 Agentic AI 的概念混淆,缺乏清晰的定义、界限和发展路线图,可能导致研发方向的模糊和评估标准的错位。
与此相对,Agentic AI被描绘为一个更高级、更复杂的范式转变。它代表了由多个专业化AI代理组成的协作系统,这些AI代理能够共同分解复杂目标、动态分配子任务、通过共享记忆(如持久化记忆、情景记忆)进行通信和协调,并由编排层(或元智能体)进行管理,以实现更宏大的、开放式的目标。Agentic AI 强调的是系统级的、涌现的智能,以及在动态环境中的适应性和鲁棒性。 它更像是一个由多个具备专长、能互相协作的智能助手组成的“团队”,它们可以一起解决更复杂、更大范围的问题。
论文中的智能家居示意图
为了帮助读者更好地理解AI Agents和Agentic AI的区别,论文中通过智能家居系统类比的方式,形象地对比了 AI Agent 和 Agentic AI 的概念区别。左侧展示了一个传统的 AI Agent(智能恒温器),它执行一个独立的、特定任务。右侧展示了一个 Agentic AI 系统(综合智能家居生态系统),其中多个专业化智能体协同工作,共同实现更复杂的、高层次的目标。这张图体现了从任务特定的自动化到自适应、协调智能的架构和功能上的飞跃。
而对于没有实际接触过 Agent 的朋友来说,可能理解起来还是会有些困难。没关系,我们继续往下看,论文中结合日常生活工作中我们熟悉的例子,对 AI Agents 和 Agentic AI 的概念进行了一些说明。
扩展思考:按照以上概念定义,Dify 和 Manus 是 AI Agents 还是 Agentic AI?请在评论区分享你的看法。
三、AI Agents 和 Agentic AI 的典型应用场景
论文的第四章节中,作者将AI Agents和Agentic AI的应用分成了八个核心应用领域:
论文中的应用场景图
AI代理 (AI Agents)的四个应用领域
客户支持自动化和企业内部搜索 (Automation for Customer Support & Internal Enterprise Search):简单来说,它就像一个非常聪明的自动化客服或公司内部的“活字典”。在客户服务方面,它们能理解客户的问题(比如“我的订单到哪儿了?”或者“怎么退货?”),然后连接到公司的系统(比如订单数据库),自动找到答案并回复客户。它们甚至能帮你发起退货流程。 在公司内部,你可以用自然语言(就像平时说话一样)问它们问题(比如“上次会议的关键决定是什么?”或者“去年的销售报告在哪里?”),它们能快速搜索并提供相关文档或总结。
电子邮件过滤和优先级划分 (Email Filtering and Prioritization):简单来说,它就像一个非常高效的智能邮件助理。 它们能自动帮你整理收件箱里的大量邮件。通过分析邮件的内容、发件人等信息,它们可以判断邮件的紧急程度,帮你自动打上标签(比如“重要”、“待办”、“低优先级”),或者提炼出邮件里的关键任务。
个性化内容推荐、基本数据分析和报告 (Personalized Content Recommendation, Basic Data Analysis and Reporting):简单来说,它们是你的专属“猜你喜欢”专家和简单的“数据分析师”。 在像亚马逊、YouTube、Spotify 这样的平台,它们会学习你的浏览、点击、购买、收听习惯,然后给你推荐你可能感兴趣的商品、视频或音乐。 在商业分析工具中,你可以用简单的话(比如“告诉我上季度哪个地区的销售额最高”)向它们提问,它们能自动把你的问题转换成查询,然后生成报告或图表给你看。
多智能体研究助手 (Multi-Agent Research Assistants):简单来说,它们就像一个由多个AI专家组成的“研究团队”。 当你要做一个复杂的研究项目或撰写一份详细报告时,这个系统会派出不同的AI智能体:一个可能去互联网或数据库里搜索所有相关的文献,另一个阅读并总结这些文献的要点,还有一个可能负责把信息整合起来,帮你起草报告或论文的某个部分。它们之间会互相交流和协作。
协作医疗决策支持 (Collaborative Medical Decision Support):简单来说,它们就像一个由多个AI医疗专家组成的“临床会诊团队”。 在医院,特别是情况复杂的重症监护室(ICU),Agentic AI系统可以整合不同AI智能体的分析结果:一个智能体可能分析病人的生命体征和各种检测数据,寻找早期预警信号;另一个可能快速查询病人的所有病史、用药史等;还有一个可能根据最新的医学指南,结合当前病情,提出诊断或治疗的建议方案。这些智能体互相验证、补充信息,帮助医生做出更准确、更安全的临床决策。
多智能体博弈AI和自适应工作流程自动化 (Multi-Agent Game AI & Adaptive Workflow Automation):简单来说,这类系统既能创造出行为更复杂、更智能、能互相影响的游戏角色,也能用来处理企业里那些非常复杂、需要多种专业判断、能根据情况灵活调整的工作流程。 在游戏里,它们让非玩家角色(NPC)的行为更自然、更有故事性,能根据玩家的行动动态调整自己的策略。在企业里,比如处理一个复杂的法律案件,或者应对一个突发的网络安全威胁,Agentic AI系统可以调动不同的AI智能体:一个智能体分析法律文件,另一个智能体查询相关法规;或者一个智能体识别网络攻击类型,另一个智能体评估影响范围,还有一个模拟应对措施。它们协同工作,自动完成大部分分析和初步决策,并且能根据情况变化动态调整应对策略。
前面我们提到过,AI Agents 善于处理定义明确、范围较窄的自动化任务,而 Agentic AI 则擅长解决复杂、高层次、甚至可能是开放式的目标,通常需要将大目标动态分解为子任务,从前者向后者的演进过程中,架构的变化是非常明显的。
论文中的架构演进图
具体来说,这种演进体现在以下几个关键方面:
从单体到团队架构: 传统的 AI Agents 通常是单一实体系统,专注于执行特定任务。而 Agentic AI 系统由多个、专业化的AI代理组成一个协同工作的“团队”。
引入“总指挥”(Orchestration): Agentic AI 系统增加了一个或多层协调层或“总指挥”智能体。这个“总指挥”负责分配任务、管理依赖关系以及协调团队中各个AI代理的活动,而这是传统 AI Agents 所没有的。
增强的规划与记忆能力: Agentic AI 引入了更高级的推理和规划机制,使其能够将复杂的整体目标分解为更小、可管理的子任务,并动态调整计划。同时,它们具备持久的记忆架构(包括情景记忆、语义记忆等),使得AI代理能够在跨任务或跨会话时保留上下文和知识,实现更长时间内的连贯性。传统 AI Agents 的记忆和规划能力相对有限,或仅限于特定任务内部。
强调协作与共享: 在 Agentic AI 中,AI代理之间可以相互沟通、共享信息和工作成果,共同推动任务进展。这种多智能体协作是 Agentic AI 区别于独立 AI Agents 的核心特征。相信 Google 正是看到了这种多智能体协作的潜力,才提出了 A2A 协议。
上图所展示的论文演进图就是这种架构演进的直观体现。它展示了从传统 AI Agents 的感知、推理、行动核心模块,扩展到 Agentic AI 中包含专业化AI代理、高级推理与规划、持久记忆和协调层等更复杂的组件。这些新组件共同促成了多AI代理协作、任务分解、共享上下文和系统协调等新兴能力。
AI Agents 和 Agentic AI 的主要挑战
(a)展示了AI Agents的局限性,如因果缺陷、浅层推理等,而(b)则强调了 Agentic AI 系统中被放大的协调和稳定性挑战。
治理感知架构 (问责制和角色隔离): 引入基于角色的访问控制、沙箱、身份解析等机制,确保代理行为符合范围,决策可审计、可撤销。这减少了高风险应用中的风险。在 Agentic AI 中,治理需跨角色、代理、工作流进行,确保安全、可信的协作环境。
此外,论文还提出了一个变革性的方向,对AI Agents和Agentic AI都有影响。Absolute Zero: Reinforced Self-play Reasoning with Zero Data (AZR) 框架,这是一个通过强化自我博弈推理(Reinforced Self-play Reasoning)实现“零数据(Zero Data)”学习的范式。该框架使AI代理能够自主生成、验证和解决自己的任务,通过可验证的反馈机制(例如代码执行)来巩固学习。这为Agentic AI 系统中的AI代理实现共同进化、知识细化和任务灵活性奠定了基础。关于AZR框架的详细介绍,我在arxiv.org上找到了一篇论文,感兴趣的朋友可以通过文后链接去找来读读。