Agent指的是以大模型技术(LLM)作为主体或者大脑,能进行自动规划并且拥有自主决策能力,以解决复杂问题的智能体。
一个Agent的基本组成应该包含如下四个部分:规划(Planning),工具(Tools),执行(Action),和记忆(Memory)。
图片
在一个由LLM驱动的自主智能体中LLM充当大脑,并辅以几个关键组成部分:
规划(Planning): Agent Planning是Agent能力的核心,一个好的规划决定了Agent能否顺利执行以及解决问题。规划 能够将大型任务分解为较小的、可管理的子目标,以便高效的处理复杂任务;Agent可以对过去的行为进行自我批评和反省,从错误中吸取经验教训,并为接下来的行动进行分析、总结和提炼,这种反思和细化可以帮助Agent提高自身的智能和适应性,从而提高最终结果的质量。记忆(Memory): 智能体的Memory(记忆)模块是其核心组件之一,它使智能体能够获取、存储、保留以及稍后检索信息,包括短期记忆和长期记忆。短期记忆类似于模型在上下文中的即时学习能力,而长期记忆则允许智能体长时间保留和回忆信息,通常依赖于外部向量存储和快速检索。工具(Tools): 工具指的是可被智能体调用的外部API,用于额外信息提取或者环境交互。这使得智能体能够处理其核心模型无法直接处理的任务。行动(Action): 智能体通过调用外部接口(APIs)来补充其内在模型所缺乏的信息或者执行外部指令,这一能力是其与外部环境交互的关键机制。这种交互广泛覆盖了从利用Wikipedia搜索API进行详尽的知识查询、执行文件操作,到收集用户输入等多方面。该机制赋予智能体执行复杂功能的能力,从而在各种应用场景下扩展了其作用域和影响力。图片
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。