什么是 Agent

什么是 Embedding?

Embedding 是将离散数据转换为连续向量表示的技术。

为什么需要?

"猫" → 独热编码 → 99.9%0(稀疏)
"猫" → Embedding → [0.2, -0.1, 0.8...](密集,语义丰富)

语义空间

              "狗"
              /
     "宠物" /
            /
           /    "猫"
          /
    "汽车"

动物聚集,汽车远离

Embedding 模型

应用

  1. 语义搜索
  1. 聚类分析
  1. 推荐系统
  1. RAG 检索

Claude Code 生成

什么是 Agent

🤖
AI Agent(智能体)是一个能够感知环境、做出决策并采取行动的系统。与简单的问答机器人不同,Agent 可以自主规划、执行复杂任务,并从反馈中学习和改进。
大语言模型本身是被动的响应系统:用户提问,模型回答。Agent 则更进一步:给定目标后,Agent 能够自主思考步骤、调用工具、应对异常,最终完成任务。这种自主性使 Agent 成为真正有用的 AI 助手。

1. Agent 的核心能力

Agent 需要具备四大核心能力才能有效工作。
🧠
Agent 四大核心能力: 感知(Perception):接收用户输入或环境信息 - 理解用户意图 - 收集环境数据 - 识别任务需求 推理(Reasoning):分析问题、制定计划 - 分解复杂任务 - 评估方案优劣 - 做出决策判断 行动(Action):调用工具、执行任务 - 执行具体操作 - 与外部系统交互 - 解决实际问题 学习(Learning):从反馈中改进 - 总结经验教训 - 优化策略方法 - 适应新情况

2. Agent vs 普通 LLM

理解 Agent 和普通 LLM 的区别,有助于正确使用和设计系统。
⚖️
Agent vs LLM 对比: LLM: - 被动响应,被问才答 - 单次交互,无记忆连贯性 - 不主动调用工具 - 无法处理多步骤任务 Agent: - 主动规划,分解任务 - 保持上下文连贯性 - 自主调用所需工具 - 持续执行直到目标达成

3. Agent 的类型

根据能力和用途的不同,Agent 可以分为多种类型。
🔄
Agent 类型分类: 按能力范围: - 单一任务 Agent:专注于特定任务(如代码助手) - 多任务 Agent:能处理多种类型任务 - 通用 Agent:具备广泛能力的助手 按自主程度: - 受限 Agent:需要人类审批关键步骤 - 半自主 Agent:主要自动执行,定期汇报 - 完全自主 Agent:独立完成任务 按架构设计: - 单-Agent:独立处理所有任务 - 多-Agent:多个 Agent 协作完成复杂任务

4. Agent 的工作流程

Agent 处理任务通常遵循一个循环迭代的工作流程。
🔄
Agent 工作流程: 1. 接收目标:理解用户想要什么 2. 分析规划: - 分解为子任务 - 确定执行顺序 - 选择所需工具 3. 执行循环: - 执行当前步骤 - 观察执行结果 - 判断是否成功 - 必要时调整计划 4. 完成任务: - 汇总所有结果 - 组织最终输出 - 向用户汇报

5. 主流 Agent 框架

开发 Agent 应用通常使用成熟的框架,以下是主流选择:
🛠️
主流 Agent 框架: LangChain/LangGraph: - 灵活的 Agent 构建框架 - 丰富的工具集成 - 支持多种 LLM AutoGPT: - 自主任务规划 - 互联网访问能力 - 长期记忆管理 CrewAI: - 多 Agent 协作框架 - 角色定义清晰 - 任务分配机制 OpenAI Assistants: - OpenAI 官方方案 - 内置工具支持 - 简化开发流程

6. Agent 设计模式

常见的 Agent 设计模式包括反思、工具使用、规划和多 Agent 协作。
📐
四种核心 Agent 设计模式: 1. 反思(Reflection): - Agent 对输出进行自我评估 - 发现问题并改进 - 迭代优化结果 2. 工具使用(Tool Use): - 调用外部工具扩展能力 - 搜索、计算、执行代码等 - 结合 LLM 和工具优势 3. 规划(Planning): - 将复杂任务分解 - 制定执行步骤 - 按计划有序执行 4. 多 Agent 协作: - 多个 Agent 各司其职 - 通过消息传递协作 - 解决单一 Agent 难以完成的任务

7. Agent 的挑战与风险

构建和使用 Agent 面临多方面挑战,需要谨慎应对。
⚠️
主要挑战与风险: 1. 规划失效: - 任务分解不当导致死循环 - 错误的步骤顺序 - 遗漏关键依赖 2. 工具误用: - 参数构造错误 - 选择不适合的工具 - 工具返回结果误解 3. 成本控制: - 多次 API 调用累积费用 - 复杂任务消耗大量 token 4. 安全风险: - Agent 执行危险操作 - 数据泄露风险 - 缺乏有效监督机制 5. 幻觉问题: - 虚假记忆和错误结论 - 对工具功能的误解 - 错误的自信判断

8. Agent 的最佳实践

设计可靠的 Agent 系统应遵循以下原则:
最佳实践建议: 1. 明确边界:清晰定义 Agent 能做什么、不能做什么 2. 安全优先:对危险操作增加人工审批机制 3. 可观测性:记录所有决策和操作,便于调试 4. 优雅降级:工具不可用时有备用方案 5. 成本控制:设置调用次数和费用上限 6. 渐进式复杂:从简单任务开始,逐步增加能力 7. 持续监控:实时监控运行状态,及时发现问题

9. Agent 的未来展望

Agent 技术正在快速发展,未来可能实现:更强的自主学习能力、多 Agent 生态系统、更好的人机协作模式,以及更广泛的应用场景。

10. 总结

AI Agent 是能够感知、推理、行动和学习的智能系统。与普通 LLM 相比,Agent 具有主动规划、工具调用、多步骤执行等能力。Agent 可分为多种类型(单任务、多任务、通用)和架构(单 Agent、多 Agent)。设计 Agent 需要考虑反思、工具使用、规划和协作等模式,同时注意安全、成本和可靠性挑战。
⚠️
声明:本文由 AI 生成,可能存在错误或不准确之处。
最后更新:2026-01-29