什么是 Embedding?
Embedding 是将离散数据转换为连续向量表示的技术。
为什么需要?
"猫" → 独热编码 → 99.9% 是 0(稀疏)
"猫" → Embedding → [0.2, -0.1, 0.8...](密集,语义丰富)语义空间
"狗"
/
"宠物" /
/
/ "猫"
/
"汽车"
动物聚集,汽车远离Embedding 模型
应用
- 语义搜索
- 聚类分析
- 推荐系统
- RAG 检索
Claude Code 生成
什么是 Agent
AI Agent(智能体)是一个能够感知环境、做出决策并采取行动的系统。与简单的问答机器人不同,Agent 可以自主规划、执行复杂任务,并从反馈中学习和改进。
大语言模型本身是被动的响应系统:用户提问,模型回答。Agent 则更进一步:给定目标后,Agent 能够自主思考步骤、调用工具、应对异常,最终完成任务。这种自主性使 Agent 成为真正有用的 AI 助手。
1. Agent 的核心能力
Agent 需要具备四大核心能力才能有效工作。
Agent 四大核心能力:
感知(Perception):接收用户输入或环境信息
- 理解用户意图
- 收集环境数据
- 识别任务需求
推理(Reasoning):分析问题、制定计划
- 分解复杂任务
- 评估方案优劣
- 做出决策判断
行动(Action):调用工具、执行任务
- 执行具体操作
- 与外部系统交互
- 解决实际问题
学习(Learning):从反馈中改进
- 总结经验教训
- 优化策略方法
- 适应新情况
2. Agent vs 普通 LLM
理解 Agent 和普通 LLM 的区别,有助于正确使用和设计系统。
Agent vs LLM 对比:
LLM:
- 被动响应,被问才答
- 单次交互,无记忆连贯性
- 不主动调用工具
- 无法处理多步骤任务
Agent:
- 主动规划,分解任务
- 保持上下文连贯性
- 自主调用所需工具
- 持续执行直到目标达成
3. Agent 的类型
根据能力和用途的不同,Agent 可以分为多种类型。
Agent 类型分类:
按能力范围:
- 单一任务 Agent:专注于特定任务(如代码助手)
- 多任务 Agent:能处理多种类型任务
- 通用 Agent:具备广泛能力的助手
按自主程度:
- 受限 Agent:需要人类审批关键步骤
- 半自主 Agent:主要自动执行,定期汇报
- 完全自主 Agent:独立完成任务
按架构设计:
- 单-Agent:独立处理所有任务
- 多-Agent:多个 Agent 协作完成复杂任务
4. Agent 的工作流程
Agent 处理任务通常遵循一个循环迭代的工作流程。
Agent 工作流程:
1. 接收目标:理解用户想要什么
2. 分析规划:
- 分解为子任务
- 确定执行顺序
- 选择所需工具
3. 执行循环:
- 执行当前步骤
- 观察执行结果
- 判断是否成功
- 必要时调整计划
4. 完成任务:
- 汇总所有结果
- 组织最终输出
- 向用户汇报
5. 主流 Agent 框架
开发 Agent 应用通常使用成熟的框架,以下是主流选择:
主流 Agent 框架:
LangChain/LangGraph:
- 灵活的 Agent 构建框架
- 丰富的工具集成
- 支持多种 LLM
AutoGPT:
- 自主任务规划
- 互联网访问能力
- 长期记忆管理
CrewAI:
- 多 Agent 协作框架
- 角色定义清晰
- 任务分配机制
OpenAI Assistants:
- OpenAI 官方方案
- 内置工具支持
- 简化开发流程
6. Agent 设计模式
常见的 Agent 设计模式包括反思、工具使用、规划和多 Agent 协作。
四种核心 Agent 设计模式:
1. 反思(Reflection):
- Agent 对输出进行自我评估
- 发现问题并改进
- 迭代优化结果
2. 工具使用(Tool Use):
- 调用外部工具扩展能力
- 搜索、计算、执行代码等
- 结合 LLM 和工具优势
3. 规划(Planning):
- 将复杂任务分解
- 制定执行步骤
- 按计划有序执行
4. 多 Agent 协作:
- 多个 Agent 各司其职
- 通过消息传递协作
- 解决单一 Agent 难以完成的任务
7. Agent 的挑战与风险
构建和使用 Agent 面临多方面挑战,需要谨慎应对。
主要挑战与风险:
1. 规划失效:
- 任务分解不当导致死循环
- 错误的步骤顺序
- 遗漏关键依赖
2. 工具误用:
- 参数构造错误
- 选择不适合的工具
- 工具返回结果误解
3. 成本控制:
- 多次 API 调用累积费用
- 复杂任务消耗大量 token
4. 安全风险:
- Agent 执行危险操作
- 数据泄露风险
- 缺乏有效监督机制
5. 幻觉问题:
- 虚假记忆和错误结论
- 对工具功能的误解
- 错误的自信判断
8. Agent 的最佳实践
设计可靠的 Agent 系统应遵循以下原则:
最佳实践建议:
1. 明确边界:清晰定义 Agent 能做什么、不能做什么
2. 安全优先:对危险操作增加人工审批机制
3. 可观测性:记录所有决策和操作,便于调试
4. 优雅降级:工具不可用时有备用方案
5. 成本控制:设置调用次数和费用上限
6. 渐进式复杂:从简单任务开始,逐步增加能力
7. 持续监控:实时监控运行状态,及时发现问题
9. Agent 的未来展望
Agent 技术正在快速发展,未来可能实现:更强的自主学习能力、多 Agent 生态系统、更好的人机协作模式,以及更广泛的应用场景。
10. 总结
AI Agent 是能够感知、推理、行动和学习的智能系统。与普通 LLM 相比,Agent 具有主动规划、工具调用、多步骤执行等能力。Agent 可分为多种类型(单任务、多任务、通用)和架构(单 Agent、多 Agent)。设计 Agent 需要考虑反思、工具使用、规划和协作等模式,同时注意安全、成本和可靠性挑战。
声明:本文由 AI 生成,可能存在错误或不准确之处。
最后更新:2026-01-29