AI Agent 开发实战

面向当前热点方向的系统课程:从单 Agent、工具调用、工作流编排到多 Agent 协作、评测、观测与上线,讲清 AI Agent 应用到底该怎么设计与落地。

当前状态

这页目前主要是专栏导读与内容主线,正式文章还在整理中。后续文章发布后,会自动出现在本页目录中。

专栏导读

这不是“提示词小技巧”,而是一门工程课

这个专栏不会把 Agent 写成几个提示模板,也不会只讲概念热词。

它会按完整工程链路展开:

  • 什么问题适合用 Agent,什么问题不适合;
  • 工具调用、记忆、计划、执行之间怎样分工;
  • 单 Agent 与多 Agent 的边界在哪里;
  • 如何做评测、权限控制、日志追踪和失败兜底;
  • 怎样把 Demo 变成能长期维护的产品。

课程对象

  • 想真正做出可用 Agent,而不是只会做聊天 Demo
  • 已经接触过函数调用、工作流编排,但整体思路还比较散
  • 希望把模型能力、工具系统、业务流程打通

每讲尽量统一的结构

  1. 本讲要解决什么问题
  2. Agent 结构与核心概念
  3. 设计原则与工程实现
  4. 典型案例拆解
  5. 常见失败模式
  6. 本讲小结

课程主线

第一编:Agent 基本骨架

  1. 什么是 Agent:从问答助手走向可执行系统
  2. 工具调用、函数调用与外部能力接入
  3. 计划、执行、反思:Agent 为什么要分阶段工作

第二编:工作流与协作

  1. 单 Agent 工作流设计:任务拆分、状态管理与重试
  2. 多 Agent 协作:路由、分工、交接与冲突处理
  3. 长任务执行:异步任务、检查点与人工接管

第三编:可靠性与评测

  1. Agent 评测:任务成功率、轨迹评估与回归测试
  2. 观测与调试:日志、Trace、成本、延迟与失败定位
  3. 安全与权限:工具白名单、数据隔离、越权风险

第四编:产品化落地

  1. 面向业务的 Agent 设计:客服、内容、研发与办公自动化
  2. 从 Demo 到生产:部署、监控、反馈闭环与持续优化

学习建议

Agent 很容易学成“看上去很强”的演示系统,所以学习时一定要反复问四个问题:

  • 这一步为什么交给模型,而不是交给程序;
  • 失败时会坏在哪里;
  • 这个流程如何被评估;
  • 这套系统能不能长期维护。