AI Agent 开发实战
面向当前热点方向的系统课程:从单 Agent、工具调用、工作流编排到多 Agent 协作、评测、观测与上线,讲清 AI Agent 应用到底该怎么设计与落地。
当前状态
这页目前主要是专栏导读与内容主线,正式文章还在整理中。后续文章发布后,会自动出现在本页目录中。
专栏导读
这不是“提示词小技巧”,而是一门工程课
这个专栏不会把 Agent 写成几个提示模板,也不会只讲概念热词。
它会按完整工程链路展开:
- 什么问题适合用 Agent,什么问题不适合;
- 工具调用、记忆、计划、执行之间怎样分工;
- 单 Agent 与多 Agent 的边界在哪里;
- 如何做评测、权限控制、日志追踪和失败兜底;
- 怎样把 Demo 变成能长期维护的产品。
课程对象
- 想真正做出可用 Agent,而不是只会做聊天 Demo
- 已经接触过函数调用、工作流编排,但整体思路还比较散
- 希望把模型能力、工具系统、业务流程打通
每讲尽量统一的结构
- 本讲要解决什么问题
- Agent 结构与核心概念
- 设计原则与工程实现
- 典型案例拆解
- 常见失败模式
- 本讲小结
课程主线
第一编:Agent 基本骨架
- 什么是 Agent:从问答助手走向可执行系统
- 工具调用、函数调用与外部能力接入
- 计划、执行、反思:Agent 为什么要分阶段工作
第二编:工作流与协作
- 单 Agent 工作流设计:任务拆分、状态管理与重试
- 多 Agent 协作:路由、分工、交接与冲突处理
- 长任务执行:异步任务、检查点与人工接管
第三编:可靠性与评测
- Agent 评测:任务成功率、轨迹评估与回归测试
- 观测与调试:日志、Trace、成本、延迟与失败定位
- 安全与权限:工具白名单、数据隔离、越权风险
第四编:产品化落地
- 面向业务的 Agent 设计:客服、内容、研发与办公自动化
- 从 Demo 到生产:部署、监控、反馈闭环与持续优化
学习建议
Agent 很容易学成“看上去很强”的演示系统,所以学习时一定要反复问四个问题:
- 这一步为什么交给模型,而不是交给程序;
- 失败时会坏在哪里;
- 这个流程如何被评估;
- 这套系统能不能长期维护。