专栏·0 篇 ·2026-03-30

AI Agent 开发实战

面向当前热点方向的系统课程：从单 Agent、工具调用、工作流编排到多 Agent 协作、评测、观测与上线，讲清 AI Agent 应用到底该怎么设计与落地。

当前状态

这页目前主要是专栏导读与内容主线，正式文章还在整理中。后续文章发布后，会自动出现在本页目录中。

专栏导读

这不是“提示词小技巧”，而是一门工程课
课程对象
每讲尽量统一的结构
课程主线
第一编：Agent 基本骨架
第二编：工作流与协作
第三编：可靠性与评测
第四编：产品化落地
学习建议

这不是“提示词小技巧”，而是一门工程课

这个专栏不会把 Agent 写成几个提示模板，也不会只讲概念热词。

它会按完整工程链路展开：

什么问题适合用 Agent，什么问题不适合；
工具调用、记忆、计划、执行之间怎样分工；
单 Agent 与多 Agent 的边界在哪里；
如何做评测、权限控制、日志追踪和失败兜底；
怎样把 Demo 变成能长期维护的产品。

课程对象

想真正做出可用 Agent，而不是只会做聊天 Demo
已经接触过函数调用、工作流编排，但整体思路还比较散
希望把模型能力、工具系统、业务流程打通

每讲尽量统一的结构

本讲要解决什么问题
Agent 结构与核心概念
设计原则与工程实现
典型案例拆解
常见失败模式
本讲小结

课程主线

第一编：Agent 基本骨架

什么是 Agent：从问答助手走向可执行系统
工具调用、函数调用与外部能力接入
计划、执行、反思：Agent 为什么要分阶段工作

第二编：工作流与协作

单 Agent 工作流设计：任务拆分、状态管理与重试
多 Agent 协作：路由、分工、交接与冲突处理
长任务执行：异步任务、检查点与人工接管

第三编：可靠性与评测

Agent 评测：任务成功率、轨迹评估与回归测试
观测与调试：日志、Trace、成本、延迟与失败定位
安全与权限：工具白名单、数据隔离、越权风险

第四编：产品化落地

面向业务的 Agent 设计：客服、内容、研发与办公自动化
从 Demo 到生产：部署、监控、反馈闭环与持续优化

学习建议

Agent 很容易学成“看上去很强”的演示系统，所以学习时一定要反复问四个问题：

这一步为什么交给模型，而不是交给程序；
失败时会坏在哪里；
这个流程如何被评估；
这套系统能不能长期维护。