RAG 与知识库工程
系统讲清 RAG 的完整工程链路:文档清洗、切分、向量化、召回、重排、上下文构造、答案生成、评测与迭代,重点解决“能用”和“好用”之间的差距。
当前状态
这页目前主要是专栏导读与内容主线,正式文章还在整理中。后续文章发布后,会自动出现在本页目录中。
专栏导读
这门课讲的不是“接个向量库”,而是知识系统
RAG 看起来像一个简单架构:文档入库、向量检索、拼接上下文、调用模型回答。
但真正做到稳定可用时,问题远不止这些:
- 文档怎么切,才能既召回得到又不丢上下文;
- 检索为什么会“看起来相关,实际没用”;
- 重排、过滤、引用、缓存各自该放在哪;
- 知识库更新后,索引和效果如何同步维护;
- 怎样衡量答案质量,而不是只看模型会不会说。
课程对象
- 想做企业知识库、问答助手、文档助手、内部搜索
- 已经试过 RAG Demo,但效果不稳定、引用不准、回答漂移
- 希望把检索、生成、评测和运维真正串起来
每讲尽量统一的结构
- 本讲要解决什么问题
- RAG 核心机制
- 工程设计与实现细节
- 常见问题与排查方法
- 案例拆解
- 本讲小结
课程主线
第一编:RAG 基础骨架
- 为什么需要 RAG:模型知识边界、幻觉与私有数据
- 一个完整 RAG 系统由哪些模块组成
- 文档清洗、切分与元数据设计
第二编:检索链路
- Embedding 与向量检索:相似度到底在检什么
- 混合检索、过滤检索与多路召回
- 重排模型与上下文压缩:为什么召回后还要再筛一次
第三编:生成链路
- Prompt 组装、引用生成与答案约束
- 多轮对话中的检索记忆与上下文管理
- 高级 RAG:GraphRAG、Agentic RAG 与查询规划
第四编:评测与运维
- RAG 评测:召回率、答案正确性、引用质量与用户反馈
- 数据更新、索引重建、缓存与成本控制
- 面向真实业务的知识库产品设计
学习建议
RAG 最容易踩的坑,就是把所有问题都归咎于模型。
实际上很多效果问题并不出在“模型不够强”,而出在:
- 文档切分错误;
- 召回策略太粗;
- 上下文拼接不合理;
- 没有稳定评测。
所以学这门课时,一定要把重点放在链路质量,而不是单次回答效果。