RAG 与知识库工程

系统讲清 RAG 的完整工程链路:文档清洗、切分、向量化、召回、重排、上下文构造、答案生成、评测与迭代,重点解决“能用”和“好用”之间的差距。

当前状态

这页目前主要是专栏导读与内容主线,正式文章还在整理中。后续文章发布后,会自动出现在本页目录中。

专栏导读

这门课讲的不是“接个向量库”,而是知识系统

RAG 看起来像一个简单架构:文档入库、向量检索、拼接上下文、调用模型回答。

但真正做到稳定可用时,问题远不止这些:

  • 文档怎么切,才能既召回得到又不丢上下文;
  • 检索为什么会“看起来相关,实际没用”;
  • 重排、过滤、引用、缓存各自该放在哪;
  • 知识库更新后,索引和效果如何同步维护;
  • 怎样衡量答案质量,而不是只看模型会不会说。

课程对象

  • 想做企业知识库、问答助手、文档助手、内部搜索
  • 已经试过 RAG Demo,但效果不稳定、引用不准、回答漂移
  • 希望把检索、生成、评测和运维真正串起来

每讲尽量统一的结构

  1. 本讲要解决什么问题
  2. RAG 核心机制
  3. 工程设计与实现细节
  4. 常见问题与排查方法
  5. 案例拆解
  6. 本讲小结

课程主线

第一编:RAG 基础骨架

  1. 为什么需要 RAG:模型知识边界、幻觉与私有数据
  2. 一个完整 RAG 系统由哪些模块组成
  3. 文档清洗、切分与元数据设计

第二编:检索链路

  1. Embedding 与向量检索:相似度到底在检什么
  2. 混合检索、过滤检索与多路召回
  3. 重排模型与上下文压缩:为什么召回后还要再筛一次

第三编:生成链路

  1. Prompt 组装、引用生成与答案约束
  2. 多轮对话中的检索记忆与上下文管理
  3. 高级 RAG:GraphRAG、Agentic RAG 与查询规划

第四编:评测与运维

  1. RAG 评测:召回率、答案正确性、引用质量与用户反馈
  2. 数据更新、索引重建、缓存与成本控制
  3. 面向真实业务的知识库产品设计

学习建议

RAG 最容易踩的坑,就是把所有问题都归咎于模型。

实际上很多效果问题并不出在“模型不够强”,而出在:

  • 文档切分错误;
  • 召回策略太粗;
  • 上下文拼接不合理;
  • 没有稳定评测。

所以学这门课时,一定要把重点放在链路质量,而不是单次回答效果。