专栏·0 篇 ·2026-03-30

RAG 与知识库工程

系统讲清 RAG 的完整工程链路：文档清洗、切分、向量化、召回、重排、上下文构造、答案生成、评测与迭代，重点解决“能用”和“好用”之间的差距。

当前状态

这页目前主要是专栏导读与内容主线，正式文章还在整理中。后续文章发布后，会自动出现在本页目录中。

专栏导读

这门课讲的不是“接个向量库”，而是知识系统
课程对象
每讲尽量统一的结构
课程主线
第一编：RAG 基础骨架
第二编：检索链路
第三编：生成链路
第四编：评测与运维
学习建议

这门课讲的不是“接个向量库”，而是知识系统

RAG 看起来像一个简单架构：文档入库、向量检索、拼接上下文、调用模型回答。

但真正做到稳定可用时，问题远不止这些：

文档怎么切，才能既召回得到又不丢上下文；
检索为什么会“看起来相关，实际没用”；
重排、过滤、引用、缓存各自该放在哪；
知识库更新后，索引和效果如何同步维护；
怎样衡量答案质量，而不是只看模型会不会说。

课程对象

想做企业知识库、问答助手、文档助手、内部搜索
已经试过 RAG Demo，但效果不稳定、引用不准、回答漂移
希望把检索、生成、评测和运维真正串起来

每讲尽量统一的结构

本讲要解决什么问题
RAG 核心机制
工程设计与实现细节
常见问题与排查方法
案例拆解
本讲小结

课程主线

第一编：RAG 基础骨架

为什么需要 RAG：模型知识边界、幻觉与私有数据
一个完整 RAG 系统由哪些模块组成
文档清洗、切分与元数据设计

第二编：检索链路

Embedding 与向量检索：相似度到底在检什么
混合检索、过滤检索与多路召回
重排模型与上下文压缩：为什么召回后还要再筛一次

第三编：生成链路

Prompt 组装、引用生成与答案约束
多轮对话中的检索记忆与上下文管理
高级 RAG：GraphRAG、Agentic RAG 与查询规划

第四编：评测与运维

RAG 评测：召回率、答案正确性、引用质量与用户反馈
数据更新、索引重建、缓存与成本控制
面向真实业务的知识库产品设计

学习建议

RAG 最容易踩的坑，就是把所有问题都归咎于模型。

实际上很多效果问题并不出在“模型不够强”，而出在：

文档切分错误；
召回策略太粗；
上下文拼接不合理；
没有稳定评测。

所以学这门课时，一定要把重点放在链路质量，而不是单次回答效果。