RAG 检索增强生成实战指南
📖 本书简介
RAG (Retrieval-Augmented Generation) 是企业级 LLM 应用的核心技术。本书将教你如何构建高效的 RAG 系统,让 LLM 能够访问私有知识库并提供准确的答案。
🎯 学习目标
通过本书,你将学会:
- 理解 RAG 原理:检索增强生成的工作机制
- 掌握向量数据库:Pinecone、Weaviate、Qdrant 等主流方案
- 优化检索质量:Embedding 优化、混合检索、重排序
- 构建完整系统:从文档处理到问答生成的全流程
- 企业级部署:性能优化、成本控制、监控评估
📚 主要内容
第一部分:RAG 基础
- RAG 的定义与核心概念
- RAG vs Fine-tuning
- RAG 的应用场景
- RAG 系统架构
第二部分:文档处理
- 文档加载与解析
- 文档切分策略
- Chunk 大小优化
- 元数据提取
- 支持多种格式 (PDF, Word, Markdown 等)
第三部分:向量化与存储
- Embedding 模型选择
- 向量数据库对比与选型
- 索引结构设计
- 向量存储优化
- 实战:搭建向量数据库
第四部分:检索优化
- 基础向量检索
- 混合检索 (Dense + Sparse)
- 重排序 (Reranking)
- 查询改写与扩展
- 多路召回策略
第五部分:生成优化
- 上下文注入策略
- 提示词工程在 RAG 中的应用
- 引用与溯源
- 幻觉检测与缓解
- 多轮对话支持
第六部分:高级技术
- Self-RAG: 自我反思检索
- RAPTOR: 递归嵌入与聚类
- GraphRAG: 基于知识图谱的 RAG
- Adaptive RAG: 自适应检索
- Multi-modal RAG: 多模态检索
第七部分:评估与监控
- RAG 评估指标
- 端到端评估流程
- 组件级评估
- 持续监控与优化
- 实战:构建评估系统
第八部分:生产实践
- 性能优化
- 成本控制
- 缓存策略
- 增量更新
- 企业级部署案例
👥 适合人群
- AI 应用开发者
- 企业 AI 系统架构师
- 数据工程师
- 希望构建知识库问答系统的开发者
📋 前置知识
- Python 编程基础
- 基本的 LLM 知识(可参考《LLM 学习指南》)
- 数据库基础概念
🚀 开始学习
RAG 是连接 LLM 与企业知识的桥梁,让我们开始构建你的 RAG 系统!