一、RAG 系统搭建指南
基于 LangChain 框架的完整 RAG 搭建指南。
二、架构设计
文档 → 解析 → 分块 → Embedding → 向量库 → 检索 → Rerank → LLM生成
1. 关键参数
| 参数 | 推荐值 | 说明 |
|---|
| chunk_size | 512 | 分块大小 |
| chunk_overlap | 50 | 重叠字符 |
| top_k | 3-5 | 召回文档数 |
三、LangChain 核心模块
- Document Loaders:PDF/HTML/Notion等50+数据源
- Text Splitters:递归/语义/Markdown分块
- Vector Stores:Chroma/Pinecone/Milvus
- Retrievers:向量/关键词/混合检索
评论区