logo
LlamaIndex 框架指南
LlamaIndex 框架指南LlamaIndex 简介

LlamaIndex 框架指南

LlamaIndex 是专注于数据索引和检索的 LLM 框架,特别适合构建 RAG (检索增强生成) 应用。它是连接你的私有数据与 LLM 的最强桥梁。

如果把 LLM 比作“很会说话但记性一般的同事”,LlamaIndex 就像“会做档案管理的项目助理”。
它不负责替你思考业务,但能在你提问时把最相关资料准确递上来。

#核心能力

  • LlamaHub:提供数百个数据连接器,支持 PDF、Notion、Discord、SQL 等。
  • 先进的索引:支持向量、摘要、树状、知识图谱等多种数据组织方式。
  • 专业的 RAG 链路:内置重排序 (Reranking)、子问题查询等高阶检索策略。

#学习路径

#适用场景

  • 多来源非结构化文档检索(PDF、网页、知识库、会议纪要)
  • 对召回质量要求高的企业问答系统
  • 需要可控检索流程(重写查询、重排序、路由检索)的项目

#面向读者的落地路线

  • 初学者:先做单文档问答,确认端到端流程
  • 有经验开发者:引入多数据源与 metadata filter
  • 团队项目:建立评估集 + 版本化索引流程,避免“每次上线都像抽奖”

#项目落地建议

  • 先明确数据边界:哪些文档可以进入索引,哪些必须排除
  • 建立基础评估:命中率、答案可引用率、幻觉率
  • 分层优化:先优化切块,再优化检索,再优化生成

#常见问题

  • 为什么召回不准? 往往是切块过大或元数据不完整,而不只是模型问题。
  • 为什么成本变高? 重复索引和过高 Top-K 是常见原因,先做采样评估再放量。

一句话类比:
检索系统像点外卖,不是“点得越多越好”,而是“点对菜、准时送到、别送重样”。


提示:如果您处理的是非结构化文档(如 PDF 或长文本),LlamaIndex 通常是比 LangChain 更专业的选择。

System Design

系统设计必备:核心概念 + 经典案例

快速掌握取舍与设计套路,备战系统设计面试。

进入 System Design →

相关路线图