type
Post
status
Published
date
Jul 14, 2025
slug
graphrag-learning-notes
summary
我从普通 RAG 的边界出发理解 GraphRAG:向量检索解决相似性,图结构更适合表达关系、社区和全局知识。
tags
LLM
DATA
开发
category
LLM
icon
password
🕸️
这篇是我学习 GraphRAG 时的笔记。我一开始只把 RAG 理解成“检索几段文本再回答”,但 GraphRAG 提醒我:当问题涉及复杂关系、群体结构和跨文档总结时,图结构可能比单纯向量检索更适合表达知识。
 

📝 主旨内容

💡 一、我为什么觉得普通 RAG 不够

向量检索擅长找相似文本,但不一定擅长理解实体之间的关系。
普通 RAG 很适合回答“某段资料里有没有这个信息”。但当我想问更复杂的问题,比如一个组织里有哪些关键人物、多个事件之间有什么联系、某个主题在不同文档中如何演化,单纯召回几个 chunk 就容易不够。
GraphRAG 的思路是先从文本中抽取实体和关系,再构建知识图谱或社区结构。这样回答问题时,不只是找相似段落,还能沿着关系网络做汇总。

🔍 二、我理解的 GraphRAG 流程

我现在会把 GraphRAG 拆成几步:
  • 从文档中抽取实体、关系和关键描述
  • 把这些信息组织成图结构
  • 对图进行社区发现或层级摘要
  • 查询时结合图摘要和原文证据生成回答
这个流程比普通 RAG 更重,但它换来的是全局视角。尤其在长文档集、组织知识库、研究报告和复杂事件分析里,这种全局结构很有价值。

🛠️ 三、我学到的取舍

GraphRAG 不是普通 RAG 的替代品,而是更适合关系密集型问题的增强方案。
它也有明显成本。抽取实体关系需要模型调用,构图和摘要需要额外计算,更新知识库也更复杂。如果只是做简单 FAQ,GraphRAG 可能过度设计。
所以我现在会这样判断:如果问题主要是局部事实检索,用普通 RAG;如果问题需要跨文档综合、关系推理、主题聚类和全局总结,再考虑 GraphRAG。

🧩 四、我会怎么做一个小实验

我的最小实验路线
  1. 选一组主题相关文档。
  1. 抽取实体和关系。
  1. 生成社区摘要。
  1. 分别用普通 RAG 和 GraphRAG 回答同一批问题。
  1. 比较答案是否更完整、引用是否更可靠。
这个实验能帮我判断 GraphRAG 的收益是否真实,而不是只因为概念听起来高级。

🤗 总结归纳

学习 GraphRAG 后,我更清楚 RAG 的边界了。向量检索解决的是相似性问题,图结构解决的是关系和全局组织问题。
作为学习者,我不会在所有项目里都上 GraphRAG。但如果面对的是复杂知识库、长文档集合和关系密集型问题,我会认真考虑它。

📎 参考文章

 
💡
我后面想用自己的博客文章做一个小型 GraphRAG 实验,看看它能不能帮我整理出长期写作中的主题网络。
0 到 1 训练一个多模态大模型:我的学习路线Turn Your PC into AIPC:我对端侧智能的理解
Loading...