GraphRAG(グラフRAG)とは?
読み方: グラフラグ
30秒まとめ
ナレッジグラフ+ベクトル検索を組み合わせたRAG手法。Microsoftが2024年に提唱し、複雑な質問・関係性推論で従来RAGを大きく上回る精度を実現。
GraphRAG(グラフRAG)の意味・定義
GraphRAG(グラフRAG)は、Microsoft Researchが2024年に提唱したRAG(Retrieval-Augmented Generation)の発展形で、ベクトル検索のみに依存する従来RAGの「複雑な関係性推論ができない」「大規模文書全体の俯瞰質問に弱い」という課題を、ナレッジグラフ(Knowledge Graph)の構築と統合検索で解決します。仕組みは(1)ドキュメント取り込み時にLLMでエンティティ(人物、組織、概念)と関係性(関連、雇用、引用、因果)を自動抽出、(2)ナレッジグラフを構築(ノード=エンティティ、エッジ=関係)、(3)グラフ上でクラスタリング・コミュニティ検出(Leiden algorithm等)、(4)各クラスタごとにLLMで要約を生成(Hierarchical Summary)、(5)クエリ時はベクトル検索+グラフ探索+階層要約の3経路を統合。利点は(a)Global Query(大規模文書全体に関する質問)の精度が従来RAGの2-3倍、(b)Multi-hop Reasoning(複数ステップ推論)が可能、(c)エンティティ間の関係性を保持(「AさんとBさんはどう関係?」に答えられる)、(d)説明可能性(どのエッジ・ノードを参照したかトレース可能)。実装は(i)Microsoft GraphRAG(OSS、Pythonライブラリ)、(ii)Neo4j + LangChain(産業実装)、(iii)LlamaIndex Knowledge Graph、(iv)Weaviate + Property Graph。コストは従来RAGの2-3倍(グラフ構築時のLLM呼出が多い)だが、精度向上効果が大きい。Use Caseは(I)企業の知識ベース横断検索、(II)医療・法律・財務の複雑文書、(III)研究論文の引用関係分析、(IV)コンプライアンス・監査ログ分析。Microsoft、AWS、Google、Anthropicが2025-2026年にGraphRAG機能を主要LLM APIに標準実装する動きが進行中で、2026年のRAGアーキテクチャの新標準になる見込みです。