Self-RAG(自己評価型RAG)とは?
読み方: セルフラグ
30秒まとめ
LLMが自分で「検索が必要か」「検索結果は適切か」「回答は事実に基づいているか」を判断する高度なRAG手法。ハルシネーション50%減を実現する2026年の標準技術。
Self-RAG(自己評価型RAG)の意味・定義
Self-RAG(Self-Reflective Retrieval-Augmented Generation)は、ワシントン大学・AI2が2023年提案、2024-2026年に主流化した高度なRAG手法です。従来のRAG(検索→生成の単純パイプライン)と異なり、LLMが「Reflection Tokens」と呼ばれる4種の自己評価信号を出力します:(1) Retrieve(検索が必要か?Yes/No)、(2) IsRel(検索結果は質問と関連するか?)、(3) IsSup(生成内容は検索結果で支持されるか?)、(4) IsUse(最終回答の有用性は?1-5)。動作フロー:(a) クエリを受け、まず「Retrieve必要?」を判定、(b) 必要ならベクトル検索+関連度フィルタ、(c) 各検索結果に対し並列で生成、(d) 各回答の事実性・有用性を自己評価、(e) ベスト回答を返却。メリット:(I) ハルシネーション50%削減(オリジナル論文)、(II) 不要検索の回避でレイテンシ・コスト削減、(III) 根拠(Citations)の自動付与、(IV) 動的に検索深度を調整。実装:(1) LangChainのSelf-RAG Module、(2) LlamaIndexのSelf-Reflective Agents、(3) Anthropic Claude Skills(自動Reflection)、(4) OpenAI o3/o4-miniのDeep Research(事実上Self-RAG実装)。2026年トレンド:Corrective RAG(CRAG)、GraphRAG、Agentic RAG(複数ツール選択)等の高度版に発展、Multi-Modal Self-RAG(画像・動画への拡張)、Adaptive RAG(クエリ複雑度別の動的戦略)。実用:医療・法律・金融など事実性が重要な領域で必須、Anthropic Claude Constitutional AIとの相性◎、ベクトルDBはPinecone/Weaviate/Chromaが標準。