[Wiki] [一覧]

RAG(検索拡張生成 / Retrieval-Augmented Generation)

概要

RAG(Retrieval-Augmented Generation, 検索拡張生成)は、大規模言語モデル が回答を生成する前に 外部の知識ソースから関連情報を検索(Retrieval)し、それをコンテキストに加えて生成(Generation) する手法です。モデルのパラメータに含まれない最新・固有の情報を扱えるようにし、生成を事実にグラウンディングします。

なぜ重要か

基本的な流れ

クエリ → 検索(ベクトル検索/全文検索)→ 関連文書を取得
      → プロンプトに文脈として付加 → LLM が回答を生成

セマンティック検索とベクトルストア

発展形

手法概要
グラフRAG(Graph RAG)ナレッジグラフを活用して関係性を辿る検索
意味体験記憶(Semantic Experience Memory)エージェントの経験を意味的に蓄積・検索
動的ナレッジグラフリアルタイムに知識を更新。ただし計算コスト・レイテンシが課題で、用途によっては RAG の方が優れることも

実用上の位置づけ

2025年の材料科学・化学向け LLM ハッカソンの分析(From_Knowledge_to_Action_2025_LLM_Hackathon)でも、RAG が グラウンディングの基盤 として広く活用され、実験室統合型のクローズドループシステムへ進化していることが報告されています。

低コスト構成の実践例

高価なベクトル DB インフラに頼らず RAG を組む工夫も進んでいます。

知識更新:検索 vs パラメータ編集

LLM の知識を最新化する手段として、重みを直接書き換える「パラメータ編集(Knowledge Editing)」が一時流行しましたが、その有効性に強い疑問が呈されています。

関連ページ

参考資料