Self RAGとは
SELF RAG
読み: セルフ・ラグ
Self RAGとは、Retrieval-Augmented Generation(RAG)モデルの一種であり、モデル自身が検索と生成のプロセスを制御する能力を持つ
読み: セルフ・ラグ
Self RAGの仕組み
Self RAGは、まず入力されたプロンプトに基づいて初期の応答を生成する。次に、生成された応答の品質を評価し、関連情報を検索する必要があるかどうかを判断する。検索が必要な場合、モデルは関連するドキュメントを検索し、その情報を利用して応答を改善する。この自己評価と検索のプロセスを繰り返すことで、より正確で信頼性の高い応答を生成できる。
Self-RAGの処理フロー
Self RAGの利点
Self RAGの主な利点は、その柔軟性と精度にある。外部の検索システムに依存しないため、特定のタスクやドメインに最適化された検索戦略を学習できる。また、自己評価を行うことで、不確実な情報や誤った情報を排除し、より信頼性の高い応答を生成できる。さらに、検索プロセスを制御することで、計算資源の効率的な利用が可能になる。
Self RAGの応用例
Self RAGは、様々な分野での応用が期待される。例えば、質問応答システムにおいて、より正確な回答を提供するために利用できる。また、コンテンツ生成の分野では、事実に基づいた高品質な記事やレポートを自動生成するために利用できる。さらに、教育分野では、学生の学習を支援するためのパーソナライズされた教材を作成するために利用できる。
Self RAGとRAGの比較
| 比較項目 | RAG | Self RAG |
|---|---|---|
| 回答品質の自己評価フェーズ | 取得した知識に対し無条件に回答を生成し返す | 生成した出力を自己検証し品質をスコアリング |
| 検索要否の自動判断ロジック | 出力結果に対する再検索ループ構造は持たない | 検証結果が閾値以下ならループし再検索を実行 |
| 出力結果の再検索ループ | 元の文書の質に依存しハルシネーションリスクあり | 誤情報の出力を自己棄却しハルシネーションを大幅抑制 |
| ハルシネーションの抑制効果 | 一回の取得と生成のみでシステムレイテンシは低い | 自己検証プロセスにより推論レイテンシが大幅増大 |
| システムレイテンシ | シンプルなユースケースに適合し利用シナリオが限定的 | エンタープライズや複雑なビジネス要件等に適合する |
検索拡張のハルシネーション対策の度合いです。応答速度と簡潔なフローで事足りるなら通常のRAG、自己評価ループを挟んででも誤情報の出力を最小化したいならSelf RAGを採用します。
