Retrieval Augmented Generation
読み: リトリーバル・オーグメンテッド・ジェネレーション
検索拡張生成とはRAGの仕組みを解説
Retrieval-Augmented Generationは大規模言語モデルに外部データの検索機能を組み合わせ、もっともらしい嘘を抑止しながら最新かつ正確な回答を生成するAI技術。
かんたんに言うと
記憶喪失の優秀なアシスタントに、最新の社内マニュアルや顧客台帳を渡してから質問に答えさせる仕組み。
学習データの限界を外部検索で補いハルシネーションを抑止する仕組み
LLMは息を吐くように嘘をつく。
ハルシネーションと呼ばれるこの現象は、モデルが学習データに含まれない未知の事象を推測で埋めようとするから起きる。これを防ぐのがRetrieval-Augmented Generationの基本思想である。
まず社内文書をエンベディングモデルで数値化し、PineconeやQdrantといったベクトルデータベースに格納する。ユーザーが質問を投げた際、LLMが答える前にこのデータベースを検索し、関連するテキストを抽出する。その抽出結果をプロンプトに添えてLLMに渡す。
ただこれだけのこと。
しかし、この一手間が回答の精度を劇的に変える。
企業における実用例と代表的な開発ツール
法務部門での契約書審査や、製造現場での過去の不具合報告書の検索。
これらはRAGが最も活きる領域である。例えば、法務担当者がA社とのNDAにおける損害賠償の上限はと問う。RAGは即座に該当の契約書をベクトル検索し、正確な条項を引っ張ってくる。
開発環境としては、Azure OpenAI ServiceやAmazon Bedrockがよく使われる。最近はノーコードでRAGパイプラインを構築できるDifyの採用も増えた。
ただ、ツールを入れれば魔法のように動くわけではない。
PDFの表組みや手書きメモの読み取りで躓く現場を山ほど見てきた。チャンク分割のサイズをどう設定するか。ここでエンジニアの腕が問われる。
ビジネス上のメリットと技術的な限界
RAGの最大の利点は、ファインチューニングを行わずに自社の機密情報を安全に扱える点にある。モデル自体にデータを学習させないため、情報漏洩のリスクを抑えやすい。
だが、検索精度への依存という厄介なトレードオフが存在する。
ベクトル検索が的外れな文書を拾ってくれば、どれだけプロンプトエンジニアリングを駆使してもLLMはゴミを出力する。Garbage In, Garbage Outの原則はここでも健在である。
社内のファイルサーバーに眠るゴミデータをそのままベクトル化して、使い物になるだろうか。
ならない。
データクレンジングの泥臭い作業から逃げることはできないのである。
自社環境へ導入するための判断材料と推進ステップ
結局のところ、RAGを導入すべきかどうかの判断はデータガバナンスの成熟度に依存する。社内規定やマニュアルが散逸し、どれが最新版か誰も知らない状態なら、まずはドキュメントの整理から始めるべきである。
費用対効果を測るためのPoCを実施する企業は多い。
しかし、数百万の予算をつぎ込んで検索精度が60パーセントでしたで終わるプロジェクトのなんと多いことか。ROIを算出する以前に、どの業務のどのプロセスに組み込むのか、解像度が低すぎるのである。
経理部門の領収書処理に使うのか、営業の提案書作成に使うのか。ターゲットを絞り込まなければ、ただの高級な社内検索エンジンで終わってしまう。
どう着地させるか、実務担当者としては常に悩ましい。
当社の見解
当社はAI長期記憶システムを自社開発・運用している。開発のきっかけは、AIと経営戦略の壁打ちで出した結論がセッション切れで消えたことで絶望を感じた。1日かけて議論してきたことを振り返り、では事業計画書に落とし込むように指示を出したところ、「そのような記録はありません」と言われたことで、強烈な危機感を覚えこれは何としても解決しなければならない問題だと感じた。記憶がないAIは毎朝記憶喪失になる新入社員と同じだ。記憶があるAIは、前提条件を理解した上で本題に入れる。短いプロンプトで済むようになり、「前に言ったように実行して」と曖昧で短いプロンプトでも業務を遂行してくれる。同じことを繰り返し伝える回数も減り、開発業務でも同じミスを繰り返しにくくなり、人間の手戻りが減り、ストレスも減る。AIで本当に業務の質を上げるならば、記憶はマストである。
同じ失敗を二度としないAIエージェント
今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。
当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。
古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。
