Knowledge Baseとは

KNOWLEDGE BASE
読み: ナレッジ・ベース

Knowledge Baseとは、生成AIが自社特有の正確な回答を生成するための情報源であり、RAG技術の根幹をなすデータ群である

読み: ナレッジ・ベース

Knowledge Baseは生成AIが自社特有の正確な回答を生成するための情報源であり、RAG技術の根幹をなすデータ群である。汎用的なLLMが持ち合わせていない社内の機密情報や専門知識を格納し、ハルシネーションを防ぐための絶対的な土台として機能する。

かんたんに言うと

優秀な料理人(AI)に渡す、厳選された専用の食材庫。食材が腐っていれば、どんなに腕が良くても腹を壊す料理しか出てこない。

Knowledge Baseが生成AIのハルシネーションを防ぐ情報源として機能する理由

LLMは息を吐くように嘘をつく。GPT-4oだろうがClaude 3.5 Sonnetだろうが、自社の就業規則や未発表の製品仕様を知る由もない。そこでRAGの出番となるわけだが、その検索対象となるデータ群がKnowledge Baseである。これがないRAGは、ただの空箱に等しい。どんなに優秀な検索アルゴリズムを組んでも、元となる情報がなければAIは適当な言葉を紡ぎ出す。ハルシネーションを抑え込むための絶対的な土台。それがKnowledge Baseの正体である。

社内データがAIの回答に変換される仕組み

PDFやWordファイルをそのまま放り込めばAIが理解してくれる。そんな幻想を抱いている担当者はまだ多い。実際には泥臭い前処理が待っている。長大なマニュアルは意味の通るサイズにチャンク分割され、エンベディングモデルによって数値の羅列へと変換される。それをPineconeQdrantといったベクトルデータベースに格納して初めて、AIはユーザーの質問に近い情報を引っ張り出せるようになる。この分割サイズをどう設定するかで回答の精度が劇的に変わるから悩ましい。500トークンで切るか、1000トークンか。正解はデータによって違う。

現場を動かす活用シーンと代表的ツール

法務部門での契約書レビューを想像してほしい。過去のNDAや業務委託契約書をKnowledge Baseに蓄積しておけば、DifyやAmazon Bedrockで構築した社内AIが、自社に不利な条項を瞬時に指摘する。人事ならどうである。膨大な社内規程や過去の労務トラブル対応履歴を読み込ませる。新任の人事担当者が育休明けの時短勤務中の残業代計算について質問すれば、即座に正確な社内ルールが返ってくる。Notion AIをそのまま社内ポータルに組み込む手もあるが、権限管理の甘さが命取りになることもある。

導入がもたらす恩恵と運用上の壁

自社専用のAIが手に入る。響きはいいが、現実は甘くない。最大の壁はノイズデータである。ファイルサーバーの奥底に眠る「就業規則_2018年版_最終_修正2.pdf」のようなゴミデータまでKnowledge Baseに突っ込むと、AIは平気で古いルールを回答に混ぜてくる。データガバナンスが崩壊している企業では、まずゴミ掃除から始めなければならない。さらに、役員報酬の規定を一般社員が検索できてしまうようなアクセス制御のミスも起きやすい。どこまでデータを綺麗に保てるか。運用担当者の力量が問われる。

自社に最適なAI環境を構築するための評価基準

結局のところ、どこまでコストと手間をかけられるかに懸かっている。Azure OpenAI Serviceを使ってセキュアな閉域網を組むのか。それともオンプレミスのサーバーにLlama 3を立てて完全に外部から遮断するのか。コンプライアンス要件が厳格な製造業の設計部門などでは、後者の選択肢も現実味を帯びてくる。導入にかかる初期費用と運用コストを天秤にかけ、ROIをどう弾き出すか。すべてをAIに任せようとするから失敗する。どの業務の、どのデータをKnowledge Baseに置くべきか。その選別こそが、実務家の腕の見せ所である。判断が分かれるところだが、まずは陳腐化しない静的なデータから手をつけるのが無難だろう。

当社の見解

当社はAI長期記憶システムを自社開発・運用している。開発のきっかけは、AIと経営戦略の壁打ちで出した結論がセッション切れで消えたことで絶望を感じた。1日かけて議論してきたことを振り返り、では事業計画書に落とし込むように指示を出したところ、「そのような記録はありません」と言われたことで、強烈な危機感を覚えこれは何としても解決しなければならない問題だと感じた。記憶がないAIは毎朝記憶喪失になる新入社員と同じだ。記憶があるAIは、前提条件を理解した上で本題に入れる。短いプロンプトで済むようになり、「前に言ったように実行して」と曖昧で短いプロンプトでも業務を遂行してくれる。同じことを繰り返し伝える回数も減り、開発業務でも同じミスを繰り返しにくくなり、人間の手戻りが減り、ストレスも減る。AIで本当に業務の質を上げるならば、記憶はマストである。

同じ失敗を二度としないAIエージェント

今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。

当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。

古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。

相談する