コンテキストとは

CONTEXT

読み: コンテキスト

公開日 2026.03.26 最終更新 2026.04.03

コンテキストとは、AIが応答を生成する際に参照する文脈情報の総称である

読み: コンテキスト

システムプロンプト、過去の会話履歴、外部から注入された参考情報など、モデルが「今何について話しているか」を判断するための材料がすべてコンテキストに含まれる。

かんたんに言うと

AIに渡す「前提情報」のことである。人間同士の会話で「話の流れ」や「前提知識」がないと会話が成立しないのと同じで、AIも文脈なしでは的確な応答を返せない。

AIの応答精度を左右するコンテキストウィンドウという制約

すべてのLLMにはコンテキストウィンドウと呼ばれる入力上限がある。これは一度に処理できるトークン数の上限であり、モデルの設計時に決まる。
GPT-4oは128Kトークン、Claude 3.5 Sonnetは200Kトークン、Gemini 1.5 Proは最大200万トークンに対応している。数字だけ見ると十分に思えるが、日本語は英語に比べてトークン効率が悪い。同じ文章量でもトークン消費が1.5倍から2倍になることがある。
社内の業務マニュアル200ページをまるごと放り込もうとすると、あっさり上限に達する。コンテキストは無限ではない。

Lost in the Middleと呼ばれる注意力の偏り

2023年にスタンフォード大学の研究チームが発表した論文で、LLMはコンテキストの先頭と末尾の情報に注意を集中させ、中間部分の情報を見落とす傾向があることが示された。これがLost in the Middle問題である。
20件の文書をコンテキストに入れた場合、正解が1件目や20件目にあれば正答率が高いが、10件目あたりに埋もれていると精度が大きく落ちる。
つまり、コンテキストに情報を詰め込めば詰め込むほど賢くなるわけではない。むしろ関連性の高い情報だけを選んで、適切な順序で配置する工夫が求められる。

RAGによるコンテキストの動的構築

コンテキストウィンドウの制約を回避する代表的な手法がRAGである。ユーザーの質問に関連する情報だけをベクトルデータベースから検索し、必要な分だけコンテキストに注入する。
静的に大量の文書を詰め込むのではなく、質問ごとにコンテキストの中身を動的に入れ替える。これにより、限られたウィンドウサイズでも効率的に外部知識を活用できる。
とはいえ、検索精度が低ければ無関係な情報がコンテキストを埋め尽くす。セマンティック検索のチューニングがコンテキストの質を左右する。

プロンプトエンジニアリングとコンテキスト設計

コンテキストの質はプロンプトの設計で大きく変わる。システムプロンプトで役割を定義し、Few-shotの例示で回答形式を示し、ユーザーの過去の発言を会話履歴として保持する。これらすべてがコンテキストの構成要素である。
実務では「何を入れるか」より「何を入れないか」の判断が重要になる。不要な会話履歴を引きずると、トークンを浪費するだけでなく、モデルが古い文脈に引きずられて的外れな応答を返す原因にもなる。
会話が長くなるほどコンテキスト管理の難易度は上がる。要約して圧縮するか、古い履歴を切り捨てるか、外部の記憶システムに退避させるか。正解は用途によって異なる。

コンテキスト長の拡大がもたらす変化と実務への影響

2024年以降、100万トークン超のコンテキストウィンドウを持つモデルが登場し始めた。書籍1冊をまるごと入力できる規模である。
これにより「検索してから渡す」というRAGの発想自体が不要になるのではないか、という議論がある。全文を放り込めるなら検索の手間を省ける。
ただし現実には、コンテキストが長くなるほど推論コストは増大し、応答速度は低下する。Lost in the Middleの問題も完全には解消されていない。長いコンテキストを「処理できる」ことと「正確に活用できる」ことは別の話である。

当社の見解

当社ではClaude Code、Antigravity（Gemini）、Codex（OpenAI）の3つのAIエージェントを日常業務で併用している（2026年4月現在）。この体制により、社員1人あたり複数のAIが並行して作業を進め、人間は判断とレビューに集中できるようになった。エージェント間の記憶共有により「別のAIに同じ説明を繰り返す」無駄が消え、プロジェクトの引き継ぎコストがゼロに近づいた。失敗の教訓が自動で次の作業に注入される仕組み（Agentic RAG）も構築し、同じミスの再発率を構造的に下げている。さらにProactive AI（意図先読み型アシスタント）を実装し、ユーザーがメッセージを送る前に関連する過去の記憶を自動検索・注入する仕組みを稼働させている（意図分類精度80%、応答時間3.6秒）。

同じ失敗を二度としないAIエージェント

今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。

当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。

古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。

相談する