DSPy
読み: ディーエスパイ
DSPyとはプロンプト自動最適化
DSPyは属人的な手作業に依存していたプロンプト調整を排除し、プログラムによって大規模言語モデルの処理フローを最適化するStanford University発のフレームワーク。
かんたんに言うと
熟練の職人が感覚で火加減を調整していた窯焼きを、温度センサーと制御プログラムで誰でも同じ焼き上がりにする工業用オーブンに似ている。
手作業のプロンプト調整を排除するDSPyの基本概念
プロンプトエンジニアリングという言葉がもてはやされて久しい。だが、実務の現場で「あなたは優秀なアシスタントです」と呪文をこねくり回す作業にどれほどの価値があるのか。
Stanford Universityが開発したDSPyは、この不毛な手作業を根底から否定する。
LLMの挙動を自然言語の微調整ではなく、Pythonのコードとして定義し直すアプローチ。
プロンプトの文言に依存するのではなく、入力と出力の型を定義すれば、フレームワーク側が最適な指示を生成する。モデルのバージョンが上がるたびにプロンプトを書き直す徒労から解放される。
ただ、非エンジニアの管理職にこの概念を理解させるのは骨が折れる。
プロンプトを手作業からプログラムへ移行する仕組み
DSPyの動作原理は、SignatureとModuleという概念で構成される。
Signatureは「何をするか」を定義するインターフェースである。例えば「契約書の条文を入力し、リスク度を出力する」といった具合に。
そしてModuleが、そのSignatureを基にLLMを呼び出す具体的な処理を担う。
さらにTeleprompterと呼ばれるオプティマイザが、用意されたデータセットを使ってプロンプト自体を最適化していく。
人間が思いつきで単語を入れ替えるのではなく、アルゴリズムが最も精度の高いプロンプトを探索するのである。
この仕組みを理解せずに導入を進めると、結局は元の手作業に戻ってしまう現場を何度も見てきた。
法務や製造におけるDSPyの活用事例
法務部門での契約書審査プロセスを考えてみよう。
LlamaIndexを使って過去の判例や社内規定を検索するRAGを組む際、検索クエリの生成や回答の要約にDSPyを組み込む。
従来なら「法務担当者のように厳密に」とプロンプトに書いていた部分を、DSPyのオプティマイザが過去の修正履歴から最適な指示を導き出す。
製造業の不良品検知レポート生成でも同様である。センサーの数値データから異常の原因を推測させる際、OpenAIの最新モデルに切り替えても、DSPy側で再コンパイルすればプロンプトはプログラムによって再構築される。
モデル依存からの脱却。これが現場でどれほどありがたいか、運用を経験した者ならわかるはずである。
DSPy導入がもたらす業務上の利点と技術的な壁
出力品質のブレを抑え、システムとしての安定性を高める点において、DSPyの右に出るものはない。
だが、手放しで喜べるわけではない。
最大の壁は、高度なプログラミング知識が要求されること。Pythonのクラス設計や機械学習の評価指標に対する理解がなければ、Teleprompterを回すためのデータセットすら適切に準備できない。
プロンプトをいじるだけの自称AIエンジニアには到底扱えない代物である。
導入すべきか否か。
現場のスキルセットを冷徹に見極めなければ、無用の長物と化すリスクがあり、判断が分かれるところである。
自社のAIプロジェクトにDSPyを採用すべきかの判断基準
結局のところ、自社の開発体制がDSPyの要求水準に達しているかが全てである。
APIを叩いて喜んでいるレベルのチームに導入しても、学習コストに押し潰されるだけである。
一方で、数万件のデータを処理し、数パーセントの精度向上が数千万円の利益に直結するようなシビアな環境なら、迷わず採用すべきである。
プロンプトの職人芸に会社の命運を託すのか、それともソフトウェア工学の土俵に引きずり込むのか。
AIをシステムとして運用する覚悟が問われている。非常に悩ましい選択である。
当社の見解
当社ではClaude Code・Antigravity・Codexの3つのAIエージェントを日常業務で併用している。記憶を共有しているため、別のAIに同じ説明を繰り返す必要がない。ただし、記憶共有だけでは足りなかった。一方のAIが他方の成果物を勝手に修正して壊す事故が起きた。これを受けてファイル所有権制度を導入し、どのAIがどのファイルを所有するかを定義した。AIの自主性に頼らず、仕組みで上書きや巻き戻りを防いでいる。
同じ失敗を二度としないAIエージェント
今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。
当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。
古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。
