CI/CD
読み: シーアイ・シーディー
CI/CDとはAIの開発運用を自動化
AIモデルのコード変更から再学習、テスト、本番環境への展開に至る一連のプロセスを無人化し、常に最新の推論精度を維持するための開発運用手法。
かんたんに言うと
料理のレシピ変更から味見、店舗での提供までを、人間の手を介さずにベルトコンベアで回し続ける厨房の仕組み。
AIモデルの精度を維持し続けるCI/CDパイプラインの基本概念
AIモデルは一度作って終わりではない。データの傾向が変われば精度は落ちる。だからこそMLOpsの概念が生まれ、CIとCDのパイプラインが求められるようになった。ソースコードや学習データを更新した際、即座にビルドとテストを走らせるのがCIである。そしてテストを通過したモデルを本番環境へデプロイするのがCDの役割となる。
理屈は簡単である。
だが、従来のソフトウェア開発と同じ感覚で機械学習のパイプラインを組むと痛い目を見る。コードのテストだけでなく、データの品質チェックやモデルの推論精度の検証まで組み込む必要があるからである。学習にGPUリソースをどれだけ割り当てるか、コストとの兼ね合いも悩ましい。
物流や製造現場での実運用と主要ツール群
例えば物流センターの配送ルート最適化や、製造ラインの画像認識による不良品検知。こうした現場では、日々の稼働データを取り込んでモデルを更新し続けなければ使い物にならない。
ここで出番となるのがGitHub ActionsやGitLab CIである。コード管理と密接に連携し、手軽にパイプラインを回せる。古くからあるJenkinsをオンプレミス環境で使い倒している製造業も少なくない。
Kubeflowを導入してKubernetes上でゴリゴリに回す企業もある。
ただ、ツールを入れれば解決するほど甘くはない。現場の作業員が入力するデータフォーマットが突然変わる。そんな些細なことでパイプラインは簡単に停止する。ツール選びよりも、現場の運用ルールをどう統制するかのほうがよほど骨が折れる。
導入の光と影そして運用上の限界
手作業によるデプロイ作業をなくし、人為的ミスを減らせるのは確かに懸かっている。しかし、初期の構築コストは決して安くない。
一番の厄介事はデータドリフトである。入力データの分布が時間とともに変化し、モデルの精度が劣化する現象を指す。CI/CDの仕組みがあれば再学習は容易だが、そもそもいつ再学習をトリガーするかの閾値設定で判断が分かれる。
敏感に反応させすぎれば計算コストが跳ね上がる。
逆に鈍感すぎれば、精度の落ちたモデルが現場で誤検知を連発する。さらに、場当たり的なパイプラインの改修を重ねることで技術的負債が雪だるま式に膨れ上がるケースも見てきた。何でもかんでもシステムに任せれば良いというわけではない。
自社に導入すべきかを判断するための評価基準
結局のところ、自社の組織がアジャイル開発の文化にどれだけ馴染んでいるかが問われる。
数ヶ月に一度しかモデルを更新しない経理部門の需要予測であれば、大掛かりなCI/CDパイプラインなど無用の長物である。手動デプロイで十分事足りる。
逆に、毎日数万件のトランザクションを処理する営業部門のダイナミックプライシングなら、導入しない手はない。PoCの段階で精度のKPIだけでなく、運用フェーズでの更新頻度まで見据えておくべきである。
あなたの組織は、モデルの劣化を許容できるビジネスモデルだろうか。
それとも、常に最新の推論結果を要求されるシビアな環境だろうか。技術の導入ありきではなく、ビジネスの要求速度から逆算してインフラの規模を決めるべきである。
当社の見解
当社は機密情報のマスキング処理を全てローカルAIで行っている。これにより機密情報を外部に送信せずにAI処理できるようになった。だが、AIが嘘をつくハルシネーションの問題は依然としてある。確認していないのに「確認しました」と言う。当社はこの前提で運用を設計している。事実と推測の強制分離、ファクトチェック機能、3つのAIと人間の同士の三重検証を行っている。どこまでいっても、AIは完璧ではない。理論上100%安全設計をしていても、AIも人間も想定しないことは起こるものだ。その万が一に備えておくことが、AIを使う上では前提になっている。だろうではなく、かもしれない運用がAIを使う上での安全基盤となっている。
同じ失敗を二度としないAIエージェント
今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。
当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。
古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。
