Multi-cloud
読み: マルチクラウド
マルチクラウドとはAI基盤戦略
特定のクラウドベンダーに縛られず複数のクラウドサービスを組み合わせて自社に最適なAIモデルの開発や運用を行う次世代のインフラ戦略。
かんたんに言うと
腕利きの料理人が肉は精肉店から魚は市場から野菜は農家から直接仕入れるようなものである。スーパー一軒で済ませるより手間はかかるが最高のフルコースを作るための必然的な選択と言える。
特定ベンダーへの依存リスクを回避するマルチクラウドの基本概念
AWSのBedrockでClaude 3を動かしつつデータ基盤はGoogle CloudのBigQueryに置く。あるいはAzure OpenAI ServiceでGPT-4を叩きながら社内システムとの連携はAWSのLambdaで処理する。これが今のAI開発現場のリアルである。
単一のクラウドに全てを預けるベンダーロックインを嫌う声は昔からあった。だが生成AIの台頭で事情が変わった。
各社が提供するモデルの性能競争が激しすぎるのである。
昨日まで最高だったモデルが今日には他社の新モデルに抜かれる。特定のクラウドに依存しているとこの進化のスピードについていけない。だからこそ複数のクラウドを渡り歩くマルチクラウドが前提になりつつある。
複数クラウドを連携させるAIシステムの仕組み
では具体的にどうやって複数のクラウドを繋ぐのか。
基本はコンテナ技術。Dockerで環境をパッケージ化しKubernetesでオーケストレーションする。これでAWSのEKSだろうがGoogle CloudのGKEだろうが同じようにAIモデルをデプロイできる。
ただ言うほど簡単ではない。
クラウド間のネットワーク接続には専用線やVPNを使うがここでAPIの認証周りが泥沼化する。AWSのIAMとAzureのEntra IDをどう統合するのか。現場のエンジニアは日々この設定ファイルと睨み合っている。
本当にそこまでして複数クラウドを跨ぐ必要があるのか。アーキテクチャを描く段階でいつも判断が分かれる。
製造業と物流業における実運用とプラットフォーム
物流の現場を想像してほしい。
全国の配送ルート最適化にはSnowflakeに蓄積された過去の配車データを食わせている。そのデータを使ってDatabricks上で需要予測モデルを回す。推論自体はエッジに近いAWSのローカルゾーンで処理し遅延を極限まで削る。
製造業の歩留まり予測も似たような構成である。
工場内のセンサーデータはAzure IoT Hubで受け学習フェーズだけはGPUリソースが確保しやすいGoogle CloudのVertex AIに投げる。Amazon SageMakerで全て完結させれば楽なのだがコストと計算資源の空き状況を天秤にかけるとどうしてもクラウドを跨がざるを得ない。
現場の泥臭い調整の連続である。
マルチクラウド環境がもたらす恩恵と技術的障壁
いいとこ取りができる。これは間違いない。
だが代償としてエグレス料金という名の税金を払うことになる。クラウドからデータを外に出す際の通信料である。テラバイト級の学習データをAWSからGoogle Cloudへ転送した月の請求書を見て経理担当者が血相を変えて飛んできたことがある。
レイテンシの問題も無視できない。
クラウドを跨ぐAPIコールが1回の推論で数十回発生すれば当然レスポンスは遅延する。リアルタイム性が求められるシステムでは致命傷になりかねない。
セキュリティの境界線も曖昧になる。どこで誰がどのデータにアクセスしたのか追跡するだけでも一苦労である。
自社のAIプロジェクトにおける導入判断のポイント
結局マルチクラウドに踏み切るべきなのか。
FinOpsの観点から言えばインフラ管理の専任チームがいない組織には絶対にお勧めしない。単一クラウドの割引プログラムを使い倒した方がトータルコストは安くつくことが多いからである。
ガバナンスの目が行き届かないままクラウドを増やすと野良AIが乱立する。
自社のデータ基盤の成熟度を直視してほしい。まずは一つのクラウドでまともなMLOpsを回せるようになっているか。
それができていないのにマルチクラウドを語るのは基礎工事が終わっていない土地に高層ビルを建てるようなもの。悩ましい選択だが身の丈に合ったインフラを選ぶしかない。
当社の見解
当社は機密情報のマスキング処理を全てローカルAIで行っている。これにより機密情報を外部に送信せずにAI処理できるようになった。だが、AIが嘘をつくハルシネーションの問題は依然としてある。確認していないのに「確認しました」と言う。当社はこの前提で運用を設計している。事実と推測の強制分離、ファクトチェック機能、3つのAIと人間の同士の三重検証を行っている。どこまでいっても、AIは完璧ではない。理論上100%安全設計をしていても、AIも人間も想定しないことは起こるものだ。その万が一に備えておくことが、AIを使う上では前提になっている。だろうではなく、かもしれない運用がAIを使う上での安全基盤となっている。
同じ失敗を二度としないAIエージェント
今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。
当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。
古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。
