AIOps
読み: エーアイオプス
AIOpsとはIT運用をAIで効率化
AIOpsはシステムから生成される膨大なログやパフォーマンスデータを機械学習で分析し障害の予兆検知から原因特定復旧までのIT運用プロセスを人の手を介さずに自律させる次世代の運用手法。
かんたんに言うと
熟練のインフラエンジニアが24時間365日休まず数万行のログを瞬時に読み解きサーバーが落ちる前に再起動コマンドを叩き続けるようなものである。
アラートの波に溺れるIT運用を変えるAIOpsの基本概念
Gartnerが提唱した概念。ITOMやITSMの領域で人間がアラートの波に溺れるのを防ぐ役割を持つ。物流拠点のWMSが止まればトラックが長蛇の列を作る。そんな修羅場でZabbixから飛んでくる大量のPing応答遅延アラートを人間が一つずつ見ている余裕はない。本当に人間が監視画面に張り付くべきなのか。判断が分かれるところである。古い体質の企業では監視オペレーターの目視に依存しているが人間の注意力には限界がある。AIOpsは膨大なノイズから真の異常だけを抽出する。ただ概念先行で導入すると痛い目を見る。現場の運用フローを無視した導入は混乱を招くだけである。
機械学習とビッグデータが支えるAIOpsの仕組み
ビッグデータを食わせ機械学習で異常を検知し自然言語処理で過去のインシデントチケットから解決策を引っ張ってくる。これが基本の動きである。だがログのフォーマットがバラバラだとゴミしか生まれない。正規化されていないsyslogをそのまま突っ込んでモデルが意味不明な相関を見つけ出す。これは現場でよく見る落とし穴である。データのクレンジングにどれだけの工数を割けるか。ここでプロジェクトの成否が決まる。ベンダーは魔法のように語るが裏側は泥臭いデータ整備の連続である。綺麗なデータ基盤がない組織にAIOpsは早すぎる。
ビジネス現場での実用例と代表的ツール
SplunkやDynatraceそしてDatadogやServiceNowが覇権を争っている。製造業の生産管理システムでDatadogがAPMのトレースからDBのデッドロックの予兆を検知しServiceNowにインシデントを起票する。こういった連携はもはや珍しくない。Dynatraceはトポロジーを勝手に描画してくれる。非常に優秀である。しかしライセンス体系が複雑で予算取りが悩ましい。ツールを入れればすべて解決するわけではない。自社のインフラ構成に合わないツールを選べばただの高価なダッシュボードに成り下がる。
導入がもたらす恩恵と運用上の限界
アラートノイズを減らせるのは確かに懸かっている。深夜の不要な電話で叩き起こされる回数は減る。しかしデータサイエンティストがいない現場で誰がモデルのチューニングをするのか。ベンダーは設定不要と言うが信じてはいけない。結局自社のシステム構成を深く理解しているエンジニアが泥臭くラベル付けをする羽目になる。運用負荷を下げるために入れたツールで運用負荷が上がる。この矛盾にどう折り合いをつけるか。現場のスキルセットとツールの要求水準のギャップは常に頭を悩ませる問題である。
自社にAIOpsは必要か導入を判断するための重要指標
KPIやSLAをどう設定するか。PoCをやるにしても評価基準が曖昧だとズルズルと期間だけが延びる。スモールスタートで始めるべきか一気に全社展開するか。これは組織の体力次第で判断が分かれる。結局のところAIOpsを導入しても夜間コールから完全に解放される日はまだ遠い。ページャーの鳴らない夜を金で買うかそれとも気合いで乗り切るか。現場の疲弊度と予算の天秤はいつの時代も揺れ動いている。魔法の杖を求める経営層と現実を知る現場の溝を埋めるのは容易ではない。
当社の見解
当社は機密情報のマスキング処理を全てローカルAIで行っている。これにより機密情報を外部に送信せずにAI処理できるようになった。だが、AIが嘘をつくハルシネーションの問題は依然としてある。確認していないのに「確認しました」と言う。当社はこの前提で運用を設計している。事実と推測の強制分離、ファクトチェック機能、3つのAIと人間の同士の三重検証を行っている。どこまでいっても、AIは完璧ではない。理論上100%安全設計をしていても、AIも人間も想定しないことは起こるものだ。その万が一に備えておくことが、AIを使う上では前提になっている。だろうではなく、かもしれない運用がAIを使う上での安全基盤となっている。
同じ失敗を二度としないAIエージェント
今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。
当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。
古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。
