DAG
読み: ダグ
DAGとはAI開発の処理フロー設計図
DAGとは、Directed Acyclic Graph(有向非巡回グラフ)の略で、処理の手順やデータの流れを一方通行かつループなしで定義する設計図。MLOpsのパイプライン管理、ディープラーニングの計算グラフ、LLMエージェントの実行フロー制御で広く使われる。
かんたんに言うと
料理の手順書で「材料を切る→炒める→盛り付ける」と一方向に進む流れ図。途中で「盛り付けてから切り直す」ような逆戻りは許されない。
MLOpsパイプラインの依存関係管理
「データ抽出→前処理→学習→精度評価→デプロイ」という一連のワークフローをDAGとして定義する。前処理が終わらないと学習を始めない、という依存関係を厳格に管理できる。
互いに依存しないタスク(画像の前処理とテキストの前処理など)は自動で並列実行される。途中でエラーが起きても失敗箇所から再開できる。Apache Airflow、Kubeflow、Vertex AI Pipelinesが代表的なツール。
計算グラフとLLMエージェントの実行制御
ディープラーニングの裏側でもDAGは動いている。TensorFlowやPyTorchは、Pythonコードから計算グラフ(DAG)を自動構築し、誤差逆伝播の微分を自動計算する。
LLMエージェント開発でもDAGの概念が活きている。「ユーザーの質問を分類→データベース検索orWeb検索→結果を要約して回答」という実行フローをDAGで定義することで、処理が絡まらない。LangChainのLCELやLangGraphがこの構造を採用している。
当社の見解
当社はツール選定において実用性を第一方針にしている。カタログスペックやベンチマークスコアではなく、実務で1週間使い倒して初めて判断する。フレームワークを増やすほど管理コストが増える経験もした。フックを増やしすぎてAIが情報過多でパニックになったこともある。足し算だけでなく、引き算の判断が選定の質を決める。検証せずに導入したツールは、ほぼ例外なく3か月以内に使わなくなった。
同じ失敗を二度としないAIエージェント
今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。
当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。
古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。
