DataRobot

DATAROBOT
読み: データロボット

読み: データロボット

DataRobotとは自動ML活用法

DataRobotは、機械学習モデルの構築から運用までを自動化するAutoMLプラットフォームである。データをアップロードするだけで数十種類のアルゴリズムを同時に試行し、最も精度の高いモデルを提案する。コーディング不要で予測モデルを作れるため、データサイエンティストが不在の企業でもAI活用の入口として利用されている。

かんたんに言うと

料理の材料を渡すと、何十通りものレシピを同時に試作して「一番おいしかったのはこれです」と出してくれるシェフのような存在である。

データを入れるだけで最適モデルを提案するDataRobotのAutoMLエンジン

DataRobotの核はAutoML(自動機械学習)エンジンにある。CSVやデータベースから読み込んだデータに対して、ランダムフォレストXGBoostニューラルネットワークなど数十のアルゴリズムを自動で適用する。特徴量エンジニアリング(どの変数をどう加工するか)も自動で試行する。
結果はリーダーボードに精度順で並ぶ。ユーザーは上位のモデルを選んでデプロイするだけでよい。
ここまで聞くと魔法のようだが、現実はそう単純ではない。入力データの質が低ければ、どんなアルゴリズムを走らせても精度は上がらない。「ゴミを入れればゴミが出る」はAutoMLでも変わらない。

ビジネスユーザー向けのAI民主化という思想

DataRobotの創業者Jeremy Achinが掲げたのは「AI民主化」という理念である。機械学習をデータサイエンティストの専売特許から解放し、営業やマーケティングの担当者が自分で予測モデルを作れるようにする。
この思想は一定の成果を出した。実際に、Excelでデータ分析をしていた事業部門がDataRobotで離反予測モデルを構築し、解約率を下げた事例は複数報告されている。
ただし「民主化」には落とし穴もある。統計の基礎知識がないまま予測モデルを運用すると、過学習(訓練データに過剰にフィットして未知のデータで外す)に気づけない。「精度99%」という数字に安心して本番投入したら、実際の予測はボロボロだった、という話は珍しくない。

具体的な活用シーンと導入企業の傾向

最も多い活用シーンは需要予測と顧客離反予測である。小売業では来月の商品別販売数量を予測し、在庫の最適化につなげる。金融業では融資の貸し倒れリスクをスコアリングする。製造業では設備の故障予兆を検知する。
導入企業の傾向として、データサイエンティストを大量に抱えるテック企業よりも、AI専任チームが数名しかいない事業会社のほうが多い。自前でモデルをゼロから書く余裕がないからこそ、AutoMLに頼る必要がある。
日本市場ではDataRobotの営業体制が手厚いこともあり、大手企業の導入事例が比較的豊富に公開されている。

競合ツールとの立ち位置

AutoML市場にはGoogle CloudのAutoML Tables、H2O.ai、Amazon SageMakerのAutopilotなど競合が複数存在する。
DataRobotの差別化ポイントは「説明可能性」にある。予測結果に対して「どの変数がどの程度影響したか」を可視化するExplainability機能が充実しており、金融や医療など規制業界で「ブラックボックスでは困る」という要件に応えやすい。
一方で、価格は競合より高い。年間ライセンスが数千万円に達するケースもある。クラウドベンダーが自社プラットフォームの一機能としてAutoMLを無料に近い価格で提供する中、DataRobotの価格設定は中小企業にとってハードルが高い。

導入を検討する際に見落としがちなポイント

DataRobotを導入しても、社内にデータ分析の文化がなければ宝の持ち腐れになる。モデルを作るのは簡単でも、そのモデルの出力を業務判断にどう組み込むかは人間が設計しなければならない。
「離反しそうな顧客リスト」がモデルから出てきたとして、そのリストを見て誰が何をするのか。営業がフォローコールをかけるのか、クーポンを配信するのか、何もしないのか。この業務プロセスの設計がないままモデルだけ作っても、投資対効果は出ない。
まずは小規模なPoCで「モデルの出力を業務に組み込めるか」を検証し、組み込めると確認できてから本格導入に踏み切るのが現実的な進め方である。

当社の見解

データパイプラインは「動けばいい」で作ると、3か月後に保守不能になる。当社のAI記憶システムは18ステップの夜間統合パイプラインを毎日自動実行している。最も痛い教訓は、データとデザインを分離しなかったことで起きた事故だ。1,500ページのコンテンツを一括更新した際、データとHTMLが混在していたために全ページが壊れた。以降、データはデータベースに、デザインはテンプレートに分離する設計に切り替えた。

同じ失敗を二度としないAIエージェント

今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。

当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。

古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。

相談する