R2とは

R2
読み: アールツー

R2とは、AIや機械学習の回帰モデルが実際のデータをどの程度正確に予測できているか

読み: アールツー

AIや機械学習の回帰モデルが実際のデータをどの程度正確に予測できているかを示す0から1までの評価指標であり1に近いほど予測精度が高いことを意味する。決定係数とも呼ばれ予測の信頼性を測る基本となる。

かんたんに言うと

ダーツの矢がどれだけ的の中心に集まっているかを数値化したスコアボードのようなものである。散らばっていれば0に近づき、すべて中心に刺されば1になる。

回帰モデルが実務で使い物になるかを判定するR2の読み方

回帰分析において、モデルがどれくらい使い物になるかを示すのがR2である。0から1の範囲で示され、1なら完璧な予測ができている状態を指す。
現場で回帰モデルを組む際、データサイエンティストが最初に目を通すのがこの数字である。
ただ、0.8だから即本番投入できるかというと、そう単純な話ではない。対象となる業務の性質によって求められる水準は全く異なるからである。物流倉庫の配送ルート最適化で0.7なら御の字かもしれないが、製造ラインの不良品予測で0.7では使い物にならないケースもある。過去のデータにどれだけフィットしているかを示すだけで、未来の予測を保証するものではないからである。このあたりの実運用に向けた線引きは常に悩ましい。

予測値と実測値のズレを数値化する計算の仕組み

実際のデータである実測値と、AIが弾き出した予測値の間にどれだけの誤差があるか。その残差を計算してスコア化するのがR2の仕組み。
数式を持ち出すつもりはないが、要するに平均値で予測した場合と比べて、どれだけ誤差を減らせたかを割合で示している。
ここでよくある落とし穴が、外れ値の影響である。
たった一つの極端なデータが混ざっているだけで、R2のスコアは大きくブレてしまう。現場のデータは決して綺麗ではない。センサーの誤作動や人為的な入力ミスによる異常値が日常的に発生する中で、スコアだけを見て一喜一憂するのは危険である。データの前処理を怠ったまま計算された数値を信じ込むのは避けるべきだろう。

製造や物流における需要予測の活用事例と対応ツール

例えば、製造業での部品の需要予測や、物流倉庫での人員配置の最適化において、R2はモデルの良し悪しを判断する基準になる。
DataRobotやAmazon Forecastといった機械学習プラットフォームを使えば、数千のモデルを並行して構築し、R2の高い順にランキングを出してくれる。さらにTableauなどのBIツールに予測結果を取り込んで可視化し、現場の担当者に共有するのも定石である。
しかし、ツールが弾き出したトップのモデルが常に正解とは限らない。
現場のドメイン知識と照らし合わせたとき、なぜその予測になったのか説明できないブラックボックスモデルを採用すべきか。実務家としては判断が分かれるところである。

モデル評価に用いる利点と過学習リスクなどの限界

R2の最大の利点は、直感的に分かりやすいこと。経営陣や事業部門にモデルの精度を報告する際、パーセンテージのように扱えるため話が通りやすい。
だが、ここに罠がある。
説明変数を無意味に増やせば増やすほど、R2の数値は上がってしまうのである。これを過学習と呼ぶ。明日の売上を予測するのに、昨日の社長の機嫌という無関係なデータを入れても計算上は数値が上がってしまう。この現象を回避するために、自由度調整済み決定係数を見るのが現場の鉄則である。変数を増やすことにペナルティを課した指標を見ないと、実稼働した途端に大外しするモデルを掴まされることになる。

自社のAI導入プロジェクトで評価指標をどう選ぶべきか

R2だけでモデルを評価するのは素人のやり方である。
実際のプロジェクトでは、RMSEやMAEといった他の指標と組み合わせて総合的に判断する。RMSEは大きな誤差を厳しく評価し、MAEは誤差の平均を素直に見る。
どの指標を重視するかは、最終的なビジネスのKPIに直結する。
予測が外れたときの影響額が青天井ならRMSEを睨むべきだし、そうでないならMAEで十分かもしれない。ベンダーから提出されたレポートのR2だけを見て満足していないだろうか。指標の特性を理解し、自社の業務リスクに合わせて評価基準を設計する泥臭い作業こそが、実務家の腕の見せ所である。

同じ失敗を二度としないAIエージェント

今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。

当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。

古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。

相談する