ROC曲線とは
ROC CURVE
読み: アールオーシーキョクセン
ROC曲線とは、機械学習モデルの性能評価に用いられるグラフである
読み: アールオーシーキョクセン
特に、二値分類モデルの識別能力を視覚的に表現するのに役立つ。横軸に偽陽性率、縦軸に真陽性率を取り、閾値を変化させたときのモデルの性能変化を示す。
かんたんに言うと
ROC曲線は、テストの点数を変えたときに、どれくらい正しく合否を判断できるかを表すグラフのことである。
ROC曲線の構成要素
ROC曲線は、偽陽性率(False Positive Rate, FPR)と真陽性率(True Positive Rate, TPR)という2つの指標に基づいて描かれる。FPRは、実際には陰性のデータのうち、誤って陽性と予測された割合を示す。TPRは、実際には陽性のデータのうち、正しく陽性と予測された割合を示す。これらの指標を様々な閾値で計算し、プロットすることで曲線が得られる。
AUCArea Under the Curve
ROC曲線の下側の面積をAUCと呼ぶ。AUCは、モデルの識別能力を定量的に評価する指標として用いられる。AUCが1に近いほど、モデルの性能が高いことを意味する。AUCが0.5の場合は、ランダムな予測と同程度の性能となる。
ROC曲線の利用例
ROC曲線は、医療診断、スパムメールフィルタリング、不正検知など、幅広い分野で利用されている。例えば、医療診断においては、病気の有無を予測するモデルの性能評価に用いられる。異なるモデルのROC曲線を比較することで、最適なモデルを選択することが可能となる。
