教師あり学習 / 教師なし学習とは

SUPERVISED VS UNSUPERVISED
読み: キョウシアリガクシュウ / キョウシナシガクシュウ

教師あり学習 / 教師なし学習とは、正解データを与えて未来を予測する教師あり学習と、膨大なデータから未知の規則性を見つけ出す教師なし学習

読み: キョウシアリガクシュウ / キョウシナシガクシュウ

正解データを与えて未来を予測する教師あり学習と、膨大なデータから未知の規則性を見つけ出す教師なし学習。これらは機械学習アルゴリズムを構築する際の2大アプローチであり、手元にあるデータの性質と目的によって使い分けられる。

かんたんに言うと

教師あり学習は過去の模範解答を丸暗記して試験に臨む受験生。教師なし学習は、見知らぬ土地に放り込まれて自力で地図を描き始める探検家である。

正解データの有無で分かれる2つの機械学習アプローチ

機械学習アルゴリズムを組む際、最初に直面するのがアノテーションの壁である。正解ラベルを付与したデータを食わせるのが教師あり学習。ラベルなしの生データをそのまま突っ込むのが教師なし学習
理屈は簡単だが、現場の現実は甘くない。
例えば経理部門で領収書の仕訳AIを作るなら、過去数年分の正解データが山のようにある。これは教師あり学習の独壇場である。しかし、製造業の工場でまだ起きたことのない未知の設備異常を検知したい場合、正解データが存在しない。ここで教師なし学習の出番となる。
どちらのアプローチを選ぶかは、手元にあるデータの状態だけで決まるわけではない。

教師あり学習のビジネス活用例と代表的ツール

営業部門の売上予測や、法務部門での契約書の条項チェック。これらは明確な正解が存在する領域である。
Salesforce Einsteinを使えば、過去の失注や受注データという正解を元に、目の前の商談の成約確率を弾き出してくれる。DataRobotAmazon SageMakerに過去の不良品画像と正常品画像を大量に読み込ませれば、製造ラインの検品精度は人間の目視を軽く凌駕する。
ただし、アノテーション作業は地獄である。
数万件の画像やテキストに人間が手作業でタグを付けていく。この泥臭い作業を外注するか内製するかで、プロジェクトの初期費用は大きく跳ね上がる。予算と精度のバランスは常に悩ましい。

教師なし学習のビジネス活用例と代表的ツール

正解データを用意できないなら、AIに勝手に分類させればいい。
物流倉庫でのピッキング動線の最適化や、人事部門での退職リスク予備軍のクラスタリングなどは、教師なし学習が威力を発揮する。AWS Panoramaを工場のカメラに繋ぎ、作業員の動きの異常なパターンを抽出させる。IBM Watsonに膨大な社内文書を読み込ませ、隠れたトピックの相関を見つけ出す。Google Analyticsのデータから、誰も気づかなかったニッチな顧客セグメントを炙り出すのも同じ理屈である。
だが、出てきた結果の解釈は人間に委ねられる。
グループAとグループBに分かれましたとAIが言っても、それが何を意味するのか。現場のドメイン知識がなければ、ただの数字の羅列で終わってしまう。

両アプローチのメリットと導入時の限界

教師あり学習は精度が高い。だが、データの準備コストがROIを圧迫する。
教師なし学習はデータ準備が楽である。だが、出力結果がビジネスの成果に直結するとは限らない。
PoCを回す際、多くの企業がここでつまずく。とりあえず手元にあるデータで教師なし学習を試すが、出てきたクラスタリング結果を見て、で、これどう使うの?と経営陣に突っ込まれる。結局、泥臭くアノテーションをして教師あり学習に切り替えるハメになるケースは数え切れない。
最初から正解データを作る覚悟を決めるべきか。それともデータ探索から始めるべきか。現場の判断が分かれるところである。

自社に最適なAIを選ぶための判断材料

解決したいビジネスの目的と、保有するデータの質。この2つを天秤にかけて手法を選ぶ。
少量の正解データと大量の未ラベルデータを組み合わせる半教師あり学習という手もある。あるいは、環境との相互作用で学習を進める強化学習を物流ロボットの制御に組み込むアプローチも現実的になってきた。
どの手法を選ぶにせよ、魔法の杖はない。
自社のデータインフラがどれだけ整っているか。現場の担当者がどれだけ泥臭いデータ整備に耐えられるか。最終的には、技術論よりも組織の体力が問われる。

同じ失敗を二度としないAIエージェント

今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。

当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。

古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。

相談する