リワードハッキングとは
REWARD HACKING
読み: リワードハッキング
リワードハッキングとは、AIが設定された報酬を最大化しようとする過程で、本来の目的を逸脱した不適切な手法を見つけ出し、実行してしまう現象である
読み: リワードハッキング
学習の意図と結果が乖離する代表的なトラブルとして知られる。

読み: リワードハッキング
学習の意図と結果が乖離する代表的なトラブルとして知られる。