マスキング

MASKING
読み: マスキング

読み: マスキング

マスキングとはAI個人情報保護

AIにおけるマスキングはテキストや画像データに含まれる氏名やクレジットカード番号などの個人を特定できる情報をAIが機械的に検知し匿名化または秘匿化する技術である。

かんたんに言うと

採用候補者の履歴書から顔写真やマイナンバーだけを黒塗りする作業を人間ではなくAIの目と手で瞬時に行うフィルターのようなものである。

マスキングがAIで個人情報を保護する基本概念と目視作業の限界

人事部が扱う採用データや法務部が審査する契約書にはPIIが溢れている。これらをそのまま外部のAIモデルに投げ込むのは正気の沙汰ではない。GDPRや改正個人情報保護法が求める水準は年々厳しくなっており企業に求められる管理体制は重くなる一方である。
現場ではどうしているか。
驚くべきことに未だに派遣社員が目視で黒塗りしているのが現実である。人間がやれば疲労や思い込みで必ず漏れが起きる。だからこそAIによるマスキングが必要になるわけだがこれも完璧ではない。100パーセントの精度を保証できないシステムを業務に組み込む際どこまでリスクを許容できるか常に判断が分かれるところである。

自然言語処理と画像認識を用いた秘匿化の仕組み

テキストデータなら自然言語処理を用いた固有表現抽出が主役になる。文章の中から人名や住所や電話番号といった特定のパターンを確率的に見つけ出し別の文字列に置き換える。
画像やPDFの場合はどうだろうか。
まずOCRでテキスト化してから処理を走らせる。しかしスキャンされた不鮮明な領収書や手書きの履歴書ではOCRの段階で文字化けを起こす。結果としてマスキングの網の目をすり抜けてしまう。画像そのものにぼかしを入れる手法もあるがレイアウトが崩れることが多い。この前処理の精度に大きく依存する構造が実運用における最大の落とし穴である。

経理や人事での活用事例と代表的なツール

経理部門が受け取る膨大な請求書から口座情報だけを隠蔽する。あるいは人事部門が従業員エンゲージメント調査の自由記述から個人を特定できる文脈を消し去る。こうした用途で使えるツールはいくつかある。
AWS環境ならAmazon Macieが手軽である。S3バケット内の機密データを勝手に探し出してくれる。GCPならGoogle Cloud DLPAPIを叩くのが定石だろう。Microsoft PurviewもM365環境にどっぷり浸かっている企業なら選択肢に入る。ただどれも英語圏のデータセットをベースにしているため日本語特有の曖昧な表現や同音異義語にはまだ弱いと感じる場面が多い。

導入がもたらす変化と技術的限界

LLMに社内データを学習させる際マスキングは必須のプロセスになる。生データをそのまま食わせれば後でどんな形で出力されるか分かったものではない。しかしここでジレンマが生じる。
個人情報を隠しすぎるとデータユーティリティが著しく低下するのである。
例えば鈴木部長がパワハラをしたというテキストを人名が行為をしたと置換してしまうと誰が何をしたのかという文脈が完全に消滅する。これでは分析のしようがない。ダミーデータに置き換える手法もあるが整合性を保つのは骨が折れる。安全性を取るかデータの価値を取るか。現場のエンジニアにとって非常に悩ましい問題である。

自社環境に適した技術を選定するための評価基準

結局のところどこで処理を行うかが最大の焦点になる。SaaSのマスキングAPIにデータを投げること自体がセキュリティポリシー違反になる企業は少なくない。外部にデータを出せないならクラウドの恩恵は受けられない。
その場合はオンプレミスで動く軽量なモデルを探すことになる。
処理速度も無視できない。テラバイト級のログデータをリアルタイムでマスキングしようとすればインフラコストは跳ね上がる。自社の要件に合わせてどのレイヤーで妥協するかを決めるしかない。他社の成功事例をそのまま持ち込んでも機能しない。正解は一つではない。

当社の見解

当社はAIの安全運用のために3層防御を設計・実装している。万が一インシデントが発生しても数分以内に復旧できるバックアップ体制を持つ。実際にAIが暴走してテスト環境を停止させた経験があり、その教訓から「失敗を防ぐ」だけでなく「失敗しても戻せる」設計が本質だと確信している。加えて、AIは事実でないことを断定する。この前提で事実/推測の強制分離とファクトチェックを実装した。安全性は仕組みで担保するものだ。

同じ失敗を二度としないAIエージェント

今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。

当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。

古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。

相談する