GAN

GENERATIVE ADVERSARIAL NETWORKS
読み: ガン / ジーエーエヌ

読み: ガン / ジーエーエヌ

GANとは偽物と本物で鍛えるAI

GAN(Generative Adversarial Networks)は、生成器と識別器という2つのニューラルネットワークを競わせることで、本物と見分けがつかないデータを生成するディープラーニングの手法である。2014年にIan Goodfellowが提案し、画像生成の分野に大きな転換をもたらした。

かんたんに言うと

偽札を作る職人と、偽札を見抜く鑑定士が互いに腕を磨き合う構図。職人が作る偽札の精度が上がれば、鑑定士も目が肥えていく。最終的に、鑑定士すら見抜けない偽札が完成する。

生成器と識別器が互いに鍛え合うGANの学習プロセス

GANの学習プロセスはシンプルな対立構造で成り立っている。生成器(Generator)はランダムなノイズからデータを作り出し、識別器(Discriminator)はそのデータが本物か偽物かを判定する。
生成器は識別器を騙せるように学習し、識別器は生成器の出力を見破れるように学習する。この繰り返しによって、生成器の出力精度は着実に上がっていく。
聞こえは良いが、実際の学習は厄介である。生成器と識別器の学習バランスが崩れると、片方だけが強くなりすぎて学習が進まなくなる。これをモード崩壊と呼び、GAN研究者にとって長年の頭痛の種になっている。

画像生成からデータ拡張まで、幅広い応用領域

GANが最も成果を上げてきたのは画像生成の分野である。NVIDIAが2018年に発表したStyleGANは、実在しない人間の顔を高解像度で生成し、世間を驚かせた。
医療画像のデータ拡張にもGANは使われている。希少疾患のCT画像は数が少なく、機械学習モデルの学習データとして不足しがちだが、GANで合成画像を生成することでデータ量を補える。
ファッション業界では、デザイン案の自動生成やバーチャル試着にGANが組み込まれている。ただし、生成されたデザインの著作権を誰が持つのかという法的な整理はまだ追いついていない。

ディープフェイク問題と社会的なリスク

GANの技術が社会問題として表面化したのがディープフェイクである。政治家や著名人の顔を別人の動画に合成する技術は、フェイクニュースや詐欺に悪用されるリスクを生んでいる。
2019年にはイギリスのエネルギー企業の幹部が、CEOの声をGANで合成した音声に騙され、約2,500万円を送金する事件が発生した。音声合成の精度もここまで来ている。
対策として、ディープフェイク検出技術の開発も活発化している。Meta、Microsoft、Googleなど大手テック企業が共同でDetecting Deepfakesチャレンジを主催し、検出精度の向上に取り組んでいる。しかし、生成技術と検出技術のいたちごっこは当面続くと見られている。

拡散モデルの台頭とGANの現在地

2022年以降、画像生成の主役はGANから拡散モデル(Diffusion Model)に移りつつある。Stable DiffusionやDALL-E 3はいずれも拡散モデルをベースにしており、GANより安定した学習と高品質な出力を実現している。
GANの弱点だった学習の不安定さとモード崩壊を、拡散モデルは構造的に回避している。生成と識別の対立構造に頼らず、ノイズを段階的に除去していくアプローチを取るためである。
とはいえ、GANが過去の技術になったわけではない。リアルタイム性が求められる場面や、特定ドメインのデータ拡張ではGANの方が実用的なケースもある。拡散モデルは生成速度で劣るため、用途に応じた使い分けが現実的な選択肢になっている。

当社の見解

技術の選定で最も避けるべきは「流行っているから」という理由で導入することだ。当社は複数のAIツール・フレームワークを実際に検証した上で、自社の用途に合うものだけを採用している。検証せずに導入したツールは、ほぼ例外なく3か月以内に使わなくなった。実装指示した人間側が実装したことも忘れて、気が付けば動いていない機能があった、ということも起きる。さらに、MCPやフックやルールを増やしすぎてAIが情報過多で機能しなくなった経験もある。どんなにルールや機能を付け足しても機能しなければ意味がない。足し算より引き算。1週間の検証期間が、3か月の手戻りを防ぐ。

同じ失敗を二度としないAIエージェント

今のAIは、聞けば何でも答えてくれます。
でも、セッションが切れた瞬間に前回の失敗を忘れます。

当社が開発しているAIは、過去の経緯を念頭に置いて、
聞かれる前に「それは前回うまくいきませんでした」と声をかけます。
人間にも同じ失敗をさせず、AI自身も繰り返しません。

古参の社員が横にいるように、黙っていても気づいてくれる。
それが、当社が考える本当のAI社員です。

相談する