GANで不良画像を生成する｜外観検査AIのためのGAN実践ガイド

GANは外観検査用NG画像生成の主流技術だが、NG画像が50枚以上必要で、初期導入フェーズにはVLMが先行する。

モード崩壊・鶏と卵問題・微細欠陥の再現限界の3つの壁を理解した上で運用設計が必要。

2026年現在、新規実装ではVLMが主流。GANはVLMとのハイブリッド運用が最も現実的な技術選定パターン。

― 01 / GANとは

GANとは ── 外観検査における位置づけ

GAN（Generative Adversarial Network：敵対的生成ネットワーク）は、2つのニューラルネットワークを競わせることでリアルな画像を生成する技術です。外観検査では「不良画像の生成器」として活用されます。

画像検査の技術は4つのTierに整理できます。Tier 4（ルールベース）→ Tier 3（機械学習）→ Tier 2（ディープラーニング/CNN）→ Tier 1（基盤モデル/VLM）。GANはTier 2に属する技術で、CNNの学習データを補強するために使用します。

― 02 / アーキテクチャ

外観検査で使われるGANアーキテクチャ

Pix2Pix ── ペア画像で制御しやすい

良品画像と不良画像のペアで学習し、良品→不良の変換を行います。欠陥の位置を制御しやすい反面、ペアデータの準備が必要です。位置合わせが正確なら、最も安定した結果を出します。

CycleGAN ── ペアなしで学習可能

良品群と不良品群を用意するだけでペアなしで学習可能。データ準備が楽ですが、欠陥の種類や位置の制御が難しく、「どんな欠陥が生成されるか」がGAN任せになります。

StyleGAN ── 高品質だが重い

高解像度・高品質な画像を生成でき、微細な欠陥の再現に強い。ただしGPUリソースを大量に消費し、学習の安定化にノウハウが必要です。

― 03 / 現場の3つの壁

GANの実践的な問題 ── 現場で遭遇した3つの壁

壁1：モード崩壊（最大の問題）

GANが似たような画像ばかり生成するようになる現象です。ある案件で500枚生成しましたが、実質ユニークなパターンは35種類程度でした。対策として、学習率の調整やSpectral Normalizationの適用が有効ですが、完全には防げません。生成画像は必ず目視チェックし、重複パターンを除去する工程が必要です。

壁2：鶏と卵問題

GANの学習自体にNG画像が50〜100枚/パターン必要。NG画像が少ない初期段階ではGANは使えません。Nsightでは初期フェーズはVLMで仮想NG画像を生成し、実データが蓄積された段階でGANに切り替える直列運用を行っています。

壁3：微細欠陥の再現限界

0.1mm以下の微細なキズやピンホールは、画像解像度の制約でGANでの再現が難しい場合があります。解像度を上げればGPUメモリが足りなくなり、パッチ分割すると欠陥がパッチ境界で分断されるジレンマがあります。微細欠陥にはVLMとの併用が現実的です。

― GANの位置づけ ── Nsightのアーキテクチャにおいて
GANはVLMと同様に「教師役」です。GANで生成した不良画像はCNNの学習データとして使用され、本番検査はCNNが行います。GANの強みは「高品質な画像を高速に大量生成できる」こと。VLMの強みは「0枚からスタートできる」こと。フェーズに応じて使い分け、最終的にはCNNが本番の検査員として稼働します。

― 04 / まとめ

まとめ

GANは外観検査用のNG画像生成において最も成熟した技術です。ただしNG画像が50枚以上ある段階で初めて使える手法であり、初期導入にはVLMが先行します。GANの限界（モード崩壊・鶏と卵・微細欠陥）を理解した上で、VLMと組み合わせて使うのが実務上の最適解です。

NG画像生成で外観検査を変える

― 06 / 基本構造

GANの基本構造

Generator（生成器）

ノイズから画像を生成。本物らしい画像を生成することを学習。

Discriminator（判別器）

生成画像と実画像を識別。生成器が騙そうとし、判別器が見抜こうとする敵対的学習。

手法	用途
StyleGAN	高品質画像生成
CycleGAN	OK→NG変換
Pix2Pix	領域指定変換
Anomaly GAN	異常生成

観点	GAN	VLM
必要データ	数百〜数千枚	数十枚〜
制御性	限定的	自然言語で詳細指示
計算リソース	大	大（推論時）
結果の品質	高（学習データ依存）	高（汎化能力）

― 10 / GAN技術の進化と限界

GAN技術の進化と限界

GAN（Generative Adversarial Network）は2014年の登場以来、外観検査用NG画像生成の主流技術として活用されてきました。2026年現在もStyleGAN・CycleGAN・Pix2Pixなど派生技術が多数存在し、特定ドメインでは依然として有効。しかし、大量データが必要・制御性が限定的・新規ドメインでの立ち上げが困難という限界があり、VLMへの移行が業界全体で進んでいます。

― 11 / GAN資産の継続活用戦略

GAN資産の継続活用戦略

過去にGANで構築した検査AIを持つ企業では、これらの資産を継続活用しつつ、VLMへ段階的に移行する戦略が現実的です。新規品種からVLMで対応開始し、既存品種は精度劣化が顕在化した時点で順次VLMへ切り替える。投資効率を最大化する移行パターンが標準化しています。

― 12 / 今後の役割

GAN技術の今後の役割

GAN技術は VLM 主流化後も特定ドメインで継続活用されます。大量データを既に持つ企業、特定の画像変換タスク、過去資産活用を重視する企業では、GAN が引き続き有効。VLM とのハイブリッド運用が、最も現実的な技術選定パターンとなっています。

― FAQ

よくある質問

VLM（Vision Language Model）とは何ですか？

画像と自然言語の両方を理解する大規模AIモデルです。ゼロショットでの画像分類・質問応答・照合が可能です。

VLMは本番の検査判定に使えますか？

現時点では、VLMは裏方（NG画像生成・オートアノテーション・学習データ拡張）として活用し、本番判定は軽量モデルが主流です。

NG画像をVLMで生成する精度は？

実NGサンプル数枚から数百枚規模の学習データを生成でき、少量サンプル問題の解決に寄与します。

GANで不良画像を生成する｜外観検査AIの実践ガイド