GAN(敵対的生成ネットワーク)で外観検査用の不良画像を生成する仕組み、アーキテクチャの選定、モード崩壊の対策。
GAN(Generative Adversarial Network:敵対的生成ネットワーク)は、2つのニューラルネットワークを競わせることでリアルな画像を生成する技術です。外観検査では「不良画像の生成器」として活用されます。
画像検査の技術は4つのTierに整理できます。Tier 4(ルールベース)→ Tier 3(機械学習)→ Tier 2(ディープラーニング/CNN)→ Tier 1(基盤モデル/VLM)。GANはTier 2に属する技術で、CNNの学習データを補強するために使用します。
良品画像と不良画像のペアで学習し、良品→不良の変換を行います。欠陥の位置を制御しやすい反面、ペアデータの準備が必要です。位置合わせが正確なら、最も安定した結果を出します。
良品群と不良品群を用意するだけでペアなしで学習可能。データ準備が楽ですが、欠陥の種類や位置の制御が難しく、「どんな欠陥が生成されるか」がGAN任せになります。
高解像度・高品質な画像を生成でき、微細な欠陥の再現に強い。ただしGPUリソースを大量に消費し、学習の安定化にノウハウが必要です。
GANが似たような画像ばかり生成するようになる現象です。ある案件で500枚生成しましたが、実質ユニークなパターンは35種類程度でした。対策として、学習率の調整やSpectral Normalizationの適用が有効ですが、完全には防げません。生成画像は必ず目視チェックし、重複パターンを除去する工程が必要です。
GANの学習自体にNG画像が50〜100枚/パターン必要。NG画像が少ない初期段階ではGANは使えません。Nsightでは初期フェーズはVLMで仮想NG画像を生成し、実データが蓄積された段階でGANに切り替える直列運用を行っています。
0.1mm以下の微細なキズやピンホールは、画像解像度の制約でGANでの再現が難しい場合があります。解像度を上げればGPUメモリが足りなくなり、パッチ分割すると欠陥がパッチ境界で分断されるジレンマがあります。微細欠陥にはVLMとの併用が現実的です。
GANは外観検査用のNG画像生成において最も成熟した技術です。ただしNG画像が50枚以上ある段階で初めて使える手法であり、初期導入にはVLMが先行します。GANの限界(モード崩壊・鶏と卵・微細欠陥)を理解した上で、VLMと組み合わせて使うのが実務上の最適解です。
GAN(Generative Adversarial Network)は、生成モデルの一種で、リアルなNG画像の合成生成に用いられます。VLM登場前の主流手法でしたが、現在もVLMと併用される重要技術です。
ノイズから画像を生成。本物らしい画像を生成することを学習。
生成画像と実画像を識別。生成器が騙そうとし、判別器が見抜こうとする敵対的学習。
| 手法 | 用途 |
|---|---|
| StyleGAN | 高品質画像生成 |
| CycleGAN | OK→NG変換 |
| Pix2Pix | 領域指定変換 |
| Anomaly GAN | 異常生成 |
| 観点 | GAN | VLM |
|---|---|---|
| 必要データ | 数百〜数千枚 | 数十枚〜 |
| 制御性 | 限定的 | 自然言語で詳細指示 |
| 計算リソース | 大 | 大(推論時) |
| 結果の品質 | 高(学習データ依存) | 高(汎化能力) |
2026年現在、新規実装ではVLMが主流。GANは過去資産・特殊ドメイン用途で使われ続けています。
GAN(Generative Adversarial Network)は2014年の登場以来、外観検査用NG画像生成の主流技術として活用されてきました。2026年現在もStyleGAN・CycleGAN・Pix2Pixなど派生技術が多数存在し、特定ドメインでは依然として有効。しかし、大量データが必要・制御性が限定的・新規ドメインでの立ち上げが困難という限界があり、VLMへの移行が業界全体で進んでいます。
過去にGANで構築した検査AIを持つ企業では、これらの資産を継続活用しつつ、VLMへ段階的に移行する戦略が現実的です。新規品種からVLMで対応開始し、既存品種は精度劣化が顕在化した時点で順次VLMへ切り替える。投資効率を最大化する移行パターンが標準化しています。
GAN技術は VLM 主流化後も特定ドメインで継続活用されます。大量データを既に持つ企業、特定の画像変換タスク、過去資産活用を重視する企業では、GAN が引き続き有効。VLM とのハイブリッド運用が、最も現実的な技術選定パターンとなっています。
画像と自然言語の両方を理解する大規模AIモデルです。ゼロショットでの画像分類・質問応答・照合が可能です。
現時点では、VLMは裏方(NG画像生成・オートアノテーション・学習データ拡張)として活用し、本番判定は軽量モデルが主流です。
実NGサンプル数枚から数百枚規模の学習データを生成でき、少量サンプル問題の解決に寄与します。