ホーム > ブログ > 多品種でもAI検査を成功させた3つの現場

「うちは品種が多すぎてAIは無理」を覆した3つの現場の話

化粧品・鉄鋼・食品の3工場が多品種でもAI検査を成功させた具体的な経緯。

無料相談する →

「品種が多すぎるから、AIの外観検査はうちには合わない」——これは製造業でAI導入を検討する際に、最も頻繁に聞く断り文句です。

確かに従来のDeep Learning検査では品種ごとにAIモデルを開発する必要があり、多品種ラインでは非現実的でした。しかしVLMハイブリッド構成の登場で、この前提が変わりつつあります。

現場①:化粧品メーカー(50品種以上)

50品種以上のラベル印字検証が必要だったが、大手SIの見積もりが約3,000万円で断念。VLMベースのシステムを導入し、学習データゼロで稼働開始。VLMが学習なしで文字の位置と意味を理解し、マスターデータと照合。

成功の鍵

「品種ごとの個別開発」をやめ、VLMによるNG画像生成とオートアノテーションで学習コストを大幅削減。

現場②:鉄鋼メーカー(多品種の電極製品)

電極製品の形状・サイズ・刻印が品種ごとに異なり、検査設定の切替に時間がかかっていた。VLM+AI-OCRのハイブリッドで品種切替なしの一括検査を実現。

成功の鍵

表面欠陥はルールベース+VLM、刻印読み取りはVLM+AI-OCRという役割分担の設計。

現場③:食品メーカー(形状ばらつきのある食品)

形状がバラバラの食品を正確にカウントする必要があったが、重量式では精度不安定。VLMで画像認識ベースの99%+カウント精度を実現。

成功の鍵

「定形品向けのアルゴリズム」ではなく、VLMの「画像全体の文脈理解」を活用。

共通する3つの成功要因

1️⃣

最初から多品種前提で設計

1品種での成功→横展開ではなく、多品種対応を前提としたシステム設計。

2️⃣

ハイブリッド構成

VLM単体ではなく、ルールベース×従来AI×VLMの適材適所の組み合わせ。

3️⃣

照明・カメラの専門設計

AIモデルだけでなく、撮像環境(照明・カメラ・治具)の最適化を同時に実施。

ソリューション
多品種外観検査AI|VLMで学習コストを削減
導入事例
化粧品ラベル印字検証の自動化

VLMが多品種検査をどう変えたか

従来のディープラーニング検査は、品種ごとに数百〜数千枚の学習データが必要で、新品種追加に数日〜数週間を要しました。VLM(Vision-Language Model)の登場で、この前提が根本的に変わりました。

VLMの3つの革新性

革新①: 少数ショット学習

VLMは事前学習で多種多様な物体・概念を学習しているため、新品種に対しても10〜30枚程度のサンプルで実用精度に到達。従来手法の1/10〜1/100のデータ量で対応できます。

革新②: 自然言語指示

「ロゴが中央に印刷されているか」「色が指定値±5%以内か」など、自然言語で検査基準を記述可能。プログラミング不要で現場運用者が直接基準を設定できる。

革新③: NG画像合成

OK画像をベースに、VLMで「キズあり」「色ムラあり」のNG画像を合成生成。希少不良の学習データ問題を解決します。

VLM活用の実装アーキテクチャ

レイヤー役割使用モデル例
VLMバックエンドNG生成・オートアノテーションGPT-4V、Claude等
軽量推論モデル本番判定(高速)カスタムCNN、YOLO
ハイブリッド層難ケースをVLMにフォールバック動的振り分け

多品種検査でのVLM運用パターン

パターン①: 品種マスターテキスト

「ロゴA、色C5、サイズS、装飾パターンX」など品種ごとの特徴をテキスト記述。VLMがこのテキストを参照して判定基準を動的構築。

パターン②: 多品種共通汎化モデル

業界別(化粧品・自動車・樹脂等)の汎化モデルを構築。新品種追加時はマスターテキスト更新のみで対応可能。

パターン③: アクティブラーニング

判定スコアが閾値付近の曖昧サンプルだけを人間レビューに回し、効率的にモデル改善。

VLM活用での注意点

注意点①: 推論速度のトレードオフ

VLM自体は推論が重く、高速ラインの本番判定には不向き。VLMはバックエンドの学習・データ拡張・難ケース処理に使い、本番判定は軽量モデルで行うハイブリッド構成が標準。

注意点②: マスターテキストの精度

VLM判定の精度は、マスターテキストの記述品質で決まります。判定基準を曖昧に書くと、VLMも曖昧判定するため、テンプレート化と運用ルールが重要。

注意点③: コスト管理

クラウドVLMはAPI課金型のため、大量画像処理ではコスト管理が必須。エッジでのVLM活用は徐々に進んでいるが2026年時点では限定的。

VLMの本番運用アーキテクチャ

VLMの本番運用は、軽量モデルとのハイブリッド構成が標準です。本番判定の90%は軽量CNNでJetson推論し、難ケース10%だけクラウドVLMにフォールバック。VLMはバックエンドでオートアノテーション・NG画像生成・モデル改善に使用。この階層構成により、推論コストとレイテンシを抑えつつ、VLMの利点を最大限活用できます。

VLM対応の検査運用変革

VLM対応により、従来の検査運用フローが大きく変革します。新品種立ち上げ時間が1〜2週間から数時間に短縮、必要学習データが500枚以上から10〜30枚に削減、品種切替工数が30〜60分から5〜10分に短縮、説明可能性が低から高に向上。これらが組み合わさることで、多品種ラインの検査運用が経営効率の高い形に進化します。

VLM技術の今後の進化方向

VLM技術は2026年現在も急速に進化中です。今後の進化方向は、エッジデバイスでのVLM実行(オンプレ完結)、推論速度の高速化(リアルタイム判定)、より小さなVLMモデル(軽量化)、特定業界専用VLM(業界特化)。これらの進化により、AI検査の適用範囲がさらに拡大すると見込まれます。継続的な技術ウォッチが投資判断の精度を上げます。

VLM IMPACT VLMが多品種検査を変えた3つの仕組み 少数ショット学習・10〜30枚で対応・従来1/100・新品種即対応自然言語指示・テキストで基準・プログラム不要・現場運用可NG画像生成・希少不良補完・データ拡張・バランス確保

よくある質問

VLMによるオートアノテーションの精度は?

人間アノテーターの補助レベルで80〜95%の精度が出ます。最終チェックは人間が行う運用が推奨です。

VLMでできないタスクは何ですか?

高速リアルタイム判定、極めて高精度な寸法測定、極小欠陥の検出などは従来手法が優位です。

VLM学習に必要なデータ量は?

ゼロショット利用なら追加学習不要です。ファインチューニングする場合、数百〜数千枚のラベル付きデータで効果が出ます。

物流現場でも、同じ技術が使えます

製造ラインで培ったVLM・エッジAI・光学設計のノウハウは、物流の入荷検品・OCR・倉庫オペにも応用できます。

Jetson × VLM × OCR

エッジでVLMを動かす物流向け文字読み取り

VLAで物流OCRの限界を超える

従来OCRで読めなかった文字をVLMで読み解く

Edge × VLM × OCR ソリューション

エッジ完結のVLM-OCRを物流現場へ

まずはサンプル画像で無料検証しませんか?

検査対象のサンプル画像をお送りください。最適な検査方式の提案と想定精度を無料で評価します。

無料サンプル検証を依頼する →

監修:嶋野(元キーエンス画像処理部門 開発)

キーエンス画像処理部門での実務経験をもとに、製造業の外観検査・画像処理に関する技術監修を行っている。会社概要 →

最終更新日:2026-04-24