導入の背景と課題
人手不足と多品種化が、目視カウントの限界を早めた
本事例は、国内大手食品メーカー様の弁当・惣菜・パック食品製造ラインにおける、同梱物の個数カウント工程です。1つのラインで1日あたり数十〜数百SKUの品種を生産し、各パックに入る液体ソース・粉末調味料・薬味等の個袋を、最終梱包前に1つずつ個数確認する必要がありました。
従来は検査員の目視による全数確認が中心でしたが、以下3つの構造的な課題を抱えていました。
人手不足の深刻化
経済産業省「2023年版ものづくり白書」によれば、製造業の就業者数は20年間で157万人減少し、2030年には熟練者を含む人材の不足が顕在化する見込み。食品製造は特に人員依存度の高い業種で、検査員確保そのものが経営課題化していました
多品種化による切替負荷
消費者ニーズの多様化に伴い、SKU数は年々増加。1品種あたりの生産ロットは小さくなる一方、切替時に検査設定を調整する工数は削減されず、設備稼働率を圧迫
形状のばらつきに弱いルールベース検査
パッケージ越しの視認では、液体ソースの個袋の折れ方・重なり・パック内での位置がロットごとに変動し、旧来のテンプレート照合型の画像処理では誤検出が発生しやすい状況でした
https://www.meti.go.jp/report/whitepaper/mono/2023/
Nsightのアプローチ
VLMで「学習データを作る」、本番は高速CNNで「検査する」
NsightはこのラインにNsight Edge(NVIDIA Jetson Orinベースのエッジ推論ユニット)を導入し、VLMを本番の検査エンジンとしてではなく、学習データの自動生成役として位置付けるアプローチを採用しました。これにより、教師データの準備コストを大幅に圧縮しつつ、本番推論は0.2秒/個の高速処理を維持しています。
- VLMの役割:少量の良品画像を与えると、不良パターンを理解した上で仮想NG画像を自動生成。数千枚規模の教師データを人手でアノテーションする工程を不要にしました
- 本番検査のエンジン:CNN(畳み込みニューラルネットワーク)+ルールベースのハイブリッド構成で、1個あたり0.2秒で判定。毎分数十個規模のライン速度に追従します
- 品種切替の即時化:新SKUを追加する際は、事前学習済みモデルの読み込みとマスターデータ更新のみ。即日対応が可能
- 現場作業員向けUI:ライン横のモニターに「目標/実績/差異」をリアルタイム表示。担当者は常に生産状況を視認でき、異常発生時はその場で対処できます
実機の検査画面
実際の生産ラインで稼働中のNsight Edge検査映像です。上部カメラが流れてくる各パックにID(ID8〜ID15)を付与し、同梱物ごとに「OK/NG」を同時判定しています。右上にはライン全体の累計(Total/OK/NG)を常時表示。
リアルタイムダッシュボード
Nsight Edgeは検査結果をライン横の大型モニターに常時表示します。目標数・実績数・残数(差異)を1画面で可視化することで、現場作業員は定期的な集計作業を待たずにライン全体の進捗を把握できます。下流工程との連携によって、欠品・過剰出荷の芽を当日中に潰せる体制を構築しました。
導入効果
検査方式の比較:食品ラインの個数カウント
食品ラインの個数カウントには、大きく分けて「目視検査」「従来ルールベース画像処理」「汎用AI(ディープラーニング)」「VLMハイブリッド(Nsight Edge)」の4方式があります。それぞれの向き・不向きを整理すると以下の通りです。
| 観点 | 目視検査 | ルールベース 画像処理 |
汎用AI (Deep Learning) |
Nsight Edge (VLMハイブリッド) |
|---|---|---|---|---|
| 多品種対応 | 柔軟 | 品種ごとにテンプレート要 | 品種ごとに再学習要 | 即日対応可 |
| 形状ばらつき耐性 | 高(人の柔軟性) | 低(しきい値に依存) | 中(学習量依存) | 高 |
| 検査速度 | 遅(疲労影響あり) | 速 | 中〜速 | 0.2秒/個 |
| 教師データ準備 | — | — | 数千枚/品種 | VLMが自動生成 |
| 初期導入コスト | 低(人件費のみ) | 中 | 高 | 中 |
| ランニングコスト | 高(人件費継続) | 低 | 中 | 低 |
Nsight Edgeが最も力を発揮するのは、多品種かつ形状ばらつきがあり、24時間体制で稼働するラインです。一方、品種が固定的で形状も安定している単品種ラインであれば、ルールベース画像処理でも十分な場合があります。現場の品種数・ロット規模・稼働時間を踏まえて最適な方式を選定することが重要です。
技術的ポイント
透明フィルム越しの撮像設計
食品検査の難しさは、パッケージの透明フィルム越しに内部を正確に認識する必要がある点にあります。フィルムの反射・くもり・結露はカメラ映像に大きなノイズとして乗り、ルールベース画像処理の精度を落とす主要因でした。Nsightは元キーエンス画像処理事業部で培った光学設計のノウハウを活かし、反射光を抑える偏光フィルタの選定、照明の入射角・色温度の最適化、コンベア速度とシャッター速度の同期まで一体で設計。画像品質を底上げすることでAIモデルが学習しやすい入力を作り出しています。
Nsight Edgeによるオンプレミス完結型推論
食品工場は通信環境が限定的で、クラウド推論のレイテンシ・セキュリティ両面から不向きです。NsightはNVIDIA Jetson OrinをベースとしたNsight Edge上で全ての推論処理をオンプレミスで完結させ、インターネット接続がなくても稼働する設計にしています。検査データも工場内に留まり、レシピや工程に関する情報が外部に出ないため、食品安全・営業秘密の両面で安心して運用できます。
VLMと従来AIの役割分担
VLMは意味理解に強い一方で、推論レイテンシが500ms以上と大きく、リアルタイム検査の本番エンジンには向きません。NsightはVLMを「学習データの自動生成」「新品種追加時のアノテーション」「曖昧ケースの補助判定」に特化させ、本番の高速ループはCNN+ルールベースで回すハイブリッド構成を採用。これにより、VLMの柔軟性と従来AIの高速性を両立しています。
開発エンジニアからのコメント
「食品の外観検査は、単なる画像認識タスクではありません。照明・カメラ・アルゴリズムの3つを同時に最適化する必要があり、どれか1つでも設計が甘いと現場運用に乗りません。今回はVLMを検査エンジンではなく学習補助ツールとして位置付けたことで、短期間で現場に根付く仕組みを作れました。元キーエンス時代に扱ってきた画像処理システムの思想を、AIの時代に合わせて再構成した一例と言えます。」