導入の背景と課題
印字ミス由来の自主回収は、化粧品業界の恒常的リスク
本事例は、国内大手化粧品メーカー様のラベル印字検証工程です。同一パッケージで成分表示・内容量・製造ロット・使用期限の違う多品種を短サイクルで切替えて生産しており、ラベルの印字ミスが下流に流出した際には、ロット単位の自主回収とブランド毀損が避けられない状況でした。
実際、化粧品の自主回収は日常的に発生しています。独立行政法人製品評価技術基盤機構(NITE)「化粧品の自主回収情報」によれば、化粧品・医薬部外品の自主回収は毎年継続的に報告されており、回収理由の中には「表示ミス」「記載不備」といった印字系のトラブルが少なくありません。1件の回収判断には、物流停止・販売停止・顧客連絡・代替品手配といった複数工程のコストが同時にのしかかります。
従来のOCRベース検査には、多品種ラインで構造的に解消しにくい3つの限界がありました。
品種ごとのテンプレート作成
文字位置・書体・レイアウトが品種ごとに異なるため、切替のたびに数十分単位のテンプレート調整とパラメータ微調整が必要。SKU数が増えるほどテンプレート資産も肥大化し、保守負荷が雪だるま式に増加
文字OCR・バーコード・デザイン照合の分離運用
それぞれ別システム・別担当での検査となり、運用が複雑化。検査データの統合にも工数がかかっていました
微細な刻印・エンボスへの弱さ
透明容器や金属容器上の浅い刻印、型抜きのエンボスは、コントラストが弱く従来OCRでは誤認識が発生。最終的に目視ダブルチェックで補完せざるを得ない状態でした
https://www.pmda.go.jp/safety/recall/0011.html
現場設置の様子
クリーンルーム内での検査装置実機です。3つのモニターで異なる検査角度を同時表示し、印字・刻印・容器傷の複合検査をワンステーションで完結させています。
Nsightのアプローチ
VLMは「文字を読む」のではなく「意味を照合する」
従来のOCRは、文字の画像を1文字ずつ切り出してテンプレートと照合する仕組みでした。これに対しNsightは、VLM(Vision Language Model)を活用してラベル全体を「文字列+デザイン+コンテキスト」として意味的に理解させるアプローチを採用しました。マスターデータ(正しいラベル情報)との意味的一致をVLMが判定することで、テンプレートを1つも作らずに検査を開始できます。
- 学習データ不要:新しい品種を追加する際、従来は数百〜数千枚の画像学習が必要でした。VLMはマスター情報(テキスト+参考画像)を与えるだけで即座に検査を開始できます
- 文字・バーコード・デザインの統合判定:文字OCR・バーコード読取・デザイン照合を1つのVLMパイプラインで処理。システム構成を簡素化し、検査データも一元管理できます
- 微細刻印への対応:元キーエンス画像処理事業部で培った照明設計ノウハウ(同軸照明・斜光・偏光)を組み合わせ、透明容器上の浅い刻印や型抜きエンボスの可読性を担保
- 本番推論の高速化:本番検査の推論は、レイテンシの観点から従来AI(CNN)+ルールベースで実行。VLMは品種追加時・マスター更新時・曖昧ケースの補助判定として機能し、Nsight Edge上で0.2秒/個の処理速度を実現しています
導入効果
検査方式の比較:化粧品ラベル印字検証
化粧品ラベル検査の主要な4方式を、多品種切替の観点で整理しました。ポイントは「新品種を追加するときのコスト」と「誤認識発生時の調整難易度」の2軸です。
| 観点 | テンプレートOCR | 汎用OCR (Tesseract等) |
従来AI OCR | Nsight Edge (VLM照合) |
|---|---|---|---|---|
| 新品種追加時間 | 数十分/品種 | 数分/品種 | 数千枚の学習要 | 即日(マスター更新のみ) |
| 文字位置のズレ耐性 | 弱い | 中程度 | 強い | 強い(文脈理解) |
| バーコード同時判定 | 別システム | 別システム | 可能(構成次第) | 統合判定 |
| 微細刻印・エンボス | 誤認識多発 | 誤認識多発 | 学習量依存 | 照明設計+VLMで対応 |
| 辞書登録の必要性 | 必須 | 一部必要 | 必須 | 不要 |
| 多言語対応 | 言語ごとに辞書要 | 言語ごとに設定要 | 言語ごとに学習要 | VLMが多言語対応 |
化粧品のように品種サイクルが短く、言語バリエーションも多い業界では、事前学習・辞書登録の負担が競争力を直接削ります。VLMベースの意味的照合は、この業界特性に最も適合したアプローチといえます。
技術的ポイント
VLMの「文脈理解」が従来OCRとの決定的な差
従来OCRは、たとえば「O(オー)」と「0(ゼロ)」、「I(アイ)」と「1(イチ)」、「l(小文字エル)」と「1」を字形の類似だけで判定するため、印字品質が落ちた環境では誤認識が多発します。VLMは文字の字形だけでなくその文字が置かれた文脈──製品名の一部なのか、ロット番号の一部なのか、成分表示の一部なのか──を踏まえて判定します。これにより、ラベル全体を見たときに「この位置にこの文字列はあり得るか」という制約を内部で自動適用でき、文字単位のOCR精度を超えた総合判定ができます。
透明容器・金属容器の刻印検査と照明設計
化粧品ボトルの多くは、透明ガラス・樹脂・金属など反射の強い素材でできています。印字が薄い刻印やエンボス(型抜き)の場合、通常の照明では文字が背景に溶け込んで読み取れません。Nsightは元キーエンス画像処理事業部で培った同軸落射照明・斜光・ドーム照明・偏光フィルタの組み合わせを用途に応じて選定し、刻印の凹凸を陰影として可視化します。AIモデルへの入力画像の段階で「読めるもの」にしておくことが、VLMの性能を最大化する前提条件になります。
マスターデータの運用設計
Nsight Edgeでは、ラベルのマスターデータを社内の製品マスター(ERP・PLM等)と連動させる運用を推奨しています。印字仕様の変更がERP側で承認された瞬間に、検査マスターにも反映される設計にしておけば、現場の担当者が手動でマスターを書き換える運用負荷を回避できます。変更履歴が残るため、監査・トレーサビリティの観点でも有効です。
開発エンジニアからのコメント
「化粧品ラベル検査で面白いのは、技術的には『OCR』の話なのに、解決すべき本質は『多品種切替のスピード』にある点です。旧来の検査機メーカーは、OCR精度の改善で競争してきましたが、現場が本当に困っているのは『新品種が出るたびに数十分のダウンタイムが発生する』ことでした。VLMで意味を理解させれば、そもそも品種ごとの設定作業自体が不要になる。視点を一段上げた解決策が、現場の業務構造を変えます。」