段ボールの高さ違いで固定焦点OCRが読めない物流現場の課題を、液体レンズ×ラインカメラ×VLM OCRで解決する方法。ピント制御の仕組み、既存ラインへの後付け手順、WMS連携までを元キーエンス画像処理エンジニアが解説。
物流倉庫のラベルOCR自動化を検討した多くの現場が、最初にぶつかるのが「高さ違いのケース混流」問題です。20cmのケースと60cmのケースが同じベルトコンベアを流れ、固定焦点のカメラでは手前のケースと奥のケースでピント位置が全く違ってしまう――。
この問題に対して、従来よく取られてきた解決策は3つでした。
どれも根本解決になっておらず、特に中小倉庫では「初期投資が見合わない」という理由でOCR自動化プロジェクト自体が立ち消えになるケースが多くあります。
液体レンズは、電圧制御で内部の液体の界面形状を変化させ、数ミリ秒〜十数ミリ秒オーダーで焦点距離を切り替えられる電子制御レンズです。機械的な移動部がないため、高速・高信頼で焦点制御ができます。
物流ラインでの典型的な使い方は、以下のようになります。
この一連の動作が、ケースの通過速度(毎秒1〜2m)に十分追従できる速度で実行できます。
光学設計の勘所:液体レンズ単体では可動範囲が限られるため、物流現場の高さ幅(例:10cm〜80cm)をカバーするには、液体レンズ前段の固定焦点レンズとの組み合わせが重要です。ここで元キーエンス画像処理部門の光学設計ノウハウが直接効いてきます。
物流ラインのラベルは、ケース上面・側面・前面など様々な位置に貼付され、しかもケースは常に動いています。エリアカメラで瞬間停止させて撮るには、シャッター速度・光量・露光時間の制約が厳しくなります。
ラインカメラは、1ラインずつ連続的に撮像していく方式なので、
という特長があります。液体レンズによるピント切替と同期させることで、高さ違い × 長尺ラベルという物流特有の条件に最適な撮像系を構成できます。
光学側で「撮れる画像」が確保できても、従来のルールベースOCRには次の壁が待っています。
ラベルのフォント・位置・サイズが荷主ごとに全部違う。テンプレート定義では追従しきれない。
従来OCRは「このエリアのこのフォントを読み取る」という事前定義が前提でした。しかし物流現場では、荷主・配送業者・商材ごとにラベル書式が異なり、しかも頻繁に更新されます。設定の都度、SIベンダーに追加費用を払ってテンプレ修正するフローは現実的ではありません。
ここで VLM(Vision Language Model)が登場します。VLMは画像と言語モデルを統合したAIで、学習なしで「ラベルのどこに何が書いてあるか」を推論できます。具体的には、
VLMの推論レイテンシは外観検査タスク(0.2秒/個のラインスピード)には重すぎる場合がありますが、物流OCRは秒オーダーのタクトで処理できれば十分な用途が多いため、実運用に載せやすい領域です。
液体レンズ × ラインカメラ × VLM OCRを組み合わせた全体構成は、以下のようになります。
| レイヤー | 役割 | 代表的な構成要素 |
|---|---|---|
| 光学・撮像 | ケース高さに追従してピントを合わせ、高解像度で撮像 | 液体レンズ、ラインカメラ、高演色LED照明、通過センサ |
| AI推論 | ラベル領域検出+文字認識+意味理解 | VLM(Vision Language Model)、エッジ推論ボックス |
| データ連携 | 読み取り結果をWMSや帳票システムへ送信 | APIゲートウェイ、中継サーバー、PLC/MES連携 |
OCR精度が高くても、WMS連携までワンストップで設計しないと運用に乗りません。Nsightがよく採用するWMS連携パターンは3つです。
既存WMSを変更せず、読み取り結果を現行フローに「注入する」形で導入するのが基本方針です。
※ 記載の金額・料金は記事執筆時点の参考値です。最新情報は各メーカー・ベンダーの公式サイトをご確認ください。
現場でケースの種類・高さレンジ・ラベル貼付位置・搬送速度を実測。サンプル画像を頂戴してNsightの実エンジンで読み取り可能性を評価し、PoC設計書を作成します。
現場に液体レンズ+ラインカメラを仮設置し、実ケースでの読み取りテストを開始。WMS連携のテストデータ送信まで含めて、2週間以内に「現場で動く状態」を作ります。
精度・タクトタイム・誤読率をログに残して月次で改善。効果が確認できたライン・拠点から段階的に横展開します。
※ 記載の金額・料金は記事執筆時点の参考値です。最新情報は各メーカー・ベンダーの公式サイトをご確認ください。
製品にもよりますが、産業用途の液体レンズは一般に数億回以上のピント切替に耐える設計です。ラインカメラ筐体に組み込む形で提供するため、現場で特別なメンテナンスは不要です。
物流OCRは一般的にケース1個あたり1〜3秒のタクトが許容されるため、VLMのレイテンシ(数百ms〜秒オーダー)でも実運用可能です。外観検査(0.2秒/個)とはタスク特性が違うので、VLMの使い方を切り替えています。
中継サーバー経由でCSV出力・DB更新・ファイル連携いずれにも対応します。既存WMS側の改修は最小限に抑える設計を標準としています。
画像サンプル検証・ヒアリング・PoC設計書作成までは無料です。PoC実機導入から費用が発生し、PoC→本番展開の見積もりはPoC設計書段階で明示します。