Axis 01 — Direct Inference
文字認識・OCR系
VLMが本番推論を直接担当
ロット番号・賞味期限・品番・刻印などの読取と、マスターデータとの照合を、VLMが学習なしで実行します。従来OCRが弱かった「フォント違い」「位置ズレ」「多言語」「微細刻印」「印字かすれ」も、VLMが文脈ごと意味的に理解するため、辞書登録・テンプレート作成は不要です。
VLM Visual Inspection & OCR
文字認識はVLMが直接処理し、外観検査・カウントはCNNが本番判定。その学習をVLMが裏方で支える。
タスクごとに最適な技術を割り当てるハイブリッド構成で、多品種・低不良率ラインを「現場で動く形」に仕上げます。光学系の設計からPLC連携まで、ソフトとハードを一貫対応します。
01 / WHY Design Philosophy
VLM(Vision Language Model)は万能ではありません。「どのタスクで主役にし、どのタスクで裏方に回すか」を設計できないと、現場で動かない高コストなシステムになります。Nsightはこの使い分けを明確にした上で、ハードウェア一体設計まで一貫対応します。
Axis 01 — Direct Inference
VLMが本番推論を直接担当
ロット番号・賞味期限・品番・刻印などの読取と、マスターデータとの照合を、VLMが学習なしで実行します。従来OCRが弱かった「フォント違い」「位置ズレ」「多言語」「微細刻印」「印字かすれ」も、VLMが文脈ごと意味的に理解するため、辞書登録・テンプレート作成は不要です。
Axis 02 — Hybrid Inference
CNNが本番、VLMは学習補助
傷・汚れ・欠け・異物混入・数量カウントの本番判定はCNN(深層学習)が担当。ラインスピードに追従するレイテンシが要件のため、推論の重いVLMは本番ループには載せません。その代わり、VLMは学習データの自動生成・オートアノテーション・曖昧ケースの補助判定を担当し、Deep Learning運用の最大の難所「不良サンプル不足」を構造的に解消します。
ルールベースでは品種ごとにパラメータ調整が発生。多品種ラインでは設定だけで1日が終わる現場も。
Deep Learningには大量の不良品画像が必要。不良率が低い製品では学習データが構造的に不足。
従来OCRは品種ごとに辞書とテンプレートが必要。フォント違い・印字かすれ・微細刻印で誤認識が多発。
品種ごとにカスタムAIを開発すると初期費用が膨大化。少量生産品では投資回収が見込めない。
02 / OCR Axis 01 — VLM Direct
ロット番号・品番・刻印・賞味期限といった「読み取って正誤を判定する」タスクは、NsightではVLMが本番推論を直接担当します。文字位置・書体・レイアウトが品種ごとに異なっても、辞書登録もテンプレート作成も不要。VLMがラベル全体を「文字+デザイン+文脈」として意味的に理解し、マスターデータと照合します。
従来OCRは1文字ずつ画像を切り出してテンプレート照合する仕組みでした。これに対しVLMは、ラベル・刻印・印字エリア全体を画像と言語の両方で理解します。「O(オー)」と「0(ゼロ)」、「I(アイ)」と「1(イチ)」を字形だけで判別するのではなく、「この位置にこの文字列があり得るか」という制約を内部で自動適用します。これにより、印字品質が落ちた現場でも文字単位のOCR精度を超える総合判定が可能になります。
技術的にはViT/CLIPベースの画像エンコーダ、大規模言語モデル、マルチモーダル結合層の3要素で構成されます。代表的なモデルとしてGPT-4V(OpenAI)、Gemini(Google)、Claude(Anthropic)のビジョン機能などがあり、Nsightではこれらを製造現場で安定稼働するパイプラインとして実装しています。
| 観点 | 従来OCR(テンプレート/辞書型) | VLM 直接推論 |
|---|---|---|
| 新品種追加 | △ テンプレート作成・辞書登録要 | ◎ マスター更新のみで即対応 |
| フォント違い・位置ズレ | × 誤認識多発 | ◎ 文脈で吸収 |
| 微細刻印・エンボス | △ 照明設計に大きく依存 | ○ 照明設計+VLMで対応 |
| 多言語対応 | △ 言語ごとに辞書要 | ◎ 多言語そのまま対応 |
| 辞書・テンプレート保守 | × SKU増で肥大化 | ◎ 不要 |
製造ロット刻印照合、賞味期限・製造日付の検証、化粧品・医薬品ラベルの印字検証、物流ラベルOCR×WMS連携、刻印品番のPLCマスター照合、多品種パッケージの正誤判定。
03 / INSPECTION Axis 02 — CNN + VLM Learning Aid
傷・汚れ・欠け・異物混入・数量カウントの本番判定は、ラインスピードに追従させる必要があります。NsightはこのタスクをCNN(深層学習)で実装し、VLMは推論ループから外して学習データ整備の裏方に回します。これにより、Deep Learning運用の最大の難所「不良サンプル不足」を構造的に解消しながら、本番処理速度を犠牲にしません。
良品サンプルからVLMで不良品画像を合成。不良率が極端に低い製品でも、初期段階から学習データを揃えられます。実機で不良品が出るまで運用開始を待つ必要がありません。
検査画像のラベル付け(欠陥箇所のマーキング、種別分類)をVLMが自動実行。アノテーション工数を最大90%削減します(対象画像の特性に依存)。
CNNが判定に迷うグレーゾーンの画像を、VLMが文脈情報を加えて再評価。誤判定を抑制し、現場の手戻りを減らします。
VLMは文脈理解力に優れますが、推論レイテンシが大きいため、ライン検査の本番ループには適しません。一方CNNは、十分な学習データさえあればVLMより遥かに高速・安定に動きます。Nsightは「CNNの速さ」と「VLMの学習データを作り出す柔軟性」を組み合わせることで、ラインスピードと精度の両立を実現します。
結果として、品種追加時の立ち上げ工数が大幅に短縮されます。VLMで学習データを補完しながらCNNを育てる運用フローを採用することで、不良サンプルが集まるまで何ヶ月も待つ必要がなくなります。
傷・打痕・バリ検出、汚れ・異物混入検出、欠け・割れ検出、メッシュ・穴あき部品の欠陥検出、表面シワ・凹凸検出、製品の数量カウント、自動車部品・電子デバイス・食品・医薬品の全数検査。
04 / ARCH Architecture
OCRはVLM直接推論、外観検査はCNN本番+VLM学習補助、寸法・位置・色などの基礎処理はルールベース──この3層を1本のパイプラインに統合し、PLC/MES/ERPへ判定結果を出力します。設計可能性と説明可能性を担保しながら、ラインスピードに追従します。
学習なしでマスター照合。ロット番号・品番・賞味期限・刻印など。SKUが増えてもマスター更新のみで対応。
傷・汚れ・欠け・異物混入・カウントを本番処理。VLMはNG画像生成とオートアノテーションで裏方に。
エッジ検出・面積・パターンサーチを高速処理。数ms〜数十msで判定が完結する基礎処理層。
FIG — タスクの種類に応じてVLM/CNN/ルールベースの3経路に振り分け、最終判定を統合してPLC・MES・ERPへ出力するパイプライン構成。
| 領域 | ルールベース画像処理 | CNN/VLM |
|---|---|---|
| 寸法計測(μm精度) | ◎ 高速・安定 | △ 精度にバラつき |
| 明確な欠陥の高速検出 | ◎ 数ms〜数十ms | ○ 数十ms〜数百ms |
| 多品種・微妙な判定 | △ 閾値設定が困難 | ◎ 学習で柔軟対応 |
| 未知の欠陥 | × 事前定義要 | ○ 異常検知が可能 |
| 文字認識・照合 | ○ 辞書登録要 | ◎ VLMが学習なし対応 |
05 / SCOPE Industries & Cases
自動車部品・食品・医薬品・電子デバイス・鉄鋼・化粧品・データセンター関連まで、業界横断で導入実績があります。検査対象が異なっても、設計思想は同じ:「OCRはVLM直接、外観検査はCNN本番+VLM学習補助」。
板金・切削加工品・溶接部の外観・寸法・刻印を1台に統合。高温・粉塵環境にも対応した光学設計。
穴の欠け・閉塞・異物付着をCNNで全数検出。NG箇所の座標と信頼度を出力し即時アラート。
微細な凹凸欠陥(wrinkle)をCNNで検出。VLMによるNG画像生成で学習データ不足を解消。
製品番号・材質・サイズ・ロット番号をVLMで読取り、PLCマスターと自動照合。誤出荷を防止。
液体レンズ×ラインカメラ×VLMで段ボール高さ違いに即時対応。WMS基幹システムと連携。
異物混入・包装不良・印字検査・ラベル照合。衛生管理基準への対応を含む。
プレス・ダイカスト・樹脂成形品。打痕・バリ・キズ・欠けの検出。
異物混入、包装不良、印字検査、ラベル照合。衛生管理基準への対応。
基板実装、コネクタ、LED、半導体パッケージ。高精度・高速の全数検査。
HDD部品、光通信部品、液冷設備、電源設備。増産フェーズの検査ライン構築。
板金、切削加工品、溶接部の外観検査。メッキ・塗装のムラ検出。刻印OCR照合。
容器の外観、ラベル貼り位置、キャップ締め、液面レベル検査。多品種ラインの印字検証。
06 / HARDWARE Integrated Design
AIアルゴリズムだけ提供するベンダーが多い中、Nsightは元キーエンス画像処理事業部にて開発エンジニアとして従事していたメンバーの知見を活かし、光学系の設計からハードウェアの選定・装置設計・PLC連携まで一貫して対応します。「カメラの選定ミスで精度が出ない」「照明が合わず安定しない」といった、AI検査が現場で頓挫する典型的な失敗を、ハードとソフトの両面から防ぎます。
画素分解能・被写界深度・シャッター速度から最適なカメラを選定。エリア/ラインスキャン/液体レンズ構成にも対応。
バー、ドーム、同軸落射、ローアングル、偏光等。欠陥種類ごとに最適な方式を設計。微細刻印・反射素材にも対応。
検査→判定→排出まで一台で完結する装置設計。卓上型/インライン型/ガラス式多面検査装置にも対応。
NVIDIA Jetson上でVLM+CNN+ルールベースのハイブリッドパイプラインを安定動作させる実装ノウハウ。
| 構成要素 | 標準採用 |
|---|---|
| カメラ | エリア/ラインスキャン/液体レンズ |
| 照明 | バー・ドーム・同軸落射・偏光 |
| 制御部 | NVIDIA Jetson+PLC連携 |
| UI | ブラウザベース、現場オペレーター操作対応 |
| PLC連携 | 三菱・オムロン・キーエンス・シーメンス |
07 / HOW Engagement Process
一度にすべてをAI化する必要はありません。サンプル画像での無料評価から始めて、PoC、本実装、横展開へと段階的に進める設計です。各ステップで効果を数字で確認しながら拡大します。
ラインを実際に拝見し、品種数・動線・照明・既存設備を把握。カメラ候補位置を一緒に確認します。
サンプル画像での無料診断、検査方式・KPI・設計案をまとめたPoC設計書を作成します。
実機で検証し、ログと映像を蓄積。月次で結果を共有し、精度改善ポイントを洗い出します。
PoCで効果が確認できたパターンを、本番運用や他ライン・他拠点へ段階的に広げます。
※ 上記は標準的な導入実績・ベンチマーク値です。実際の精度・効果は検査対象や運用条件により変動します。
08 / FAQ Frequently Asked
NEXT STEP Start With A Sample
検査対象のサンプル画像をいただければ、想定される検査方式(VLM直接/CNN+VLM学習補助/ルールベースの配分)と達成可能な想定精度、必要なハードウェア構成、概算見積もりとROI試算を無料でレポートします。1〜2週間でお戻しします。