VLM(Vision Language Model)は、画像認識と自然言語処理を統合したAIモデルです。Nsightではルールベース+従来AIで検査を行い、VLMは「学習コストを下げる武器」として裏方で活用しています。具体的にはNG画像生成(不良品画像を生成し学習データの不足を補完)、オートアノテーション(教師データ作成の工数を削減)、ブラウザベースの学習UI(現場オペレーターが直感的にAIを調整)の3つをパッケージ化していく方針です。ラベル文字認識・照合についてはVLMが検査自体を担当し、学習なしで文字の位置と意味を理解してマスターデータと照合します。