ページの本文へ

Hitachi
お問い合わせお問い合わせ

VLMソリューション

これまで培った画像認識エッジAI技術を活かし、オンプレミス提供の生成AIと組み合わせることで、エッジ処理による即時性と高セキュリティを両立し、新たな価値を提供します。

VLM(Vision Language Model)の魅力

VLMは画像や映像を見て言葉で説明できる最新のAIです。

従来のAIは特定の対象や動作ごとに専用モデルを学習させる必要がありましたが、VLMは映像とテキストを同時に理解できるため、一つの仕組みで多様な状況に柔軟に対応できます。

ソリューション概要

監視カメラや現場作業映像から人の動きや現場の状況を自動で言語化することで、安全監視や業務効率化を支援します。

工場や施設など幅広い現場で、安全性と効率性を高める新しい価値を提供します。

ご利用シーン

インフラ施設の周囲監視

監視カメラから人の動きや現場の状況を分析し、不審人物の警戒を呼びかけるイメージ

<従来のAIの課題>

  • 限定的な認識:姿勢や行動は認識しにくく「人がいる」としか判断できない
  • 塀の上にいるという状況を把握できない
  • 「人物を検出」など短い結果しか出せない

保護具の未着用検知

現場作業映像から安全監視を実施するイメージ

当社の強み

これまで培った組込み機器向け画像認識AIの豊富な開発実績を活かし、お客さまの限られたリソース環境にVLMを活用した生成AIソリューションの提供が可能。

高度な画像認識エッジ技術×VLMによる提供価値

  • 高度なエッジ技術と連携した複雑状況の理解・説明
    エッジ側で物体や動作を正確に検出し、VLMがそれらを組み合わせて状況全体を総合的に理解。従来AIでは困難だったシーンを言葉でわかりやすく説明。
  • 開発・導入コストを削減
    OSS活用とアダプタ設計*1の共通化、VLMの小型化により、多様なOSS推論環境や廉価版SoCへ容易に展開。既存資産を再利用し、開発・導入コストを削減。
  • 高精度な検知と通信コスト削減を両立
    独自アダプタを組み込んだエッジ画像AI技術により、異常やイベント発生時のみ映像データを送信。
  • セキュリティとリアルタイム性の両立
    エッジ画像認識AI技術により低リソース環境でも構築可能。オンプレミス構成により、データを外部に出さずに安全性を確保しつつ、リアルタイムな検知と分析を実現。
*1
アダプタ:カメラから取り込んだ映像に対して、画像認識AI×画像処理技術で異常や特定のイベント発生時のみの映像を高精度に抽出する技術

ご提案例

物体の検出を異常時の通知

物体を検出し、サーバー上でVLMより状況分析、異常時は言語化して通知

エッジデバイスで物体を検出し異常を判定、そのデータをサーバーに送りVLMによって分析された状況を言語化して通知するイメージ

本ソリューション挿入で解決

従来のAIの課題 誤検知や過剰検知

  1. あらかじめ決められた「物体」や「動き」のみの学習
  2. 影や小動物を「人」と誤検知
  3. 角度や、逆光・雨・夜間など環境条件で誤認

従来課題を解決し、
新たな価値と課題発見を創出

  1. 映像とテキストを同時に使い、状況全体を理解
  2. 「動き」「場所」など複数要素を組み合わせて判断
  3. 環境変化や新しいシーンにも柔軟に対応可能

導入の流れ

VLM環境

最適な環境
ご提案
(当社)
環境準備、調達(お客様)
VLM
環境構築
(当社)
設置(お客様)

画像認識

検証シーン
選定
(当社)
事前検証、
チューニング
(当社)
実動画による
検証
(当社)

ダウンロード

VLMソリューションリーフレット

PDF(1.6MB)

資料ダウンロード
PDF形式のファイルをご覧になるには、Adobe Acrobat Readerが必要です。

お問い合わせ

価格、導入方法など、最適なソリューションをご提案します。
まずはお気軽にお問い合わせください。

お問い合わせフォーム

本製品に関するお問い合わせはこちらから

お問い合わせフォーム

リーフレットのダウンロードはこちらから

資料ダウンロード