メディア
エッジコンピューティングの逆襲 特集

AI認識に必要最小限まで映像データを圧縮する新技術従来比10分の1以上の圧縮を実現

富士通研究所は2020年3月5日、高精細/大容量な映像データをAI(人工知能)が認識可能な必要最小限のサイズまで高圧縮する技術を開発した、と発表した。従来の人間による視認を目的とした圧縮技術と比較し10分の1以上の圧縮が可能となり、運用、伝送回線コストを大幅な削減が実現できるという。同社は、2020年度中の実用化を目指している。

» 2020年03月05日 16時20分 公開
[永山準EE Times Japan]

 富士通研究所は2020年3月5日、高精細/大容量な映像データをAI(人工知能)が認識可能な必要最小限のサイズまで高圧縮する技術を開発した、と発表した。従来の人間による視認を目的とした圧縮技術と比較し10分の1以上の圧縮が可能となり、運用、伝送回線コストの大幅な削減が実現できるという。同社は、2020年度中の実用化を目指している。

人間ではなくAIが認識できる画質のイメージ(クリックで拡大) 出典:富士通研究所

 映像を解析するAI手法としてはディープラーニングが多用されるが、エッジサーバだけで大規模な映像を解析する場合、エッジサーバ増強などによる計算パワー確保が必要となる。そのため、クラウドを利用した処理が有効とされているが、ネットワーク帯域がひっ迫しないよう、映像データの品質を維持しつつクラウドへ送信できる高圧縮技術が求められている。

「AIの判断基準」に着目して実現

 富士通研究所は今回、映像からヒト/動物/モノなどを認識する際、判断基準となる特徴において重視する画像の領域が、AIと人間では異なることに着目。AIが重視する領域を自動解析し、その領域ごとに圧縮率を変えることで、AIが認識できる必要最小限のサイズまでデータ圧縮を可能にする技術を開発した。

 具体的には、まず、オリジナル画像全体の圧縮率を変えて画質を変化させ、その圧縮率を変化させた時のAIの認識結果への影響度を、格子状に区切った画像領域ごとに集計。AIが認識する過程における特徴の重要度合いを、全ての領域ごとに判定する。そして、それぞれの領域において認識精度を急激に劣化させる直前の圧縮率を、「認識精度に影響しない圧縮率」として推定するというもの。さらに、連続する画像におけるAIの認識結果をフィードバックすることで、必要最小限まで圧縮率を高める。

技術の概要。例えば、「男性の人間」の画像の場合、AIの判断基準として重視された「顔部分」の画像領域は低圧縮となり、重要度合いの低い身体や背景の領域ははそれぞれ、高圧縮、超高圧縮し、クラウドに伝送する(クリックで拡大) 出典:富士通研究所

 同社によると、工場で梱包作業を行う複数作業員の様子を4Kの高精細カメラで撮影した映像のAI認識にこの技術を適用したところ、認識精度が劣化することなく、データサイズを10分の1に削減できたという。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.