メディア
エッジコンピューティングの逆襲 特集

あいまいな命令でも理解!エッジAIによるHMI制御技術「〇〇(俳優名)よろしく!」から判断

三菱電機は2020年1月28日、エッジで動作可能かつ曖昧な命令でも不足情報を自動補完して理解するAI技術を開発した、と発表した。同社のAI(人工知能)技術「Maisart(マイサート)」を活用したもの。家電や車載情報機器のHMI(Human Machine Interface)制御技術として、2022年以降の商用化を目指す。

» 2020年01月29日 09時30分 公開
[永山準EE Times Japan]

 三菱電機は2020年1月28日、エッジで動作可能かつ、曖昧な命令でも不足情報を自動補完して理解するAI技術を開発したと発表した。同社のAI(人工知能)技術「Maisart(マイサート)」を活用したもの。家電や車載情報機器のHMI(Human Machine Interface)制御技術として、2022年以降の商用化を目指す。

発表時に行われたデモで用意された、知識グラフ※架空の名前、番組名などが記載されている(クリックで拡大)

「すみません、私には〇〇が理解できません」……をなくす技術

 スマートフォンや家電などの一般的な音声アシスタントを利用する際、「〇〇(俳優名)よろしく」などと、述語や目的語を省いた曖昧なことばのままで命令を与えると、AIが理解できない場合が多い。今回、三菱電機が開発したのは、この課題を解決する技術だ。

 そもそも従来のクラウド上のビッグデータを利用するAIの方式では、個人情報などを除いた「限定的なデータ」を用いることによって、「必要な情報を得られず、曖昧な命令を理解できないことがある」(同社)という。

 今回、発表された「コンパクトな知識処理に基づくHMI制御技術」は、搭載する機器情報や操作方法などをAIが事前に学習したうえで、カメラなどで得られるセンシング情報も統合し、ユーザーの属性やリアルタイムの状況を把握する。そして、ユーザーの状況に関連性が高い情報や機器操作方法などを含めた、「知識グラフ」で推論することで、ユーザーが出した曖昧な命令に不足している述語や目的語などの情報を自動補完し、「ユーザーのやりたいこと」を理解できるという。(下記図参照)

開発成果の詳細、例えばテレビに搭載した場合、番組表の情報(放送時間や出演俳優、番組名など)や機器情報(機器操作方法や録画、再生の有無など)にユーザーの好みや時間帯といった情報を統合して、「俳優A」が出ている番組を録画すべきなのか、再生すべきなのかなどを判断する(クリックで拡大)

 具体的に、テレビにこの技術を用いたAIを搭載すると、下記のようなやりとりが実現するという。

テレビに搭載した場合の想定例

  • 朝外出時に母がテレビに「『俳優A』よろしく」と命令→カメラまたは音声で「母」であると認証
  • 番組表の情報とこれまでの学習内容から、状況を認識し下記のように情報を補完
    • 「母」が好きな番組は「番組X」だ
    • 母は今から出掛けるためTVは視聴しない
    • 午前10時に「俳優A」が出演する「番組X」が放送される
    • 「番組X」の録画は予約されていない
  • 上記をもとに自動で情報を補完し判断→「『俳優A』が出演している『番組X』録画します」と応答

※その日の夜に同じように母が「『俳優A』よろしく」と命令した場合には、今度は「録画した『俳優A』出演の『番組X』の再生します」などと、自動で判断して別の応答をする


 また、こうして関連情報やユーザーの好みを把握することで、上記以外にも、「勘違い」の内容を予測し「本来言おうとしていたこと」を指摘できるほか、絞り込み条件の推薦なども実現可能という。そのため同社は機器への搭載のほか、見積事例の検索、不具合対処方法検索といった問い合わせ業務への適用も検討しているという。

 同社担当者は、「いままでのような一方通行の対話でなく、ユーザーの状況に合わせて気の利いた対話ができるようなAIが構築できる」と話していた。

演算量をコンパクト化し、エッジ搭載を実現

 さらに、この技術では、新たに加えられたユーザー命令とセンシング情報をもとに、既存の知識グラフの中から関連性の強さに応じて絞り込みを行うことで、処理をコンパクト化し、「演算量とメモリ消費量を削減できる」という。このためクラウドへの情報アップロードを行うことなく、エッジ側での処理を実現。「曖昧な命令を1秒以内で理解し、即時に応答する」としている。

知識処理のコンパクト化について(クリックで拡大)

 機器、用途によって必要な情報量やレスポンスへの要求仕様などはさまざまなため一概にはいえないが、一般的に想定される利用をする範囲であればカーナビのマイコン上にも実装可能という。

デモの様子。左=「須藤英太(架空の俳優)をよろしく」とマイクで音声を入力すると、知識グラフ上の「須藤英太」「放送予定」「ドラマSP『峠の桜』」といった情報と、「お母さん」「朝の操作」「録画予約」などのユーザー情報、機能を結び付け、「ドラマSP『峠の桜』を録画予約します」と回答した/中=こちらは、「勘違いの指摘」。番組情報からユーザーが求める内容を推測している/右=「絞り込み条件の推薦」。ユーザーの好みを把握して番組を薦めている(クリックで拡大)

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.