メディア

自分の声を他人やキャラクターの声に変えるAI技術好きな歌手の声でカラオケ可能?

クリムゾンテクノロジーが「AI・人工知能 EXPO」に、リアルタイム音声変換システム「リアチェン voice」を出展した。リアチェン voiceを活用すれば、異性を含む他人やキャラクターの声で話したり、歌ったりすることが可能になる。

» 2017年07月04日 11時30分 公開
[辻村祐揮EE Times Japan]

声色だけをリアルタイムで変換

 2017年6月27日、「AI・人工知能 EXPO」のプレス限定先行公開が東京ビッグサイトで開催された(本開催は2017年6月28〜30日)。クリムゾンテクノロジーはその会場にて、独自開発の統計的声質変換法「Metamorphone」を用いたリアルタイム音声変換システム「リアチェン voice」を披露。展示スペースでは実際に、リアチェン voiceでの音声変換を実演してみせた。

リアチェン voiceで音声変換。女性、男性、キャラクターの順に実演

 Metamorphoneは、クリムゾンテクノロジーと奈良先端科学技術大学院大学戸田智基客員教授(名古屋大学教授)の研究グループが共同で開発した統計的声質変換法だ。リアチェン voiceはMetamorphoneにより、ある話者の声色をリアルタイムで他の人やキャラクターの声に変換できる。変換の際はもちろん、発話内容は保たれる。

 リアチェン voiceでは、学習部と変換部の2つを経由して音声が変換される。学習部では、変換元の話者と変換先の話者の両者が同じ内容を発話した音声データを多数用い、時間的マッチング(時間伸縮)、特徴量の抽出、パラメータ推定などを行う。これにより、事前に変換モデルを学習しておく。

 一方、変換部では、変換元の話者の音声の特徴量から、統計モデルを用いて元話者の音声をフィルタリングすることで、変換先の話者の特徴を持った音声を出力する。男女の声を相互変換するために、音高の変換も行っている。

ALTALT リアチェン voiceが音声変換する仕組み。さまざまな特徴のボイスデータから、キャラクターを選択できる「標準版」(左)、イベント単位でのキャラクターの声を収録する「プロフェッショナル版」(右)(クリックで拡大) 出典:クリムゾンテクノロジー

 クリムゾンテクノロジーは今回、リアチェン voiceの活用例として、オリジナル音声メッセージカードや着ぐるみ装着例を参考出展した。クリムゾンテクノロジー代表取締役の飛河和生氏によると、同社は今後メッセージカードや着ぐるみへのリアチェン voiceの応用を進めていく考えだという。

 「リアチェン voiceを使えば、メッセージカードに自分の好きな声でメッセージを吹き込める。また、着ぐるみを着た人が自分の声ではなく、着ぐるみに合った声で話したり、歌ったりできるようになる」(飛河氏)。

ALTALT オリジナル音声メッセージカード(左)、着ぐるみ装着例(右)(クリックで拡大)

 カラオケなどで活用することもできるのだろうか。飛河氏はそれに関して、「版権の問題もあるが、それ以前に音声変換時の遅延時間が現時点では約100ミリ秒あるので、リアチェン voiceをすぐにカラオケへ応用することは難しい。現段階ではどうしても音声変換のタイムラグが気になるだろう。だが、Metamorphoneの技術がさらに発展すれば、好きな歌手やアニメキャラクターの声で歌を歌うことがいずれは可能になると思う」と語った。

 また、リアチェン voiceの他の用途としては、コールセンターでの活用を挙げている。「男性は声が低いため、コールセンターの電話対応には女性の声が最適だ。リアチェン voiceを活用すれば、男性でも女性の声で電話対応できるようになるだろう。それも、人に最も不快感を与えない“いい声”でだ」(飛河氏)。

Copyright © ITmedia, Inc. All Rights Reserved.

RSSフィード

公式SNS

All material on this site Copyright © ITmedia, Inc. All Rights Reserved.
This site contains articles under license from AspenCore LLC.