2013年5月7日
日本電気株式会社
NECは、雑音除去技術と音声強調技術を組み合わせることで、家電やスマートフォン・タブレット端末などを離れたところから声で操作できる、音声認識技術を開発しました。
昨今、家電やスマートフォン・タブレット端末などには、音声で操作する機能が搭載されていますが、内蔵マイクを口元に近づけてはっきりと発話する必要があります。このため、例えばテレビのあるリビングルーム、調理中のキッチン、走行中の自動車内など雑音がある環境下においては、機器が声に反応しない、雑音に反応して誤動作するなどの課題があります。
このたび開発した技術は、従来は利用が難しかった雑音下においても、マイクから離れて発話した音声を正確に検知して、機器の操作ができる音声インタフェースを実現します。本技術により音声を用いて、騒がしいリビングルームやキッチンで約1m離れた場所から機器を操作したり、走行中の車内でカーナビをスムーズに操作したりすることが可能になります。また、工場などの生産現場、店舗や倉庫などの流通現場において、音声を利用したデータ入力にも応用可能です。
このたび開発した技術の特長は、次のとおりです。
- 二つのマイクを用いた雑音除去技術で、音声を正確に検知
機器に搭載した二つのマイクに入る音(音声+雑音)の信号から、雑音成分を逐次推定・除去して音声成分だけを残す技術を開発。時間とともに変化する雑音にも正確に追従し除去することで、従来の雑音除去技術よりも正確に音声だけを検知することが可能。これにより、機器のボタンを押す、機器に向かって手を叩くなど、操作を開始する際に行っていた動作が不要。
- 音声のモデルを用いて、音声認識に最適な音に調整
雑音除去を行った結果、歪みが発生し認識が難しくなった音声に対して、モデルに基づいて音声成分を強調する技術を開発。これにより、歪んだ音声を音声認識に適した音に調整することが可能となり、モバイル端末向け音声認識の世界標準規格(注)よりも優れた音声認識精度を実現。
NECは今後も、音声認識技術のさらなる強化を図り、人にやさしい情報社会の実現を目指して研究開発を進めてまいります。
【別紙】 雑音環境下でも家電などを遠隔操作できる音声認識技術
以上
(注) モバイル端末から入力された音声をサーバで認識し、端末に結果を返すサーバ・クライアントフレームワーク(分散音声認識:DSR)では、ETSI Advanced Front-End (AFE)と呼ばれる音声強調処理の標準規格が定められている。
本件に関するお客様からのお問い合わせ先
私たちNECグループは、
「人と地球にやさしい情報社会をイノベーションで実現する
グローバルリーディングカンパニー」を目指しています。
|