ページの先頭です。
サイト内の現在位置を表示しています。
  1. ホーム
  2. プレスリリース
  3. NEC、音で起きている状況がわかる「音状況認識技術」を開発
ここから本文です。

NEC、音で起きている状況がわかる「音状況認識技術」を開発

2016年11月28日
日本電気株式会社

NECは、NECの最先端AI技術群「NEC the WISE」(注1)の1つとして、音により今起きている状況を認識できる「音状況認識技術」を開発しました。

音には、障害物や人垣の向こう側など目に見えない状況を認識できる優れた特性があり、従来より、認識対象の音(目的音)に注力した音認識技術の開発が進められてきました。しかし、広い範囲を対象とした際、認識対象以外の音(環境雑音)による目的音の検知感度や認識精度の低下が課題となっていました。

今回開発した「音状況認識技術」は、マイクで収集した音を目的音と環境雑音に分け、目的音から細かい構成音を抽出する構成音抽出技術と、構成音の組み合わせパターンから事象の有無を判別する事象判別技術です。これにより、判別したいくつかの事象から起きている状況までの認識が可能です(注2)。
NECは「音状況認識技術」により、公共施設や観光地における犯罪・事故の検知や、高齢者宅の生活音による緩やかな見守りなど様々な環境における危険状況の高精度な認識を実現します。

なお本技術は、音響検知の国際的なコンテストDCASE2016において、雑音中の日常音検知部門(注3)で、第1位を獲得しました。また、NECでの検証により、従来比5倍の遠距離でも十分な検知ができることも確認しました(注4)。

NECは「社会ソリューション事業」に注力しており、セーフティ事業を強化しています。今後も本技術をはじめセンシング技術を活用した製品やサービスを提供することで、安全・安心で豊かな社会の実現に貢献していきます。

背景

昨今、安全・安心に向けた取り組みとして、カメラ映像だけでは見えにくい場所でも、音により起きている状況を認識できる技術の開発が進められています。
従来の技術は、個々の環境で目的音を大量に学習することで検知を行っていました。しかし、広い範囲から目的音を検知する際、多くの環境雑音が混入するため、遠くで発生した小さな目的音の検知感度が低下したり、目的音を個々の環境ごとに学習させる必要があるなど、未知の環境への導入が難しいといった課題がありました。
今回開発した「音状況認識技術」は、マイクで収集した音から未知の環境雑音を分けて環境によらない構成音を高感度に検知し、構成音の組み合わせパターンから事象の有無を高精度に判別することで、これらの課題を解決する技術です。

【図1】「音状況認識技術」の概要

新技術の特長

  1. 小さな音も高感度に検知できる構成音抽出技術
    例えば、「ガラスが割れた」という事象で発生する音の場合、「ガシャン」「バリン」「パリン」など、環境によって音が変わります。構成音抽出技術は、マイクで収集した音を、あらかじめ学習していた音の成分は「ガ」や「シャ」、「バ」や「パ」など環境の違いに影響しない細かな構成音に分け、学習させていない未知の音の成分は環境雑音に分けることで、環境雑音の影響を受けることなく、高精度な構成音の抽出を実現しました。

  2. 起きている事象を判別できる事象判別技術
    事象判別技術は、環境の違いに影響しない構成音「ガ」や「シャ」、「バ」や「パ」などの組み合わせを事象パターンとしてあらかじめ学習し、構成音抽出技術で高精度に抽出した構成音と照合することで、目的とする事象の有無を判別します。

これらにより、環境雑音が多く存在する広い範囲でも、小さな音を逃さず高感度に検知できるとともに、目的音を環境ごとに学習させる必要がなく、未知の環境への容易な導入が可能です。

【図2】構成音抽出技術・事象判別技術の概要

NECグループは、安全・安心・効率・公平という社会価値を創造する「社会ソリューション事業」をグローバルに推進しています。当社は、先進のICTや知見を融合し、人々がより明るく豊かに生きる、効率的で洗練された社会を実現していきます。

以上

  • (注1)
    「NEC the WISE」(エヌイーシー ザ ワイズ)は、NECの最先端AI技術群の名称です。"The WISE"には「賢者たち」という意味があり、複雑化・高度化する社会課題に対し、人とAIが協調しながら高度な叡智で解決していくという想いを込めています。
    ・プレスリリース NEC、AI(人工知能)技術ブランド「NEC the WISE」を策定
    http://jpn.nec.com/press/201607/20160719_01.html
    ・NECのAI研究
    http://jpn.nec.com/rd/crl/ai/
  • (注2)会話の意味までは識別不可。
  • (注3)IEEE AASP Challenge
    Detection and Classification of Acoustic Scenes and Events 2016,
    Task2 - Sound event detection in synthetic audio
    URL: http://www.cs.tut.fi/sgn/arg/dcase2016/
  • (注4)従来で4mに相当する検知性能を距離20mで実現し、監視カメラの設置間隔の間をくまなくカバーできる性能をシミュレーションで確認。

本件に関するお客様からのお問い合わせ先

NEC 研究企画本部 研究プロモーショングループ
お問い合わせ

NECは、社会ソリューション事業を推進する
ブランドメッセージ「Orchestrating a brighter world」のもと、
今後の世界の大きな変化(メガトレンド)に対応する
様々な課題解決や社会価値創造に貢献していきます。
詳細はこちらをご覧ください。
http://jpn.nec.com/profile/vision/message.html
Orchestrating a brighter world 世界の想いを、未来へつなげる。

Top of this page