ページの先頭です。
ここから本文です。
サイト内の現在位置を表示しています。
  1. ホーム
  2. NEC Information Square
  3. Innovators 100 Series
  4. Vol.22 スマホやオーディオプレイヤーの進化を支える、世界の音響信号処理技術の第一人者 杉山 昭彦
ここから本文です。

Innovators 100 Series Vol.22 杉山 昭彦

スマホやオーディオプレイヤーの進化を支える、世界の音響信号処理技術の第一人者

2015年3月31日

Vol.22 CHAPTER1 スマホやオーディオプレイヤーの進化を支える、世界の音響信号処理技術の第一人者 杉山 昭彦NEC 情報・メディアプロセッシング研究所 主席研究員 工学博士:杉山 昭彦

世界の標準規格として多くの人が耳にしたことがある、オーディオの圧縮技術「MPEG」。初代「MPEG-1」のアルゴリズム開発から、技術開発と標準化活動に深く関わってきた杉山 昭彦。
他にも快適な通話や音声認識に欠かせないノイズの除去など、30年以上にわたるオーディオ信号処理のスペシャリストとして、「MPEG」開発の歴史や興味深いノイズ除去の仕組み、さらには研究におけるこだわりなどを語ります。

コミュニケーションの基本となるのは、音。

―杉山さんは、どんな研究のスペシャリストなのか、わかりやすく教えてください。

写真:杉山昭彦 氏

杉山:ひと言で言うと、音響信号処理の研究者です。音というのは意志や感情を相手に伝えるコミュニケーションの基本となるものですよね。皆さんがいろいろな場所で耳にする音を心地よく、自然なものにするための、さまざまな処理や研究を行っています。

電話などを通じて声を相手に伝える時には、雑音など届けたくないモノを除外して、届けたい声だけを取り出す前処理の技術が必要です。

次に、音の情報をメモリやネットワークに乗せて届ける場合、音の情報量を小さくすることで、より速く、より安く、より多くの人が利用できるようになります。こうした圧縮技術に代表される、速く、安く、きれいに聞かせるための技術がメインの処理になります。

さらに、相手から届いた声を携帯電話で受ける時など、受け手の携帯電話側で音をクリアにしたり、目的に応じた音の聞こえ方を実現する、そういった後処理の技術も重要になってきます。

このように、「人と人」や「人と機械」など、音による快適なコミュニケーションをトータルにサポートするのが、私の仕事です。

快適な通話のために、不要な雑音をカット

―初めにNECの音響信号処理技術について、具体的に説明してください。

杉山:NECには、先進かつ多彩な音響信号処理技術があります。その技術の集合体は『EuphoMagic(R)』(ユーフォマジック)』と名付けられており、信号を聞きやすくする技術の総称です。‘Eupho’は‘音が心地よい’、‘Magic’は‘魔法のように変える’という意味です。当社はもちろんのこと、他社機器にも搭載されており、音声認識や電話などの通話・録音の品質を高めます。では、『EuphoMagic』について、簡単にお話ししましょう。

まず、音声や音楽を傷つけることなく、それらに混入した雑音を除去する技術として「ノイズサプレッサ」や「ノイズキャンセラ」があります。

「ノイズサプレッサ」は、1つのマイクで拾った音声や音楽の中に混入した雑音成分を分離して抑圧し、音声成分のみを強調します。そのためには、雑音成分の推定が必要であり、推定精度が性能に大きな影響を与えます。必然的に、音声や音楽に対して雑音のレベルが高くなるほど、性能が劣化します。

「ノイズキャンセラ」は、ノイズサプレッサよりも雑音が多い環境でも高音質な強調音声や音楽を得ることができる技術で、2つのマイクを使って雑音を消去します。簡単に言うと、2つのマイクのうちの1つを雑音用マイクとして使い、このマイクで集めた音を雑音と仮定して、通話用のもう1つのマイクから引き算することでクリアな通話や録音を可能にします。

他にも、ハンズフリー通話の際に、スピーカからマイクへ音声が回り込むことで生じるエコーを消去する技術が、スマートフォンやノートPCに搭載されています。

―NECが開発した「EuphoMagic」の具体的な効果やメリットとは何ですか。

写真PaPeRo petit

杉山:スマートフォンの通話、スカイプなどでのテレビ電話、音声レコーダ、ビデオ録画に付随する録音などで背景に入る周囲の騒音、機器操作のタップ音やキーボードなどの衝撃雑音、デジタルカメラのレンズ駆動やピント合わせの機械的雑音、さらには風雑音を十分に小さくして、音声などの目的とする信号を聞きやすくします。これらの技術は、NECの携帯電話をはじめ、デジタルカメラなど他社製のコンシューマ機器にも採用されています。いま、私のインタビューを録音しているその音声レコーダにも、NECの技術が使われているんですよ。

また、自動車走行中のカーナビやNECのコミュニケーションロボットPaPeRo(パぺロ)の耳における精度の高い音声認識にも、これらの技術が役立っています。

国際標準規格である、「MPEG」開発に貢献

―次に、メインの処理部分とも言えるオーディオ信号の圧縮技術について説明してください。

杉山:オーディオ信号の圧縮技術は、人間の聴覚特性を利用します。人間の耳では聞こえない高音や弱い音の成分をカットすることで、情報量を減らします。また、人間の耳は特に、高音部で異なった周波数を識別する能力が低いため、高音の微妙な周波数の違いを聞き分けることができません。この聞き分けられない周波数成分のうち1つだけを残すことでも、情報量を減らせます。さらに、大きな音と近い周波数にある小さな音は、大きな音にかき消されて聞こえません。これをマスキングと言い、聞こえない成分を削除することで情報量を減らします。

もうひとつの方法は、情報偏在の利用です。オーディオ信号に、ある数学的な変換を行うと信号が1ヵ所に集まり、情報に偏りが生じます。信号が集まっていない部分は音のない空白なので、そこをカットすれば情報量が大幅に削減できるのです。細かな処理は他にもいろいろありますが、大まかに言うとこのような方法で、オーディオ信号の情報を圧縮します。

―私たちも耳にしたことのある「MPEG」という圧縮技術について教えてください。

写真:杉山昭彦 氏

杉山:MPEGは、映像や音楽などのマルチメディアデータを、高品質を保ったままCD-ROM媒体に記録して、ゲーム機で再生したいというニーズで始まりました。

ISO/IEC*が1989年に国際規格の標準化作業を開始すると、世界中の有名企業や大学の研究者、技術者が、自慢の技術を持ち寄って参加しました。オーディオ部門は、数回の会合の後、スウェーデンのストックホルムに各社の装置を持ち寄って、評価を行いました。

評価の結果、全評価項目で優れていた技術はなく、各社の優れた技術を統合して世界標準を制定することになったのです。このようにして、オリジナルのCD音源と同等の音質を1/8~1/12の情報量で表現できる第一世代の圧縮技術「MPEG-1」が誕生しました。

入力信号の特性に応じてブロック長(ひとまとめにして処理する信号のサンプル数)を切り替えることで雑音を10,000分の1に低減する『適応ブロック長変換符号化』も、当社技術として採用されています。

その後、圧縮技術は時代のニーズに応じて進化を続けていますが、現在まですべての世代に『適応ブロック長変換符号化』が採用されています。世界中の人々が使っている携帯電話やスマートフォン、PCやタブレット、DVDプレイヤーなどマルチメディアを利用した装置のすべてにこの技術が搭載され、快適なコミュニケーション、ダウンロードミュージック、着信音などのサービスを支えているのです。もちろん、iPhoneやiPadも例外ではありません。

  • *ISO/IEC ISOとは国際標準化機構(International Organization for Standardization)
    IECとは国際電気標準会議(International Electrotechnical Commission)

―圧縮技術を活用してNECが世界で初めて開発した完全半導体オーディオプレイヤーについて聞かせてください。

写真NECが世界で初めて開発した完全半導体オーディオプレイヤー
(左から順に、1994年、1995年、1997年モデル)

写真アメリカのTime誌による「未来の生活を変える10大技術」の1つに選ばれた「シリコン・オーディオ」。
© 1995 Time Inc. TIME 1995年7月17日号

杉山:半導体を記録媒体とするデジタルオーディオプレイヤーの代表が、2005年※に発売されたアップル社のiPod®(アイポッド)です。それより11年前の1994年に、私たちは世界初の完全半導体携帯オーディオプレイヤーの開発に成功していました。

広報への反響は極めて大きく、NY Timesをはじめとする各国の代表的な新聞、ラジオ、雑誌などで、未来のオーディオとして広く紹介されました。当日夜には、麹町にあるアメリカNBCのスタジオで、生放送のニュースに登場したことも懐かしい思い出です。アメリカのTIME誌でも紹介されているんですよ。

シリコン・オーディオ(Silicon Audio)®という商標も取得したこの試作装置、実はチームメンバーの趣味から始まったものなのです。ところが、部長に内緒で開発を始めた途端に、その趣味人はアメリカ留学のために逃亡してしまいました。結局、私自身がその後始末をして、この世に出すはめになりました。当時は、そういう趣味に走る人が普通に研究者をやっていけるよい時代でした。

  • 2005年発売のiPod nanoまでは、ハードディスクドライブ(HDD)利用。それ以降、フラッシュメモリ利用が主流になった。

オーディオ信号の圧縮は、人の耳と脳をダマす技術

―「MPEG」はその後、どのように進化していくのですか。

写真:杉山昭彦 氏

杉山:第二世代の「MPEG-2」は、欧州デジタルラジオ放送が主な応用でした。できるだけ多くのチャンネルを確保し、多言語や5.1chにも対応して、効率よくオーディオ信号を圧縮する技術が求められたのです。

しかし、当初開発した「MPEG-2/BC (Backward Compatible)」は音質がよくありませんでした。欧州の放送局から、新しい標準化の要請が出るのは当然です。MPEG-1との互換性を優先して音質が不十分であったという反省にもとづき、新しいMPEG-2はゼロベースで技術の見直しを行いました。その結果、原音の1/16というさらに高い圧縮率で放送品質の基準を十分維持できる、「MPEG-2/AAC」という方式が1997 年に実現しました。現在の水準から見ても高品質な符号化方式で、日本の衛星放送やデジタルテレビ放送にも使われています。

21世紀に向かって、世の中にモバイル通信という大きな流れが湧き起り、PCを含む小型携帯端末で高音質を維持しながら、圧縮率をさらに向上させるために開発されたのが、「MPEG-4」です。オーディオの規格はMPEG-2と大差ありませんが、圧縮率が高い時にも品質が劣化しないように、細かい点で工夫がなされています。

オーディオに関して圧縮率が著しく向上するのは、「MPEG-4」の進化版である「MPEG-4 HE-ACC」です。爆発的に増える携帯電話ユーザに、着信音の配信などオーディオ信号を用いたサービスを提供するためには、原理上の限界を超える圧縮が要求されます。さらに、携帯電話では、低消費電力化も重要な課題となります。

そこで解決策として、低周波数成分だけを残して情報量を半減し、信号を元に戻す時には、低周波数成分を高周波数帯域にコピーして、低周波数と高周波数の両方が揃ったよい音を再現します。我々は、この原理を信号処理の原点に立ち戻って再考し、およそ半分の計算量で同等の音質を達成できる画期的な圧縮方法を考えだし、MPEG標準に採用させました。

このようにして2003年に完成した、1/32という常識を超えた高い圧縮率と低演算量による低消費電力を両立した第三世代のMPEG-4 HE-ACCは、音楽ダウンロード時間が短く、たくさんの音楽を蓄積でき、長時間充電不要な携帯電話を実現するために欠かすことのできないものです。ボーカル付着信音のフルバージョンをダウンロードできたり、多数の高音質音楽を蓄積できたり、私たちの生活を変えた技術ですね。

このように、技術の勃興からオーディオ信号の圧縮技術の進化を見てくると、新たな方法や技術の開発は、人間の耳と脳をどうダマすかという挑戦でもあることが理解できます(笑)。

―杉山さんの「MPEG」に対するこれまでの関わりを教えてください。

写真:杉山昭彦 氏

杉山:技術の開発、国際標準化活動、さらに解説論文や書籍、並びに日本工業規格(JIS)原案の執筆を通じた技術の啓蒙まで、トータルに関わってきました。若い頃はもちろん、技術者として開発を中心となって担当し、その成果は第一世代「MPEG-1」の一部として結実しました。第二世代では、チームをまとめて開発が順調に進むように配慮するとともに、当社技術が採用されるように会合で他社との交渉を行いました。第二世代で標準化活動から一度引退した後、第三世代で会社要請によって復帰し、当社技術採用に向けた他社交渉を中心となって担当しました。

標準化会合では、提案技術の利点を説明し、その採用を働きかけることが最大の役割です。採用は、特許権行使による収入や熟知した技術にもとづいた早期製品開発・市場投入などの形で、当社に利益をもたらします。また、国内メーカとの間で意見の調整や取りまとめを行い、それを日本の利益になる形で国際標準化機関に発信することも、私の重要な役目です。つまり私は、会社の代表と日本の代表という2つの立場から、当社の技術また日本の技術が国際規格として認められるように活動してきました。

第三世代で当社はMPEG標準化から手を引きましたが、歴代の「MPEG」標準に採用された技術は、ソフトウェアやチップとして、引き続き消費者に提供されています。また、出願した特許は、重要な特許ライセンス収入をもたらしてくれました。全世界で、800社以上にライセンスされていると言えば、その規模が理解できるでしょう。私自身の特許は既に出願から20年を経過して、誰でも無料で使用できる技術になってしまいましたが・・・(笑)。

  • 記載されている会社名・製品名は、各社の商標または登録商標です。
ページ共通メニューここまで。

ページの先頭へ戻る