Japan
サイト内の現在位置
特集 研究とエンジニアリングの双方で活躍
file01 岡部 浩司
2022年10月3日
研究から開発まで自分でできれば、事業が加速する

技術は日々進化をつづけ、世界はめまぐるしく変化する先行き不透明な現代。
いま研究開発には、スピーディに事業化を実現する新しい研究スタイルが求められています。
カギとなるのは、研究とエンジニアリングを自在に横断して実装を加速させるスキルです。
NECではいま、このスキル領域を「リサーチエンジニアリング」と名付けて強化を進めています。
新しい研究スタイルをいかに構築し、世界をリードしつづけられるか――。
日々模索と挑戦をつづける新時代の研究者たちの姿をご紹介します。
バイオメトリクス研究所
岡部 浩司
研究から開発までを一手に担い、音声分野で高い専門性をもつスペシャリスト。上流から下流までのスキルを一気通貫で自身が兼ね備えることで、数々の技術の事業化を加速させている。2022年には「NEC Enhanced Speech Analysis - 高性能音声解析 -」の事業化に貢献。
15年以上、音声認識の高速化やカスタマイズに従事
― これまでどのような研究をされてきたのでしょうか?
2007年度に入社して以来、音声に携わってきました。初めに関わったのは、携帯電話端末上で動作する旅行会話通訳アプリの音声認識です(注1)。その後、NEC情報システムズ(現 NECソリューションイノベータ)に2年ほど出向して、各顧客向けに音声認識モデルのカスタマイズを行う業務に携わりました。音声認識では、各業界やお客様内でのさまざまな専門用語に対応するために細かなカスタマイズが不可欠なのです。その後研究所に戻ってからは、音声認識と声認証の研究開発を続けています。
― 研究だけでなく、エンジニアリングにも積極的に取り組んでこられたということでしょうか?
はい。声認証では認証精度の向上に取り組んで論文発表も行いましたが(注2)、全体的にはエンジニアリング寄りの研究に多く取り組んできました。特に、ディープラーニングが流行する以前の音声認識では既に基本的な技術が確立されていたので、さまざまな分野の研究者が少しずつ改良を繰り返しているという状況でした。だからこそ、当時の音声認識では製品開発とエンジニアリングの方が重要な地位を占めていたのです。そのため、自然とエンジニアリング寄りの研究に取り組むことになったのだと思います。何か独創的な技術を開発するというよりは、他分野で既に提案されているような手法を見つけて応用し、高速化や電話音声にスピーディに対応にするということを続けていました。
- 注1:携帯電話機上で動作する日英・英日自動通訳ソフトを開発
(http://www.nec.co.jp/press/ja/0901/0505.html) - 注2:NEC、声認証技術を強化、5秒で個人を認識可能に ~フレーズに依存しない自然会話で高精度認識~
(https://jpn.nec.com/press/201902/20190219_01.html)
プロトタイプを3カ月で仕上げて製品化を加速

― 最近の音声認識は、また状況が変わっていますか?
はい。ディープラーニングの流行と、End-to-Endの音声認識(注3)の登場によって、飛躍的に精度が向上しました。NECでもこの方式によって、新しい音声認識エンジンの開発に成功しています。しかし、軒並み高精度な音声認識が実現したいま、最も重要なことは一刻も早く製品化を進めることです。このタイミングを逃しては、せっかくの大きなビジネスチャンスを逸してしまうという危機感がありました。そこで、リアルタイムに音声認識ができるデモアプリケーションをチームメンバーと協力して作成しました。期間は3カ月です。かなりタイトなスケジュールですが、以前より目をつけていたオープンソースソフトウェア(OSS)をカスタマイズしたり、PythonでリアルタイムAPIを書いたりすることで完成させました。このデモアプリケーションによって、精度の良さを事業部の方にも直感的にご理解いただけたので、スムーズに事業化が進みました。
― 効果を実感いただくためのプロトタイプをつくりあげる?
そうですね。事業化をスムーズに進めるために、OSSを組み合わせたりカスタマイズしたりすることで実際に挙動するものを組み上げていきます。先ほどお話ししたデモアプリケーションの開発後にも、事業部の方に製品化イメージをもっていただくために、Web APIを組んで提案しに行ったりもしました。Web API形式の音声認識製品はいま世界のトレンドになっていますし、事業部の方々もサービス展開したいだろうと考えたのです。さらに、事業部側でサービスをつくるとなったら、そこからまた開発まで数カ月かかってしまうことも考えられました。製品化までのスピードアップを図るためにも必要なことだと考えたんです。
その後は、学習データの大幅な増強による精度向上や処理速度の改善、さらには話者認識機能の追加に取り組んでいきました。事業部のみなさんといっしょに市場投入におけるさまざまな課題を解決し、スピーディにB2Bサービス事業の開始まで実現できたことは、非常に良かったと思います。
- 注3:従来型のディープラーニングを活用した音声認識では音響モデルと言語モデルという2つのモジュールを活用していたが、End-to-Endの音声認識では、音声を入力すると文字が直接出力される単一のモデルを学習し、高精度な認識が可能となった
研究と開発に、区別はない

― 新しい技術を作るだけでなく、エンジニアリングよる実装や事業化までを研究活動の射程にしているのでしょうか?
そうですね。特に音声認識は、皆が知らない技術というよりは「音声のテキスト化」という誰もが想起しやすい、よく知られている技術です。新しい技術を作るというよりも、既にある技術を活用して早く製品化したいという意識があるのかなと思います。
それに、私は研究もエンジニアリングも両方やりたいタイプの人間なんです。二つを区別して考えていません。もちろん、あらゆる人が双方できる必要はないと思うのですが、私自身は研究もエンジニアリングもシームレスに行いたいし、その方が研究開発においてスムーズな点も多々あると思っています。二つが別人格に分かれていると、一方が気づいていない課題をそのままにして製品化まで進んでしまうこともあるかもしれませんが、一人であれば当然その心配はありません。それに、製品化段階で何か問題が生じた際でもスピーディに方針転換して、現実的な解決策を提示することができるでしょう。少なくとも、私はそのような人材をめざしています。
これは、自分が使ってみたいものをつくりたいとか、形になって動いているところがみたいという気持ちがモチベーションになっているのかもしれません。やはり、自分の手でつくったものが実際に動くところを見るのは面白いですよ。研究所には「研究」がしたくて入社してこられる方も多いとは思いますが、ぜひ私のようなタイプの研究者にも活躍してほしいと思っています。
- ※本ページに掲載されている情報は、掲載時の情報です。
お問い合わせ