サイト内の現在位置

脳神経科学×ディープラーニング
速度と精度の最適化を約束する革新的テクノロジー

NECの最先端技術

2021年5月6日

NECは顔認証などで活用できる新たな革新的技術「SPRT-based algorithm that Treat As Nth-Order Markov Series:SPRT-TANDEM」(*1)を発表しました。脳科学にヒントを得て開発したという本技術(アルゴリズム)について、顔認証で長年開発を指揮してきたNEC フェロー今岡と研究者の海老原に話を聞きました。

  • (*1)
    データ系列をN次マルコフ過程として扱う逐次確率比検定ベースのアルゴリズム

プロフィール
NEC フェロー
今岡 仁

第三者機関のベンチマークテストで世界No.1の精度を実証しつづけているNECの指紋認証・顔認証・虹彩認証。そのすべての生体認証技術の研究を統括し、顔認証世界No.1の5回獲得へと導いた立役者。NEC史上最年少でフェローに就任。

バイオメトリクス研究所
主任
海老原 章記

米国ロックフェラー大学で脳科学・神経科学を学び、生物学博士号を取得。2020年には生体認証の難関国際学会IJCB(International Joint Conference on Biometrics)2020でnew windowBest Paper Awardを受賞している。

精度をキープしながら従来比3倍から20倍の判定速度を達成

NEC フェロー
今岡 仁

― 今回リリースされたアルゴリズム「SPRT-based algorithm that Treat As Nth-Order Markov Series:SPRT-TANDEM」(*1)はどのようなものなのでしょうか?

今岡:さまざまな系列データの判定スピードと判定精度を高めることができる技術です。時系列データなど、系列データであれば何にでも適用できる技術なのですが、まずはわかりやすく顔認証を例にして説明してみましょう。

海老原:顔認証機器が入場ゲートの前に設置してあるシーンを想定してください。この場合、人が機器に向かって歩いてくるあいだに、できるだけ速く正確に顔を照合してゲートを開閉することが求められます。従来型の顔認証では、カメラで一定区間を撮影し、決められた数のフレームを総合的に判断して認証するのが一般的でした。たとえば30フレームと指定されていれば、30枚の画像を分析して認証結果を判定するわけですね。しかし、これでは始めの方のフレームですぐにわかってしまうような簡単な判定でも、30フレーム分待つ必要があるため余計な時間がかかってしまいます。逆に、30フレーム内では判定が難しい場合には、誤判定が起きてしまう可能性がありました。
今回開発したアルゴリズムは、認証結果を逐次判定していく技術です。極端な話を言えば、1フレーム目で一定の確度を担保できてしまえば、即座に認証を完了することができます。逆に、なかなか確度を持てない場合にはより多くのフレームを取得して検討を続けるので、十分な精度を担保することができます。実験でも、従来手法と同じ精度をキープしながら平均3倍から20倍の認証スピードを実現できることを確認しました。

もっとわかりやすく例えて言うならば「早押しクイズ」のような動き方をする技術です。早押しクイズではできるだけ早く、しかし、間違えずに答えなければなりません。たとえば「江戸時代に活躍した『おくのほそ道』の作者は?」という問題が読み上げられるとき、私たちはどのように考えるでしょうか。「江戸時代に活躍」したという部分だけでは答えの確度は低いので、まだ答えを出すことはできません。しかし、「おくのほそ道」というキーワードが出れば確度は一気に高まります。逆に「『おくのほそ道』で知られる江戸時代の人物は?」という問題であれば、「おくのほそ道」というキーワードが出た時点で高い確度を持ってすぐに答えることができるでしょう。難しい問題はじっくりと考え、簡単な問題は素早く答えていくわけですね。実際、早押しクイズのような問題を解くとき、大脳頭頂葉ではエビデンス蓄積(Evidence Accumulation)ニューロンという器官が活動するのですが、「江戸時代に活躍」というような弱いエビデンスには弱く小さく反応し、「おくのほそ道」のような強いエビデンスには大きく反応していきます。そして、十分な確度を得られたときにはじめて意思決定を行うと考えられているのです。今回開発した技術は、まさにこうした脳の動きを模してつくりあげた技術です。

今岡:海老原さんがなぜこんなに脳に詳しいかというと、もともと野口英世やノーベル生理学賞・医学賞を受賞した大隅良典先生も在籍していたロックフェラー大学で脳科学・神経科学の研究をしていました。生物学で博士をとっている。日々、サルの脳の働きを調べていたのですよね。

海老原:はい。私が研究していたのは霊長類の大脳がどのように顔を認識しているかということでしたが、先ほどお話ししたような脳の動きは、2002年にサルの脳を調べた先行研究で報告(*2)されています。また、このときの意思決定までの脳の動きは、SPRT(Sequential Probability Ratio Test:逐次確率比検定)という数学・統計学的な技術で説明ができるということが2015年に報告(*3)されています。この報告をもとに、顔認証のような技術でより速く、より高精度に判定するための技術としてSPRTの実用化検討を進めていきました。

どんな手法よりも速度と精度が最適化されると理論的に証明済み(*4)

バイオメトリクス研究所
主任
海老原 章記

― SPRTとは、どういう技術ですか? 今回開発したアルゴリズムとの違いは何でしょうか?

海老原:SPRTは1940年代を中心に活躍したAbraham Waldという数学者が提案した手法で、「尤度比(ゆうどひ)」という値を活用します。尤度とは、漢字が示すとおり「尤(もっと)もらしさ」を表す数値です。信頼度と言い換えてもいいかもしれません。簡単に言うと、信頼度を逐次更新して判定を行う手法です。
また、一般的に早押しクイズのような問題ではスピードと精度がトレードオフの関係になりますが、SPRTを使えば精度を担保しながら速度を最適化できるということが理論的に証明されています。実は、逐次的に判定を行う技術自体は現在も多数存在しているのですが、SPRTを実現できれば、あらゆる逐次検定手法のなかでも最も速く正確な判定ができることがAbraham Waldによって既に証明されているわけです。
ただ、SPRTには「尤度比が既知であること」「データが独立同分布に従うこと」という2つの条件が存在していました。あらかじめ尤度比がわかっているような限られたシーンでは活用ができるのですが、広く現実問題として扱うためには使用条件が厳しく、実用化が難しかったのです。
この条件を緩和して実社会運用を可能にしたものこそが、今回私たちが開発したアルゴリズムです。ディープラーニングを活用することで、Abraham Waldの時代では実現できなかった高い精度の尤度比推定が可能になりました。さらに、尤度比推定用の新しいニューラルネットワーク構造と尤度比推定を効率的に行う損失関数を設計することで、SPRTの広い応用を実現しています。神経科学と早期分類、確率密度比推定という3つの分野を横断した学際研究によって生まれた技術です。

  • (*4)
    データが独立なときに厳密に最適(optimal)になる。
    データが従属なときは,閾値が広がるにつれて漸近的に最適 (asymptotically optimal) になる。

あらゆるシーンに応用可能な新たな革新的コアテクノロジー

― 今回開発したアルゴリズムは、今後どのような応用の可能性があるのでしょうか?

海老原:じつは、この技術は実用化が完了しています。NECの顔認証AIエンジン「NeoFace」に搭載予定です。この研究はもともと開発から入ったものだったのですが、実際に運用したところ非常に良い結果を確認できたので、ぜひ論文化して発表しようということになりました。本論文は機械学習・人工知能系で最も権威ある国際会議の一つICLR(International Conference on Learning Representations)に通り、上位5%の研究に機会を与えられるSpotlight Presentationにも選出されました。

今岡:本技術は顔認証への応用から生まれたものではありますが、あらゆる系列データへ応用が効く非常に革新的な技術です。顔認証への応用は、ほんの一例に過ぎません。たとえば音声認識やサイバー攻撃の分析、がんの検知など、活用可能なシーンはこれからどんどん広がっていくでしょう。NECの新たなコアテクノロジーになり得るインパクトを持った発明であると考えています。
私もNECに入社当初は脳の視覚情報処理に関わる研究に取り組んでいたので、生体認証やデータサイエンスを行う上では脳科学の専門家が必要だと常々考えてきました。海老原君のような人材が加わってくれたことは、とても心強く感じています。これからもNECでは異分野の優秀な人材や、先鋭的な知識を持った博士人材を積極的に採用して、新たなイノベーションを生み出していきたいと考えています。

お問い合わせ