サイト内の現在位置

後ろ向きでも、体が隠れていても人をマッチングする人物照合技術

NECの最先端技術

2019年2月7日

たとえ顔が映っていなくても、映像や画像に記録された全身像から人物を高精度にマッチングする技術。そんなNECの人物照合技術について、開発者に詳細を聞きました。

後ろを向いていても同一人物をマッチング

バイオメトリクス研究所
主任研究員
櫻井 和之

― 人物照合技術とは、どのような技術なのでしょうか?

映像や画像に映った人物の全体像から、任意の人物をマッチングすることができる技術です。前向きでカメラへ正対した人物だけでなく、横向きで歩いていても、後ろ向きであっても同一の人物としてマッチングすることが可能です。
私たちNECは顔認証をはじめとした生体認証技術で世界をリードしていますが、顔認証では当然のことながら、識別したい人物の顔がカメラに映っていなければ認証することができません。そのため、たとえば後ろ向きの人物をマッチングすることは不可能です。
しかし、私たち人間を考えてみてください。後ろを向いている人を見ただけでも、さっきすれ違った人だなとわかることも多いでしょう。私たちは、人の背格好や服装など、実にさまざまな情報から印象を形成して人を見分けていることがわかると思います。こうした人間のマッチング能力を再現したものが本技術だと考えると理解していただきやすいかもしれません。
この技術を応用すれば、たとえば施設に設置された複数のカメラの映像のなかから、同一の人物を簡単に見つけ出すことができるようになります。複数のカメラ映像をまたいで、同一の人物をリアルタイムに見つけることが可能です。顔などの特定部位が映っている必要がないので、途中で見失うリスクが少ないことも本技術の大きな特長ですね。セキュリティが特に重要視されるような施設においても大きなソリューションを期待できる技術だと考えています。

同一人物探索の概要

部分的に体が隠れていても高精度にマッチング

― 人物マッチングには、どのような技術が使われているのでしょうか?

本技術の核となっているのは、機械学習による画像認識です。大量の人物画像データを学習させることで、高精度な人物マッチングが可能になっています。画像認識は、身近な例であれば画像検索のように、それがネコかイヌであるかなど、写っているものが何かを判定する技術としてすでに活用されていますが、人物をマッチングするとなると、システムは一気に複雑なものになります。人物をマッチングするためには、学習させるべきデータのバリエーションが大量に必要になるからです。
まず、人物のマッチングとは個人を見分けることと同義ですから、見分けるべきカテゴリが個人の数だけ必要になります。さらに、人間は腰を曲げたり手を振ったりと実にさまざまな形状に変化するため、各個人において姿勢のバリエーションを用意しなければなりません。しかも、正面や横向き、後ろ向きなど、あらゆる角度から各バリエーションを想定しなければならないため、学習させるべきパターンは膨大なものとなります。
私たちの人物照合技術では、ディープラーニングをベースにしたNEC独自の工夫や、世界No.1*の精度を誇るNECの顔認証技術のノウハウを用いてこの難題を克服しました。公開データベースを活用した実験でも、150名の登録人物を約9割の精度でマッチングすることに成功しています。
また、私たちの技術がもつ最大の特長は、必ずしも対象者の全身が映っている必要がないということです。下半身の2/3程度が物陰に隠れていても、問題なく動作することを確認しています。施設内のカメラを使った応用を想定した場合、実際は全身の一部が他の人や椅子などで隠れてしまうことが多いものです。そうした意味でも、本技術は実用的なレベルの人物照合技術として仕上がっています。

  • *
    MBGC 2009 (Multiple Biometric Grand Challenge)
    MBE 2010 (Multiple Biometrics Evaluation)
    FRVT 2013 (Face Recognition Vendor Test)
    FIVE 2017 (Face In Video Evaluation)
人物識別技術のフロー

複数のカメラを連携し、さらなる進化

― どのようなソリューションを考えていますか?

例えば、迷子の捜索に役立つと考えています。街角のカメラには必ずしも顔が映っておらず、人混みに紛れてしまうことが良くあります。そのような場合でも、体の一部を見つけられれば迷子を特定できるので、今どこにいるかを知ることができます。また、事件・事故を起こした容疑者の追跡にも使えると思っています。そういった容疑者は顔が映っていないことがほとんどですが、逃走している姿で特定できるので、容疑者がどこに逃げたのかを知ることができます。

多様な応用を進めるためにはプライバシーへの配慮は最大限に考慮されねばなりませんが、離れた場所にカメラが複数あるのだけれども、そこに映る同じ人物をマッチングすることで多様なアプリケーションが生まれてくると考えています。ぜひ幅広いお客様と協力しながら、新しい価値を創りあげていきたいですね。

櫻井 和之のインタビューの様子