サイト内の現在位置

マンモハン・チャンドレイカー

2018年9月28日

マンモハン・チャンドレイカー
博士(コンピュータサイエンス)
NEC 北米研究所
メディアアナリティクス研究部門長

3Dシーン理解と画像認識研究の最前線

現在私たちが取り組んでいるコンピュータビジョンでの研究テーマには、二つの領域があります。一つは3Dシーン理解、もう一つは画像認識です。
3Dシーン理解は、自動運転やAR(拡張現実)に応用される技術ですね。画像認識は、リテールにおけるセルフレジや監視用途など、多様な応用領域へ活用することができる技術だと考えています。
3Dシーン理解の研究では、画像や映像などを2次元のインポートデータと捉えて、その3D構造を理解することをめざしています。3次元を復元するためには、あらゆる情報を活用します。2次元のイメージデータや光と被写体の相互作用、幾何学、画像形成に関わる物理学など、世界がどのように管理されているかというあらゆる知識を活用します。自動運転は、社会に良いインパクトを与えるものです。たとえば渋滞や事故、大気汚染の減少に役立ち、我々と次世代の子どもたちに利益をもたらすことでしょう。しかし、もし自動運転によって、通勤時間や距離が長くなったらどうでしょう。たとえば、さらなる大気汚染など意図してない結果を招くかもしれません。このようなことについて注意していくことも、私たちの社会的責任です。
画像認識では、ピクセル情報がどのように、より抽象的な情報につながっていくかを調べることに興味を持っています。機械学習を活用しながら、画像の中には誰がいるか、そのシーン内では関心対象がどこにあるか、何が行われているかを特定し、さらには、これからどのようなことが起こるかを予測することにも取り組んでいます。

ディープラーニングの独自次世代技術「ドメイン適応」

NEC研究所は、世界で初めてドメイン適応技術を開発しました。この技術を使えば、ラベル無しデータや少量のデータしかない場合でも、教師ありのディープラーニングと同等のパフォーマンスを実現することができます。
ディープラーニングは、顔認識のようなアプリケーションのパフォーマンスに大きく貢献してきました。現在、警察による監視システムなどで多く配備されています。
だからこそ、私たちの認識ソフトには無意識の偏見がないようにしなくてはいけません。たとえば、アジア系でも、アフリカ系でも、白人や他の民族であっても、同様に機能する必要があります。これにより、プロファイリングには利用できなくなり、意図しない監視結果を招くこともありません。特定の民族やジェンダーに対して偏りのあるソフトウェアがある場合には、それを取り除くことが私たちの義務であり、社会的責任であると考えています。
さて、自動運転においてNECの研究所では、距離測定、衝突防止、車線追従などの簡単なタスクだけでなく、オクルージョン推論、ブラインドスポット推論、多様な未来予測など次世代の課題に取り組んでいます。オクルージョン推論と3Dシーン理解技術を活用すれば、運転者から見えない隠れた領域にあるものが何であるかを確率的に推測し、事故を防ぐことができます。ここではコンピュータビジョンからの知見を、開発中の深層学習方法にどのように取り入れるかが重要です。
また、コンピュータと人間の相互的な信頼性にも重点を置いています。つまり、単なるブラックボックスではない深層学習を開発したいと考えています。これができれば、深層学習が特定の結果を推測する明確な理由を知り、詳しい情報を得たうえで判断を下すことができます。
この他にも重要だと思われる課題として、深層学習やコンピュータビジョンの方法にはプライバシー、セキュリティや信頼性などの課題がありますが、私たちもこれらのテーマには積極的に取り組んでいます。
ところで、私たちNECの研究員は、他の職能団体にも積極的に参加しています。たとえば、コンピュータビジョンや機械学習のトップカンファレンスであるCVPR、ICCV、NEPSなどでは定期的に論文発表を行っています。これまでに、15を超える論文を発表してきました。これらの会場では最新のトピックスに関わるワークショップやチュートリアルも開催しており、世界にメッセージを届けるとともに、他のコミュニティからのも知見を得ています。さらに言えば、教育機関との交流も盛んです。インターシップについても非常に素晴らしいプログラムがありますし、大学とのコラボレーションも豊富です。各学校の教授や研究グループと協力して、相互が関心を持つ問題に取り組んでいます。

ARとロボット光学がもたすイノベーション

コンピュータビジョンは現在非常に注目されている分野であり、毎日多くの研究開発が活発に行われています。コンピュータビジョンの研究者はまず、日々発表される論文情報に精通しつづけなくてはなりません。しかし、より高みをめざすならば、ディープラーニングの新しいスキルを開発するだけでなく、若い研究者たちには、特定の問題解決やアプリケーション開発のために必要な、コアとなる専門領域の習得を勧めたいですね。これまでに達成したことと、ブラックボックスのディープラーニング、3D復元、オブジェクト認識の研究から得た専門知識を組み合わせる方法を解明したときこそが、真の進歩となるでしょう。
もう一つ必要だと思うことは、アイデアを伝え、広げていく能力です。私たちがいま取り組んでいるのは、非常に大きな問題です。多くの人々や組織の努力を結びつけていくことが必要となります。信頼でき、再現可能なコードを記述し、他の人々がより大きな目標のために容易に利用できるようにすることが重要です。
私は、コンピュータビジョンにおける次の課題は、実世界との新たなつながりを生み出す全く新しいタイプのインタフェースだと考えています。どのようにすれば、デジタル世界と実世界を無意識につなぎ合わせていくことができるのか。そのためには、画像の形成方法や、光がどのように異なる方向から照らしていくかを正確に理解する必要があります。これからARは、非常に大きな世界となるでしょう。なぜなら実世界とデジタル世界をつなげる新しい方法だからです。
もう一つの重要な分野は。ロボット工学です。ここにも、多くの課題があります。
私たちがこれから解いていくべきものは、たとえば自己管理に関する課題です。デモンストレーションによってシステムへ教育を行うなどの可能性を考えて取り組んでいく必要があるでしょう。また、セキュリティやプライバシー、適応性や相互的な確率、信頼性などの技術的課題にも、私たちが果たすべき社会的責任として取り組んでいます。
私たちはいま、多くのデータを持っていますが、詳細で良好な洞察を得るために十分な量のラベル付きデータが無いという場合には、ドメイン適応技術のような技術が重要になってきます。私たちが現在開発しているディープラーニングでは、どのように予測が導かれるかがブラックボックスであるため、まだあまり信頼することができません。
ここ5〜10年の間に大量のデータが利用可能になり、以前より大きな問題を解決できるようになりました。この傾向は今後も続き、データ規模はさらに拡大し、計算スピードやパフォーマンスもますます良くなっていくことでしょう。将来的なコンピュータビジョンから得られる洞察は、今日のものとは根本的に異なるものになるということです。10年後、20年後には、十分なデータと十分な洞察力によって、将来何が起こるかを予測することができるようになるはずです。私は、自動運転などの課題が解決された20年後の世界を想像することができます。道路インフラや住宅市場は伸長し、大気汚染は消滅するかもしれません。コンピュータビジョンの進歩が、社会の利益を生み出すのです。

マンモハン・チャンドレイカーの写真

マンモハン・チャンドレイカー

インド工科大学ボンベイ校から電気工学で工学技術の学士号を、またカリフォルニア大学サンディエゴ校からコンピュータサイエンスで博士号を取得。カリフォルニア大学バークレー校で博士研究員(ポスドク)対象奨学金を獲得した後、カリフォルニア州クパチーノにあるNEC北米研究所に入社し、コンピュータビジョンの研究を行う。主な研究対象は、SfM(多視点画像からの3次元形状復元)、3Dシーンの理解、複雑な照明や材料挙動下での密モデル化を含む疎密な3D再構築で、これを自動運転、ロボット工学またはヒューマンマシンインターフェイスに応用している。構造と挙動予測に最適なアルゴリズムの研究ではICCV 2007で最優秀の論文に与えられるMarr Prize Honorable Mention賞を、カリフォルニア大学サンディエゴ校では最優秀の論文に贈られるCSE論文賞(Dissertation Award)を受賞したほか、2010年ACM論文賞(Dissertation Award)にもノミネートされた。複雑な材料や照明でのモーションキューからの形状回復に関する研究は、CVPR 2014で最優秀論文賞を受賞している。

関連研究所