Japan
サイト内の現在位置を表示しています。
画像認識技術を活用したマイナンバー収集サービス
普通論文2016年1月から税や社会保険などの手続きにマイナンバーが必要になり、事業者は、従業員やその扶養家族のマイナンバーを収集する必要性が出てきました。これを受けて、NECネクサソリューションズでは、マイナンバー収集のためのスマートデバイス(iPhoneやAndroid端末)向けアプリを開発しました。今回開発したアプリでは、画像認識技術を活用し、スマートデバイスでマイナンバーを「読み取る」ことによって、より簡単に、そして、より正確にマイナンバーを取り扱うことを実現しています。本稿では、「画像認識技術で何ができて、それを今後どのように活用していくのか」について紹介します。
1. はじめに
マイナンバーの収集が必須となり、各社からマイナンバーの収集代行サービスが提供されるようになりました。NECネクサソリューションズ(以下、NEXS)でも「マイナンバー対応BPOサービス」において、収集代行サービスを提供しています。NEXSが提供するサービスでは、郵送による収集とスマートデバイスによる収集を実施しています。
ここからは、スマートデバイスを利用したマイナンバーの収集にまつわる技術について紹介します。
2. スマートデバイスを利用した収集
2.1 収集の仕組み
スマートデバイスのカメラで、マイナンバーが記された通知カードないしは個人番号カードを撮影し、撮影した画像を送信して登録するのが一般的な仕組みになります。必要に応じて運転免許証などの本人確認書類も、同じように送信します(図1)。
スマートデバイスを活用することで、書類やコピーを郵送するよりも簡単にマイナンバーを提出できます。
2.2 収集における課題
カメラ撮影によるマイナンバーの収集は操作が簡単ですが、その反面、次の課題があります。
- (1)撮影失敗
手ブレやピンボケ、あるいは、撮影したカードがはみ出していてマイナンバーが読めないケースが考えられます。 - (2)対象間違い
誤って別のカードを撮影して気付かずに送るケースや、扶養家族のカードを撮影するときに、対象者を間違えて撮影して気付かずに送るケースも考えられます。 - (3)マイナンバーのデータ化
マイナンバーが、画像のままではITシステムでデータとして処理することができず、帳票印刷などの処理が行えません。そのため、何らかの方法でデータ化する必要があります。
カード撮影時に、マイナンバーを入力してもらい画像と一緒に送ればデータ化できますが、入力間違いの危険性があります。 - (4)データ流出
撮影した画像は、ネットワーク回線を経由して収集データベースに送られます。不特定多数が利用する公衆無線LANなどでは、盗聴の危険性があります。
また、登録した画像のマイナンバーが読めなかったり、別の人の番号を送ってしまったりすると、収集のやり直しなどの修正作業が発生します。これでは、収集対象者と事業者の双方に余計な手間が掛かります。マイナンバーは、機密性が高くセキュリティ対策も重要です(図2)。
3. 画像認識技術の利用
NEXSでは、NEC中央研究所と連携して、画像認識技術の実証をしています。画像認識技術には、人間の顔を対象とした「顔認証」や部品を対象にした「物体指紋認証」などの各種技術がありますが、それらのなかから「被写体識別」と「OCR*」をマイナンバー収集に活用しています(表)。
表 課題に対する画像認識技術の活用
- *Optical Character Recognition(光学文字認識):手書き文字や印字された文字を、テキスト情報としてデータ化する技術。
3.1 被写体識別
撮影した画像のなかの「どこに」「何が」あるのかを、あらかじめ登録した認識対象物の画像との照合により認識する技術です(図3)。認識のための情報を、対象物に付加するバーコードやICタグなどとは異なり、対象物そのものを認識するため、デザイン上の制約が少なく、既存のものに手を加えずに認識できるというメリットがあります。
被写体識別技術は、NECが独自に開発した、画像中の特徴的な点(特徴点)の周辺領域をコンパクトに記述する局所特徴量方式のBRIGHT特徴量1)を用います。撮影画像から、検出される多数の特徴点からBRIGHT特徴量を抽出し、あらかじめマスターデータベースに登録してある認識対象物の画像の局所特徴量と照合します。こうして、求まった画像間の局所特徴量の対応関係から、撮影画像における対象物の位置・向きを正確に算出します(図4)。BRIGHT特徴量は、対象物が画像に写る大きさ・向き・明るさに不変であるため、登録画像とは異なる撮影角度・大きさ・照明条件でも認識できますし、対象物の一部が隠れていても認識することができます。またBRIGHT特徴量は、高い認識精度を保ちながら、従来の局所特徴量と比較して特徴量サイズが1/10以下と小さいため、スマートフォンなどの携帯端末でも高速な照合が可能になっています。
3.2 OCR(文字認識)
画像中の指定された領域から、そこに含まれる文字の字種を識別します(図5)。まず、撮影画像から文字線の方向情報を特徴として抽出し、複数次元の特徴ベクトルを計算します。そして、撮影画像の特徴ベクトルと、字種ごとにあらかじめ辞書登録された特徴ベクトル(テンプレート)との間の距離計算をし、距離値が小さいテンプレートの字種を認識結果とします。
スキャナなどでカードを撮像する場合は、傾きもなく鮮明な画像が得られるため、認識しやすい入力画像が得られます。しかし、スマートフォンなどの端末で撮影する場合は、カードと端末の角度によっては文字がひずんだり、端末(搭載カメラやオートフォーカスの性能など)によっては画像がぼけたりする課題があるため、次に述べる方法で性能改善をしています。まず、前処理として、被写体識別で得られる対象物の位置・向きの情報を用いて、正面向きから撮影した画像に補正することで、斜めにひずんだ文字の認識を容易にしています(図5(a))。また、テンプレートの準備に当たって、ぼけを含む画像を人工的に生成して、テンプレートのバリエーションを増やすことで、ぼけに対する頑健性を強化しています(図5(b))。
3.3 認識技術の活用
上記で説明した「被写体識別」と「OCR」の技術をどのように活用しているか紹介します。
- (1)手ブレ・ピンボケ対策
通知カードや個人番号カードの撮影で、手ブレやピンボケがひどい場合、被写体識別でのカードの認識ができなくなります。このことを利用して、対象のカードがきれいに撮影できているかをチェックします(図6)。
- (2)はみ出し対策
撮影時に近寄りすぎたり左右にずれたりして、カードがはみ出すことも考えられます。被写体識別では撮影した画像のどの位置に被写体があるのかが分かるので、その機能を利用することで、被写体が画像からはみ出していないかどうかをチェックします(図6)。 - (3)撮影対象物の確認
通知カードや個人番号カードを撮影するつもりで、うっかり別のカードを撮影する場合もあります。この場合も被写体識別でカードの認識ができなくなるため、正しいものを撮影しているかどうかのチェックができます(図6)。 - (4)マイナンバーのデータ化
OCRによって、カードに印字されているマイナンバーをデータ化します。これによりマイナンバーを手入力することなく、ITシステムで使用できるようになります。画像全体にOCRを適用するのではなく、被写体識別によってカードの種類と位置を特定して、OCRの対象領域を正確に決めています。事前に余計な情報を取り除くことで、より高い精度での読み取りを実現しています(図7)。
4. セキュリティ
マイナンバーは機密性の高い情報であり、適切な取り扱いが求められます。番号法2)3)4)には、マイナンバーなどの特定個人情報の提供や保護に関する規定があり、個人情報保護法よりも厳しい罰則が設けられています。このことから分かるように、マイナンバーを取り扱ううえでは、セキュリティに十分な配慮が必要となります。そのため、スマートデバイスが行う通信を暗号化し、撮影した画像や、画像から読み取ったマイナンバーの情報はメモリ上のみで取り扱い、利用が終わったらすみやかに消去します(図8)。
5. 今後の展望
今後、マイナンバーの収集利用だけではなく、さまざまな業務シーンのなかで利用できるようなサービスを、提供する予定です。例えば、口座開設や会員証発行の際に必要な身分証明書を、一時的に預かりデータ登録するのではなく、お客様の目の前でそれらを撮影するだけで、データ化が可能になります。これは、身分証明書を一時的にせよ提供することに抵抗感を持たれる方への、不安を払拭することにもつながります。
6. むすび
本稿では、被写体識別技術とOCR技術の融合により、マイナンバーを簡単にかつ正確に収集することで、収集コストの大幅な削減の実現と、その技術の更なる応用について説明しました。NEXSは、今後も、先進的な技術を活用したサービスを提供し、安全・安心・効率・公平という価値が実現された社会の構築を、NECとともに目指します。
- *iPhone、iPadはApple Inc.の商標です。iPhone商標は、アイホン株式会社のライセンスに基づき使用されています。
- *Androidは、Google Inc.の商標または登録商標です。
- *その他記述された社名、製品名などは、該当する各社の商標または登録商標です。
参考文献
- 1)K.Iwamoto, R.Mase, and T.Nomura: BRIGHT: A Scalable and Compact Binary Descriptor for Low-Latency and High Accuracy Object Identification, Proc. of ICIP2013, pp.2915-2919, 2013.
- 2)
- 3)
- 4)
執筆者プロフィール
NECネクサソリューションズ株式会社
サービス第一営業部
部長
NECネクサソリューションズ株式会社
第四システム事業部
主任
データサイエンス研究所
主任研究員
データサイエンス研究所
主任