2013年11月12日
日本電気株式会社
NECは、個人に関する情報(以下、パーソナルデータ)のプライバシー保護をより高度かつ高速に行う技術を開発しました。
現在、機密性の高いパーソナルデータを企業内で共有したり、第三者へ提供する際は、個人を特定する情報を削除し、匿名化されています。パーソナルデータは取扱いに慎重を要する機微な値を含むことから、個人を特定する情報等を削除しても他の情報との照合によって個人が特定される可能性があるため、安全管理の徹底が求められています。一方、パーソナルデータを活用するには、傾向や特徴を掴むために一定水準の精度が必要です。
パーソナルデータは、性別や生年月日のように一個人に一つの値となる属性(単一値属性)と、病名や投薬名のように一個人に複数の値が含まれる属性(集合値属性)の組み合わせからなる複雑な構造を有しています。
従来は、単一値属性と集合値属性をそれぞれ分けて匿名化していたため、精度や安全性に課題がありました。
このたびNECは、データの精度を保ちながら単一値属性と集合値属性をまとめて高速に匿名化(k-匿名化、
注1)し、個人が特定されるリスクを大きく低減するアルゴリズムを開発しました。
本技術を活用することで、医療情報や健康情報、生活情報や位置情報など様々なパーソナルデータをより高度に匿名化することができ、それらのデータの安全な有効活用が可能になります。
NECは、本技術を一般的なサーバ(
注2)を用いてパーソナルデータの一つである医療情報のk-匿名化(50万人規模)に適用したところ、約5分という、従来と比較して処理時間を1/40まで短縮することに成功しました。
さらに、NECのデータ処理に特化したDWHアプライアンスサーバ「InfoFrame DWH Appliance」(
注3)を用いて、1億人規模のデータで試行した際、約10時間でk-匿名化できることを実証しました(
注4)。
昨今、ビッグデータのより安全・安心な利活用が注目される中で、パーソナルデータの利活用に関する関心が高まると同時に、プライバシー保護に対する要求も高まっています。このたびの技術は、このようなニーズに応えるものです。
このたび開発したk-匿名化技術の一部は、NECが参画した平成23年度次世代高信頼・省エネ型IT基盤技術・実証実験(レセプト情報等の利活用基盤の開発)及び、国立大学法人東京大学が参画した平成23年度次世代高信頼・省エネ型IT基盤技術開発・実証事業(レセプト情報等の利活用に関する調査・検証)の一環として進めてきた研究成果を発展させたものです。
NECでは今後も、プライバシー保護技術の研究開発に積極的に取り組み、より安全・安心な社会の実現に貢献します。
なお、本技術について、NECグループが開催する「C&Cユーザーフォーラム&iEXPO2013」(会期:11/14(木)~15(金)、会場:東京国際フォーラム(東京都千代田区))にて、展示を実施するとともに、医療情報に関する学会「第33回医療情報学連合大会」(会期:11/21(木)~11/23(金)、会場:神戸ファッションマート)にて発表する予定です。
以上
(注1) k-匿名化
個人に関する情報(パーソナルデータ)に対して、他の情報との照合から個人の特定を防ぐための手法の一つ。パーソナルデータのうち、組み合わせにより個人の特定につながる可能性のある情報(準識別子)を複数のレコードにわたり元の値と関連付く共通の値に加工し、共通の値に加工されたレコード数が「k」個以上になることを保証する。また、あるデータにおいて、準識別子の組み合わせが必ず「k」個以上存在する性質をk-匿名性という。
(注2) 同一のExpressサーバを用いて計測。
(注3) InfoFrame DWH Appliance
大量データの分析のために開発されたデータベース製品。全てのコンピュータが並列に同時に動作することによって、データベース処理が超並列に実行され、桁違いのパフォーマンスをスケーラブルに発揮。また、各並列コンピュータにはFPGA (LSI)を搭載、ディスクから読み込むデータの流れをとめることなくデータベースのストリーミング処理を実現。この超並列のデータベース処理を単一のSMPホストが制御することで、圧倒的な性能と簡易性を両立。
(注4) 一般的なサーバで1億人規模のデータを匿名化した際の理論上の処理時間は、約100倍の1000時間以上となる。
C&Cユーザーフォーラム&iEXPO2013について
第33回医療情報学連合大会について
本件に関するお客様からのお問い合わせ先
私たちNECグループは、
「人と地球にやさしい情報社会をイノベーションで実現する
グローバルリーディングカンパニー」を目指しています。
|