サイト内の現在位置

NEC、連合学習技術と秘密計算技術を用いた創薬における予測モデル構築に関する実証実験を実施

2022年3月11日
日本電気株式会社

NECは、データを暗号化したまま計算処理ができる秘密計算技術を用いた複数組織間のデータ統合の有効性の検証を目的に、国立大学法人京都大学 大学院 医学研究科 小島 諒介講師、岩田 浩明特定准教授、奥野 恭史教授との継続的な議論をふまえて、創薬における予測モデルの構築に関する実証実験を2021年10月~2022年2月の5か月間実施しました。

製薬や化学企業を含む多くの企業や機関において、医薬品などの原料となる化合物の構造データは機密性の高い情報であり、データの持ち出しや他社との共有は困難です。そのため、複数企業やアカデミアと連携した新薬の開発などにおいてはデータ共有が課題となっていました。
本実証実験では、連合学習技術を基盤として改良を加えた機械学習ライブラリkMoL(注1)にNECの秘密計算技術を適用し、様々な化合物とそれらの毒性が記載されているデータセットを用いた毒性予測モデル等を評価しました。

連合学習技術を用いたシステムでは、機密データである化合物情報および活性情報等を直接拠出せずにAIモデルの構築・統合が可能となり、情報の機密性を担保しつつ、企業・組織間の連携ができます。
今回、連合学習技術に秘密分散方式の秘密計算技術を適用することで、連合学習技術単独の場合に加えて、統合時のAIモデルの秘匿性をさらに高めることを試みました。秘密計算技術を用いることで、3つのノードに分散してAIモデルの統合処理を行うため、情報理論的安全性を確保できます。

実証実験の結果、秘密計算技術を適用して構築したAIモデルは、連合学習技術のみで構築したAIモデルと比較して同等の精度を満たすことを確認し、秘密計算技術が毒性予測モデルの構築において化合物の構造データの秘匿性の向上に寄与する実用的な手段であることを実証しました。

今後NECは製薬や化学企業等と連携して、幅広いデータ統合によって創薬・化合物開発の効率化を目指します。

実証実験概要

  • 実施期間:2021年10月~2022年2月
  • 使用データ:
    2014年に行われた米国における毒性学に関する共同研究プロジェクト「Tox21(The Toxicology in the 21st Century)」におけるコンペティション「Tox21 Data Challenge 2014」で使用されたデータセットと毒性予測のkMoLサンプルを使用。
  • 実証詳細:
    機械学習ライブラリkMoLにNECの秘密計算技術を適用した毒性予測モデル等において単体学習とのテスト精度および学習時間を比較した。クライアント数は2とした。
  • 実証結果:
    実証実験を通して、学習における各種評価指標(ROC曲線を用いたAUC(注2)、正解率、適合率や再現率)は単体学習技術と比較して、秘密計算技術を適用しても劣化しないことを確認した。処理時間については、学習データを同量とした単体学習技術と比較して、秘密計算技術を適用した連合学習のクライアントの処理時間の増加が12%程度で、本ユースケースで想定しているモデル統合の頻度ではボトルネックにならないことを実証した。
生成したモデルの精度比較

以上

  • (注1)
    • kMoL:
      国立大学法人京都大学 大学院 医学研究科 小島 諒介講師、岩田 弘明特定准教授、奥野 恭史教授が開発した連合学習技術を基盤として改良を加えたAI創薬向け機械学習ライブラリである。このソフトウェアの連合学習機能は、国立研究開発法人日本医療研究開発機構(AMED)創薬支援推進事業・産学連携による次世代創薬AI開発(DAIIA)事業「最先端のAI技術を用いたマルチターゲット予測と構造発生を組み合わせた包括的な創薬AIプラットフォームの開発」の課題の一貫として開発された。 new windowhttps://github.com/elix-tech/kmol
  • (注2)
    ROC曲線を用いたAUC:毒性の有無を分類するような機械学習モデルにおいて、完全な分類が可能なときは1に近づき、ランダムだと0.5となる指標

NECの秘密計算技術について

本件に関するお客様からのお問い合わせ先

NEC 第一官公ソリューション事業部
E-Mail:science@1kan.jp.nec.com

Orchestrating a brighter world

NECは、安全・安心・公平・効率という社会価値を創造し、
誰もが人間性を十分に発揮できる持続可能な社会の実現を目指します。
https://jpn.nec.com/profile/brand/