サイト内の現在位置

データから「なぜ」を見出す因果分析技術

NECの最先端技術

2020年10月2日

因果分析技術はデータ間の因果関係を推定することができる技術です。データ同士の相関関係を利用する一般的な人工知能技術と異なり「なぜ」を見出すことができるので、よりハイレベルな人工知能開発のためのカギとなる技術の一つだと言われています。本技術の詳細について、NECの研究者に話を聞きました。

人工知能の新たなピークをつくり出す因果分析技術

― なぜ、人工知能技術において因果関係の分析が重要なのでしょうか?

ものごとの間の因果関係を見つけたいという欲求は、人間が持っている知的好奇心の中でも最も本質的なものの一つです。昔の人は伝染病の原因が悪魔だと信じていて、そこから多くの迷信が生まれました。そして、迷信にもとづいて悪魔を追い出し、病気を治そうと祈願していたわけです。やがて科学技術の発展にともなって病原体というものに気づき、薬物やワクチンを研究開発することで伝染病の源から蔓延を防いできました。
また、人間は乳幼児からものごとの間の関連性や因果関係を探しはじめます。生後数か月の赤ちゃんですら、スイッチを押せばライトが点灯され、大声で泣けばママが自分のそばに来てくれることを学習していくものです。
ここ10年ほどの間に、ディープラーニングを代表とする人工知能技術は大きな進歩を遂げてきました。自動運転や機械翻訳などの分野でも人工知能の活用が急速に浸透しています。こうした動きは、因果推論などの人間に近い知能を備えたシステム実現への動きに拍車をかけています。
一般的な機械学習アルゴリズムは、主にデータ間の相関関係を探し出して利用することを基本としています。しかし、相関性があれば、必ず因果性があるとは言えません。相関関係と因果関係の間の決定的な違いは、「原因」が「結果」に実際に影響を与えているかどうかです。よく挙げられる例で説明すれば、アイスクリームの販売量と電気の使用量との間には相関関係はありますが、因果関係はありません。双方とも夏の暑い時期に増えるという点では相関関係がありますが、アイスクリームの販売量だけを減らしても電気の使用量は下げられません。同様に、電気の使用量だけを減らしてもアイスクリームの販売量には影響はありませんから、因果関係は存在しないのです。
ものごとの因果関係の有無を判断する最も有効な方法は、ランダム化比較試験(RCT:Random Controlled Trial)です。ただし、ランダム化比較試験は高コストであるだけでなく倫理な問題が生じることも多いため、現実には実施できないこともしばしばです。したがって、観測データを通じてものごとの因果関係を見出す技術「因果推論(Causal inference)」は、ますます注目されている研究分野です。
チューリング賞受賞者で、ベイジアンネットワーク(Bayesian network)の父として知られているJudea Pearl氏は因果推論の手法を開発し、因果関係グラフ(causal graph)でデータ生成過程や因果関係を抽出することに成功しました。最近では、データ間の因果関係を見出すことは学界から産業界まで幅広く関心を集めています。基礎理論研究から、リアルな世界での実用化に向けた技術活用研究へ研究テーマがシフトし始めました。
Judea Pearl氏がかつて言ったように、因果分析はデータの裏にある要因(WHY)をマイニングする技術です。本技術の今後の発展は人工知能に新たな飛躍と革新をもたらし、新たなトレンドをつくりあげることになるでしょう。実際に、因果分析技術を活用した新たなビジネスチャンスも創出されつつあります。たとえば、マーケットリサーチ用に因果分析技術を活用してさまざまな洞察を提示したり、医療関係者の診断・治療戦略の策定を支援したり、小売業者向けの意思決定自動化システムなどを提供したりするサービス等が考えられています。

実世界での問題に対応したNECの因果分析

― 世界的に研究が進められている因果分析技術において、NECならではの特長は何でしょうか?

従来型の「検証型」因果分析技術では、データ分析担当者が対象となる業界に関わる専門知識と経験を習熟し、自力で因果関係を定義しなくてはなりませんでした。こうして定義された因果関係を検証するということが、技術の骨格だったのです。当然、因果関係の仮説は人手で行うわけですから、変数が多い場合には分析が非常に複雑になってきます。
しかし、現実世界では変数が少ないシーンというのはほとんど存在しません。ユーザ行動分析等の市場研究に登場するシナリオの多くが抱える変数は、数十を超えてきます。100を超えることも珍しくありません。つまり、検証型の因果分析技術でこうしたデータを扱うためには、非常に複雑な作業と膨大な作業時間が必要とされていたのです。
これに対して、NECの因果分析技術は独自のイノベーションによって課題に取り組んできました。いまでは特にマーケットリサーチ分野において広くお客様から認められ、ユーザを拡大しています。私たちが成し遂げた4つのイノベーションについて、簡潔にご説明しましょう。

多数の変数を扱える探索型因果分析

私たちの技術が成し遂げたイノベーションの1つは「多数の変数を扱える探索型因果分析」です。この方法では、データ分析担当者が対象の課題について必ずしも専門的な経験や知識に習熟している必要はありません。自動的に観測データから変数間の因果構造と関係を見出すことができます。独自の高速検索アルゴリズムにより計算スピードを大幅に向上させることで、変数の数が100を超えるデータ分析にも対応できるようになりました。データ分析の実験を行った結果、当方法により分析時間が従来型に比べて1/50以下まで短縮できることを実証しました。

多種データの集まりである混合型データ対応の因果分析

また、顧客アンケート分析や製品販促などへの活用シーンでは、データのなかに連続型データ、離散型データ、順位データ、カテゴリデータなど多種多様なデータが含まれてきます。従来のアルゴリズムでは、こうした混合型データは特定のデータ型に統一してから処理するのが一般的でした。しかし、このような方法では一部のデータで明らかな精度劣化が生じてしまいます。この課題を解決するために、混合型データにおいても高い精度を発揮する因果推論方法を独自開発しました。

専門家知識の対話型埋め込み

とはいえ、観測データから自動的に得られた因果構造や関係のなかに間違いやバイアスが生じることは避けられません。しかし、専門家であれば、自身の経験と知識に即して、間違った因果関係を修正できるはずです。私たちは「専門家知識の対話型埋め込み」を実現することで、因果構造と関係の正確度を著しく向上させる方法を開発しました。既に検証された因果関係を簡単に統合し、モデルの自動更新機能を通じて精度を継続的に向上させることができます。先ほど申し上げたように、データ分析担当者が専門的知識や経験を持っている必要はありません。検証済みの因果関係を取り込んだり、現場で専門家が簡単な修正を加えたりすることで精度を向上させていくことができます。

統合型因果分析プラットフォーム

また、ユーザが簡単にNECの因果分析技術を使えるように細心の注意を払いました。たとえば、研究の初期段階からSaaS型のソフトウェアプラットホームを選定し、キーファクター分析や因果グラフの複雑度制御、介入効果シミュレーション、因果関係可視化などといった因果分析に必要な機能を統合しています。ユーザが当技術を体験・利用するハードルを低くするとともに、ユーザからのフィードバックを容易にキャッチアップすることができます。

マーケティングなどで、既に実証・活用が進む

― 実際の応用先としては、どのようなシーンを想定していますか?

現在、マーケティング、小売、製造、金融・保険、医療・介護など多分野のお客様から当技術に強い関心をお示しいただいています。マーケットリサーチ分野では、既に数多くのお客様と連携し、実業務での概念実証に取り組んで参りました。

マーケティングにおける活用

たとえばマーケティングにおいては、ユーザの商品購入に影響を与える主要因子を確定することができます。メーカーの営業活動を評価・改善し、営業活動の成果評価をモニタリングすることにも貢献できます。
また、顧客満足度の分析にも応用することが可能です。たとえば、あるブランドのシャンプーのユーザ調査データに因果分析技術を活用すれば、ユーザの満足度に影響を与える要因を見つけることができます。ユーザ満足度を高められる具体的な改善点を見出すことで、持続的にユーザ体験を高めていくことができるようになります。
さらには、ブランドの分析にも応用可能です。たとえば某自動車メーカー様のユーザ調査データ分析では、さまざまな要素とブランドとの因果関係を構築していきました。この結果、ブランドイメージに影響を与えている「情緒的価値」「機能的価値」「社会的価値」などの多様なイメージのうち、情緒的価値が与える影響力が最も大きいことを発見しました。この分析結果により、ブランドイメージを強める方向性を明確にできたことは一つの大きな成果でした。

小売分野における活用

― 特に市場調査や小売分野では既に実証が進んでいるのですね。

そうですね。小売業者は、マーケティング、価格策定、商品展示など多くの過程で、因果分析技術を活用できる機会がありますから。さらには販売データを洞察することで、顧客データに基づいたデータドリブン型のマーケティング戦略を立てることが可能になります。コンバージョンへの広告の貢献度を評価する「アトリビューション分析」もその一つです。たとえば、各店舗にある高級ブランドの牛乳の小売データやマーケティングデータに基づいて、店内での顧客接点(ポスター、チラシ、販売員など)や店外での顧客接点(ネット広告、テレビ広告、屋外広告など)と消費者の購買行為との因果関係モデルを構築し、各広告接点の貢献率や、影響経路の分析に取り組んでいきました。
また、あるグローバルな家具販売会社の年間販売データから単品家具の価格と店舗売上との因果関係モデルを構築した際には、店舗売上全体に大きく影響している品を発見しました。こうして見出した主な品目について価格戦略の改善を行い、店舗全体の売上の向上を図っていきました。

ビジネスの意思決定における活用

― 他にはどのような分野で活用されていますか?

経営における意思決定のサポートにも役立っています。ビジネスにおいて大きな決断をする際には、データが重要な判断材料になるものです。因果分析技術は多様なデータから判断に影響する要因を把握し、さらには影響する度合いを定量化することによって科学的なアプローチから意思決定をサポートすることができます。
たとえば、ある洗剤製品における分析では、購入において最も重視される指標は洗浄能力であることを見出しました。これにより、その企業では以降の新製品開発において洗浄能力の継続的な改善に力を入れるとともに、宣伝の際にも洗浄能力をアピールできるようになりました。また、通信キャリア様との事例では、顧客行動データとアンケートデータから顧客満足度に影響を与える主要要因を推定し、顧客満足度改善についての戦略の具体化を支援させていただきました。本ソリューションをさらに大規模な顧客群に拡張すれば、さまざまな戦略の顧客満足度に対する改善効果を予測し、適切なターゲット顧客セグメントを正確に特定することできます。

因果分析のセミオープン型プラットフォームをつくりたい

― これからめざしていきたいことは、何でしょうか?

今まではマーケティング分野を中心に複数の大手企業様と連携し、多様なビジネスシナリオでの概念実証を行ってきました。この結果、因果分析の適用効果とポテンシャルについて高く評価をいただき、本技術の将来性についてもご期待いただけるようにもなりました。
今後は、因果推論のコアアルゴリズムの性能優位性を保持するとともに、因果分析技術の他領域への普及を加速させるため、因果分析用ソフトウェア開発キット(SDK)の提供を計画しています。因果分析用オープンアーキテクチャの構築も検討しているところです。
これにより、時系列データを含むより多様なデータが集まった混合型データ構造に対応していきたいと思っています。因果関係に基づく意思決定最適化システムを改善し、データ→因果的洞察→因果的意思決定というサイクルを支援できる技術の構築を実現したいですね。
また、製造業、医療など多くの分野における活用と普及を目標にして、因果推論のコア機能を含むソフトウェア開発キット(SDK)を開発・提供したいと思っています。NECの因果分析が、より多様な顧客の業務プロセス内にスムーズに組み込まれることをめざしています。
さらには、NEC専有の因果分析プラットフォームをセミオープン型プラットフォームに拡張していきたいと考えています。オープンソースや第三者の因果推論アルゴリズムにも対応できるようにすることで因果分析の研究と活用に関するエコシステムを形成し、技術の開発と普及を加速していきたいと思っています。

お問い合わせ