サイト内の現在位置

経営にイノベーションを起こす予測分析自動化

Scale-out data driven business processes by predictive analysis automation

C&Cユーザーフォーラム&iEXPO 2017 特別セミナー

2017年11月9日

AI最前線:ビジネスを革新する予測分析自動化への挑戦

  • 要旨
  • パネルディスカッション講演録

Prev

データの特徴、予測モデルの中身がわかる「ホワイトボックス」の意義とは

 予測分析自動化が生成する特徴量・予測モデルが「ホワイトボックス」であることも意義深いと聞きました。具体的には、どういう意味でしょうか。

渋谷 データを分析したら、こんな結果が出た。これでも十分なケースはあるかもしれませんが、販売・マーケティングの領域では、予測の精度が高いというだけでは十分ではありません。どのデータが効いて、この結果が出ているということが説明できなければ、次のビジネスアクションにはつなげられませんし、社内の合意を形成することも難しいからです。
たとえば、「ハワイ」と検索している、決済ページに足跡があるなど、最初から高い購入確率が出るのが当たり前なデータが入っていたとします。しかし、予測モデルがブラックボックスだと、そのことに気づけず、単に高い精度が出たことを「すごいモデルができた!」と喜んでしまうかもしれません。
一方、特徴量・予測モデルがホワイトボックスであれば、分析の誤りにも気づくことができます。これは今回のPoCの中でも実際に経験したことです。
NECの予測分析自動化が作成するデータセット・予測モデルは、どのデータからその結果が出ているのかという説明が自然言語で出てくるので非常にわかりやすく、ホワイトボックスであることをあらためて大事だと確認できました。

藤巻 ホワイトボックスであれば、予測モデルを検証できます。たとえば、予測モデルを作ったときに、使ってはいけない情報などで精度が高まってしまうと、実運用を開始したときには精度が出ないという事態に直面することがあります。このとき、ブラックボックスでは検証することもできません。
また、説明責任を果たし、リスクを管理するという上でもホワイトボックスは重要です。仮に金融ローンの与信管理に人種差別的な予測モデルを作ってしまったら、訴訟リスクに直面する可能性があります。ブラックボックスだと、そのことに気がつけません。
加えて、結局AIも使うのは人ですから、分析のロジック、背景がわかるものでなければ普及しません。そういう点で、ホワイトボックスであるということは非常に重要な条件となると考えています。
もちろん、ホワイトボックスが必要ない領域もあります。画像を見て猫や犬を判断するという分析に、なぜ機械がそれを猫だと思ったかを知る必要はあまりありませんよね。

根拠がわからないブラックボックス型AIと、根拠がわかるホワイトボックス型AI

誰もが分析を行い、ビジネスはよりデータドリブンになる

 テクノロジーが高度化する中で、今後、データサイエンティストやデータアナリストを取り巻く環境、求められる役割はどのように変わっていくと考えていますか。

藤巻 「セルフサービス分析」が主流になっていくと考えています。ユーザー企業は、NECのようなITベンダーに分析を依頼するというのが一般的でした。データはあっても、データサイエンティストがいなかったからです。しかし、次第にこの流れが変わってきています。企業は自社内にデータサイエンティストを抱え、自分たちで分析を行おうと考えるようになっています。
それに伴い、データサイエンティストに対する考えかたも変わってきています。これまでのデータサイエンティストは、統計学を学んだような人で、ごく少数しかおらず、すべての企業が人材をそろえるのは不可能です。そのため、一般的なビジネスユーザーが分析を行うことが増えています。ガートナーは、これを「市民データサイエンティスト」と呼んでいます。
自動化は、分析のハードルを下げ、この潮流を加速する上でも有効だと考えています。どんな企業にも渋谷さんのようなデータサイエンティストが10人いるわけではありません。しかし、自動化によって、多くの人が分析を行うようになれば、どんどんビジネスがデータドリブンになっていくと期待しています。

  • ガートナー, "Successfully Adopt Advanced Supply Chain Analytics With Limited Data Scientist Resources", Noha Toharny, 03 August 2017
これからのデータ分析は、市民データサイエンティストによるセルフサービスが主流に

渋谷 特徴量を作るという点が、一般的なビジネスパーソンが分析に取り組むハードルになっていたことは、ほぼ間違いありません。それが自動化されれば、多くの人が分析に参加できます。逆に現在、データサイエンティストと呼ばれている人は、ビジネスをよく知り、分析やその結果が、ビジネス上価値があるものかどうかを判断することが求められるようになると思います。ぜひ、そういう社会になってほしいものです。

藤巻 そう遠くない将来、そうした社会が来ると私は信じています。そのためにも、さらに技術に磨きをかけていきたいですね。

 今後、IoT活用が進展し、さらに膨大なデータが収集されるようになれば、特徴量も増えることになります。そうした社会の中で、ビジネス、あるいは産業をどう作っていくのか。同時に、予測モデルのホワイトボックス化で話したようなガバナンスやリスク管理をどう行っていくのか。それらを考える上で非常に有益なパネルディスカッションになったと思います。ありがとうございました。

Prev