Japan
サイト内の現在位置
AIの思考経路が手に取るようにわかる
ルール発見型推論技術
NECの最先端技術 2022年2月25日

近年、AIを用いたデータ活用に大きな注目が集まっていますが、AIが導き出した結果の判断根拠は未だ不透明であることが多い状況です。AIがさらに社会へ浸透するためには、説明性の確保が重要だといわれています。NECでは2022年2月、このような状況に対応する新技術「ルール発見型推論技術」を発表しました。本技術の価値や仕組みについて、研究者に詳しく話を聞きました。
プロフィール
データサイエンス研究所
主任研究員
岡嶋 穣
納得し、安心して使えるAIへ
― 「ルール発見型推論技術」とは、どのような技術なのでしょうか?
予測の根拠を分かりやすいルールの形で示すことができるAI技術です。近年のAI技術は、非常に複雑な計算によって高精度な予測や価値を提示することができるものの、その根拠を私たち人間が把握することはできませんでした。「ブラックボックス型AI」と呼ばれる問題です。
これに対し、ルール発見型推論技術は高い精度と説明性を併せ持ち、「どの要因がどのような条件のとき、何が起きるか」を私たち人間にもわかりやすいルールとして提示することができます。実際に過去の事例をたどって、個々のルールの正しさを検証することも可能です。
具体的に説明してみましょう。たとえば製造業において、室温や電圧などの過去データから機械の故障との関連性を導き出そうとするケースを考えてみます。現在広く「説明可能AI」として流通している「重みづけ」によるモデルでは、AIがデータを分析して「故障確率=2.0×室温+0.2×電圧-20」などの計算モデルをつくり出します。室温や電圧の前にかけられる「2.0」や「0.2」などの定数が、それぞれの項目の重要性(重み)を示しているのですが、私たち人間にはその数値の単位や意味がわからないため、このモデルが適切であるかどうか判断できません。これに対して、ルール発見型推論技術では「IF > 30.0℃ AND 電圧 > 200V THEN 故障確率=80%」のように、数値の単位や意味を明確に示すルールが得られます。ルールを見れば、室温30℃を超えるときに200V以上の電圧をかけると壊れやすいのだと、一つの知見として容易に解釈していただけると思います。また、室温30℃以上かつ200V以上の過去データをたどっていけば、実際にどれだけ故障が起きたのかを検証することもできます。
予測の根拠を明確な知見として提示するAIをつくり出すことで、実際にご活用いただける機会も増えるのではないかと期待しています。
ランダム生成された膨大なルールから、最適なものだけを絞り込む
― どのような仕組みで、本技術を実現しているのでしょうか?
ルールを使ったAI技術では、決定木という技術が古くから知られています。決定木とは、質問にイエスかノーで答えていくだけで予測結果が得られる単純なAIです。人間に理解しやすい一方で、予測精度が低いのが難点でした。この問題を解決するために、ランダムに生成した大量の決定木を組み合わせることで予測精度を上げる「ランダムフォレスト」のような技術も広く使われていますが、使用するルールが大量になり、人間が理解することが難しくなります。
そこで私たちは、ランダムフォレストで作られた決定木に含まれるルールから最適なものだけを絞り込み、「決定リスト」と呼ばれるルールのリストを作成するアプローチをとりました。ランダムフォレストでは、同じような決定木をランダムに生成するため、実際には似通ったルールや妥当でないルールも多数混在しています。そのような玉石混交の大量のルールのなかから、正解率の高いルールをスクリーニングし、残すべきルールの組み合わせを探っていきます。本来であれば、数万×数万×数万……におよぶルールの組み合わせを考えなくてはならず、計算爆発が起きてしまうような処理です。しかし、正解データを学習させて各ルールの妥当性(重み)を導き出すことで計算可能な問題に変換し、さらには深層学習で使われる並列計算技術を応用することで、必要十分なルールの組み合わせを選別できるように設計しました。こうしてできあがった現実的な個数にまで絞られたルールのリストである「決定リスト」に基づいて、判断を行っていきます。
この結果、従来の決定木を活用した手法よりも遥かに少ないルール数で、高い精度を出すことができるようになりました。オープンデータを用いた実験では、既存手法で50個近いルールを使って初めて達成した精度であっても、私たちの技術では十数個のルールで達成できることを確認しています。同じ精度をより少ないルールを達成できるということは、それだけ人間に解釈しやすい方法を実現できたということになります。
欠陥品の発生要因の事前特定や優良顧客育成に貢献
― どのようなシーンでの活用を想定されていますか?
まず一つとしては、冒頭でも例示したような製造業での活用を考えています。この技術を用いると、原材料の成分配合や処理装置の設定などの大量のデータを学習することで、どんな条件で欠陥品が発生するのかを分析し、私たちにも理解できるかたちで根拠を提示できるようになります。これにより、品質管理をさらに高度化できるはずです。実際に製造業のお客様のご協力のもとで実証実験を進めた結果、好意的なご評価をいただくことができました。
また、マーケティングへの応用も技術検証を進めています。小売業のお客様と連携した実証実験では、新規顧客を優良顧客へと育成するルートを可視化するために、この技術を用いています。顧客の購買履歴のデータを入力することで、どのような条件下で購買金額や来店回数が改善したかをルールの形で分析することが可能です。これらのルールを用いて、優良顧客を育成するルートを可視化していきます。お客様からは「予想していなかったルールが出てきて、非常に参考になる」というコメントをいただきました。本技術は人間が無意識のうちに考えてしまう常識の範囲外からデータドリブンに法則を提示してくれるので、新鮮な知見を導き出せるというメリットがあります。
私たちがめざすAIは、人間と協働するAIです。予測精度の高さだけを追求するブラックボックス型のAIは、AIに任せて自動化できる領域では有用です。しかし、AIで完全自動化できる領域は限られています。多くの場合は、AIの予測結果を人間が理解して人間の行動や施策に反映する必要があります。このために、私たちは人間にもわかりやすいルールを出せるAIを開発しました。さらに、いま理想として考えているのは、人間とAIの間にインタラクションが発生するような未来です。人間が考えていることに対してAIが答えを返し、人間と共同で判断を進めていけるようなことができれば、人間とAIのあいだの理解や協働がさらに進んでいくはずです。私たちは、そのようなAIをめざしてこれからも研究を続けていきたいと考えています。
- ※本ページに掲載されている情報は、掲載時の情報です。
お問い合わせ