サイト内の現在位置

AutoMLができること・できないことは?ユースケースも紹介

機械学習(Machine Learning/ML)に様々な期待が寄せられる一方、実用化に向けては「専門知識のある人材がいない・足りない」「機械学習の各プロセスに時間がかかる」など課題が多いのも現状です。その解決策として機械学習プロセスを自動化する「AutoML」が注目を集めています。

専門知識を持つデータサイエンティストでなくても、機械学習を活用できる「データサイエンスの民主化」を進めるためにも有効とされていますが、具体的にどのようなプロセスを自動化できるのか、実用化するために課題はないのか、詳しく解説します。

AutoMLとは

AutoMLAutomated Machine Learningの略で、一般的にデータサイエンスの分析プロセスのなかの機械学習プロセスを自動化する機能を有するツールを指します。

機械学習では、アルゴリズムの選択やパラメータの最適化などをおこないながら、精度を高め、最適なモデル生成を目指します。AutoMLでは、これらのプロセスを自動化し、もっとも精度の高いアルゴリズムを自動で選択。

さらに、生成したモデルを用いて実際のデータを分析し、予測・判断などをおこなう運用までをカバーすることで、データ分析に時間やスキルが限られている人でも機械学習モデルを利用することができます。

機械学習のプロセスとAutoMLの対応範囲

自動化により工数・時間短縮を実現するAutoMLツールですが、機械学習を用いたデータ分析のプロセスすべてを自動化するわけではありません。データ分析をおこなう際はまず、業務上の課題を設定した上で、必要となるデータを収集・加工するところから始まり、集まったデータをもとに、機械学習に必要な「特徴量」の設計をおこないます。

特徴量は、対象データの特徴を表す数値であり、学習内容に影響する「要因」を示すものです。ビジネスから仮説を立て、データセットの生成・評価を繰り返して特徴量を設計し、こうしてできあがった特徴量をもとに、機械学習を進めることになります。AutoMLではこの機械学習以降のプロセスを自動化します。

AutoMLが注目される理由と課題

AutoMLのメリットとしては、大きく「機械学習にかかる時間・工数を削減できること」「専門スキルがなくても機械学習を活用できるようになること」の2つが挙げられます。

様々なシーンで、機械学習の実用化が検討される一方、高度なスキルを持つデータサイエンティストなどの人材を確保できる企業は決して多くはありません。また、市場の変化にスピーディに対応するためにも、機械学習にかかる時間をいかに短縮するかは大きな課題でした。まさにこの2点を解決できるツールとして、AutoMLが注目を集めています。

しかし、上述したとおり、AutoMLがすべてのプロセスを自動化するわけではなく、多くのツールでは、データの収集・加工から、特徴量設計までは、別途おこなう必要があります。特に特徴量設計は専門知識が求められる上、ビジネス上の仮説に基づいて設計する必要があり、一筋縄ではいきません。AutoMLによりデータサイエンティストの負担が減るとはいえ、この特徴量設計をどう進めるかは大きな課題となります。

AutoMLツールのユースケース

故障予測

製造業では、工場の設備などの故障予測に機械学習が活用されています。各種センサーデータなどをもとに、故障の予兆を検知することで、ベテランの経験や勘に頼ることなく、事前修理・調整などの対応が可能になり、稼働率向上を実現します。

もちろん、最初にモデルを生成し、あとはそれを使い続ければよい、というわけではなく、新たに増えるセンサーデータなどをもとに、継続的に再学習をおこない、精度の維持・改善する必要があります。運用フェーズにおいては、毎回データサイエンティストが担当するのではなく、AutoMLツールを用いることで、負担を最小限に抑えられます。

※参考 航空機の故障予測分析(JALエンジニアリング様)

需要予測

小売店舗の売上実績データをもとに、未来の売上を予測する需要予測も、機械学習の活用が進む分野の1つです。天候情報など様々なデータから、商品ごとの需要を予測することで、在庫適正化・販売機会ロスの防止などにつながります。

こちらでも、新たな売上実績データを踏まえて、再学習し、モデルを調整する必要があります。また、キャンペーンの実施など、予測に影響する新たな要素(データ)が増えることもあるでしょう。こういった際も、機械学習プロセスをAutoMLツールで自動化することで、効率的に運用できます。

課題だった「特徴量設計」の自動化を実現する「dotData」

機械学習のハードルを下げる仕組みとして注目されるAutoMLは、機械学習プロセスの自動化により、データサイエンティストの負担軽減、分析にかかる期間短縮、運用の効率化など、様々な効果が得られます。

一方で、AutoMLでは自動化しきれない特徴量設計をどうするのかという課題を解決するツールも登場。それが、特徴量設計自動化機能を持つAIソリューション「dotData」です。dotDataは数千万におよぶ特徴量の候補を自動探索し、これまでデータサイエンティスト自身が担当するしかなかった特徴量設計のプロセスを自動化します。

人間の仮説を超えた特徴量を導きだすケースもあり、機械学習の品質を高めるとともに、専門知識がない人でも活用できるようになります。

実際、「dotData」を導入し、大きな成果を出しているのがコンビニチェーン大手のローソンです。ローソンでは、購入者の“価値観”と購入した商品の関係を学習し、クーポンのデザインや配信、販促、商品開発などにつなげる「価値観に基づいたターゲティング」に取り組んでいますが、そのためには、膨大な購買履歴および商品情報などのデータから購入者の行動や特徴を抽出する必要があります。

まさにここが特徴量設計であり、「dotData」で自動化することで、マーケティング部門の担当者などが、自身で予測モデルを作成できるようになります。例えば、ある商品の販促企画では、購入者の様々な価値観にあわせてデザインしたクーポンを配信した結果、予測スコアによるターゲティング精度向上とあわせてトータルでの購入率が12倍に向上と大きな成果を出しました。 

機械学習への期待が高まる一方で、データサイエンティストなどの人材確保は難しく、活用が進まないと悩む企業も少なくありません。また、ビジネスの現場をもっとも知る担当者が機械学習を用いて分析できるようになれば、活用の幅もさらに広がっていくでしょう。

参考:ローソンが「デジタル人材不足の壁」を打ち破った方法とは ~最先端AIでターゲティング広告の商品購入率が約12倍に~