Japan
サイト内の現在位置
熟練者の意図を学習し、意思決定を模倣するAI技術を開発
~高度なスキルが必要な実業務において10倍以上の効率化を確認~2019年7月17日
日本電気株式会社
NEC は、熟練者の過去の行動履歴データから、その卓越した認知・判断に基づく意図を意思決定モデルとして学習し、高度なスキルが要求される業務を大幅に効率化するAI技術を開発しました。本技術を、属人的な業務の意思決定プロセスに適用することにより、業務負荷を大幅に軽減することができ、業務スピードの大幅な向上が可能となります。
本技術は、逆強化学習(注1)のフレームワークをNEC独自のアルゴリズムで拡張し、従来、技術者が行っていた意思決定モデルの構築を自動化します。人手では定式化が困難な意思決定問題に対して、熟練者の過去の行動履歴データから意思決定モデルを作成することで、熟練者と同等の判断を迅速かつ自律的に導き出します。本技術は、主に以下の領域に対して適用が可能です。
- 1)RPA(Robotic Process Automation)を適用できない複雑な意思決定を必要とする業務領域(例:営業活動やプラント運転など)
- 2)人の判断・動作を物理的に再現する領域(例:自動運転やロボット制御など)
また、今回開発した技術をTV放送局の広告スケジューリング業務(注2)に適用し、実データを使った性能評価を実施しました。本業務は、各CMにおける要件・制限事項と、放送枠の活用方法など放送局側の要件の両方を考慮しなければならず、高度なスキルやノウハウが要求されます。この業務に本技術を活用した結果、経験豊富な熟練者と同等レベルの意思決定を10倍以上のスピードで実現できることを確認しました。今後、熟練者への負荷が高い様々な業務への適用を進め、人のパートナーとなりうるAIの開発に取り組みます。
NECは社会ソリューション事業に注力しており、本技術をはじめとするAIやIoTなどのデジタル技術により、お客様との共創を通じた企業・社会のデジタルトランスフォーメーションに貢献していきます。
背景
近年のディープラーニングに代表されるAIの発展に伴い、商品の検品検査や需要予測、顧客の嗜好分析などの領域で、AIの活用が増えています。
しかし、意思決定問題など、高度なスキルが要求される分野への適用においては、利用可能な品質になるまでに繰り返しのヒアリングや熟練者の無意識行動の反映等を含め、膨大な試行錯誤が必要となっていました。また、導き出される結果と熟練者の判断レベルに乖離があり、この分野での適用が困難でした。
本技術は、NEC独自の機械学習アルゴリズムにより、熟練者が行っている高度な業務の意思決定を再現することができ、これまで以上に幅広い領域で業務効率の向上を可能にします。
本技術の特長
1.複雑な意思決定を複数の意図に分解して学習
従来の逆強化学習では熟練者の一連の行動を単一の意思決定モデルとして学習するため、状況に応じた複雑なモデルを構築することは困難でした。本技術では、NECの最先端AI技術群「NEC the WISE」(注3)の1つである異種混合学習(注4)を拡張して、行動履歴データから複数の意思決定モデルとそれらの切り替えルールを学習します。
これにより、熟練者が時と場合より柔軟に使い分ける判断基準を、非熟練者でも理解しやすいロジックで説明でき、熟練者と同等レベルの意思決定を行うことができます。例えば、営業販売に適用した場合、成約率の高い営業の行動履歴を学習し、顧客(見込み客、常連客など)ごとに異なる最適な対処を学習し、経験の浅い営業に活動指針を出すことが可能となります。
2.意思決定モデルと制約を同時に学習
本技術では、熟練者の過去の行動履歴から、意思決定モデルだけでなく制約も同時に学習します。熟練者と同等レベルの意思決定をするためには、大きなリスクを避け、効果を最大化にする施策を選択する必要があります。本技術では、熟練者が選択しない行動はリスクがあるため避ける制約、常に行っている行動は守るべき制約と見なし、熟練者が考慮し最適化しているモデルと組み合わせて同時に学習します。このように意思決定モデルと制約を同時に学習することで、熟練者が無意識に行っている安全で信頼性の高い判断と同等の意思決定が可能となります。
3. 学習環境の簡略化
一般に、逆強化学習を実行するためは、行動履歴データ、行動により最適化対象の状態がどう変化するかを模擬する状態遷移モデル、学習した結果の正誤を確認するための実験機やシミュレータが必要になりますが、現実世界を精巧に模擬できる状態遷移モデルの作成は困難です。
本技術では、熟練者・非熟練者の行動履歴データからのサンプリングにより意思決定モデルを評価できるモデルフリー方式(注5)を新たに開発しました。本方式を採用することで、コストのかかる精緻な状態遷移モデルの準備が不要となり、学習環境を大幅に簡略化することが可能になります。また、学習途中の意思決定モデル評価をシミュレータ等で実行する必要もないため、学習が既存逆強化学習の100倍の効率で実現できます。
これらの技術により、自動運転やロボット制御などの物理・人工システムだけでなく、営業活動やプラント運転などの状態遷移が不確定なシステムで人が意思決定を下す属人的な業務にまで適用先を広げることが可能となり、幅広い領域でAIによる業務効率化が可能になります。
なお、性能評価の成果の一部は、人工知能の国際会議である「KDD2019(ACM SIGKDD CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING)」(会期:8/4(日)~8(木)、会場:Anchorage convention centers, Alaska, USA)において発表します。
以上
- (注1)逆強化学習:報酬を基に最適行動を導きだす強化学習に対して、最適行動から報酬を推定するため逆強化学習と呼ばれる
- (注2)広告スケジューリング業務:広告宣伝の効果やスポンサーの好みを考慮しながら、複数のTVコマーシャルを限られた番組時間枠に最適に割当をする業務
- (注2)
「NEC the WISE」(エヌイーシーザワイズ)は、NECの最先端AI技術群の名称です。"The WISE"には「賢者たち」という意味があり、複雑化・高度化する社会課題に対し、人とAIが協調しながら高度な叡智で解決していくという想いを込めています。
- プレスリリースNEC、AI(人工知能)技術ブランド「NEC the WISE」を策定
https://jpn.nec.com/press/201607/20160719_01.html - NECのAI技術
https://jpn.nec.com/bigdata/ai/
- プレスリリースNEC、AI(人工知能)技術ブランド「NEC the WISE」を策定
- (注4)異種混合学習技術:
https://jpn.nec.com/press/201206/20120622_02.html
ビッグデータに混在するデータ同士の関連性から、多数の規則性を自動で発見し、分析するデータに応じて参照する規則を自動で切り替える技術。これにより、単一の規則性のみを発見し参照する従来の機械学習では分析が困難な、状況に応じて規則性が変化するデータでも、高精度な予測や異常検出が可能。 - (注5)環境のダイナミクス(状態遷移モデル)が既知でない場合でも、強化学習・逆強化学習が適用できる方式
本技術の詳細について
本件に関するお客様からのお問い合わせ先
NEC 研究企画本部 研究プロモーショングループ
URL:https://contact.nec.com/http-jpn.nec.com_tb_142rd_4b126d/?fid=4b126d
NECは、社会ソリューション事業を推進する
ブランドメッセージ「Orchestrating a brighter world」のもと、
今後の世界の大きな変化(メガトレンド)に対応する
様々な課題解決や社会価値創造に貢献していきます。
詳細はこちらをご覧ください。
https://jpn.nec.com/profile/vision/message.html