Japan
サイト内の現在位置
NEC、倉庫での作業内容やレイアウト変化に柔軟に対応するロボット制御AIを開発
〜「世界モデル」を適用し学習時間を大幅に短縮、ロボットの導入を促進〜2023年3月3日
日本電気株式会社
NECは、物流倉庫や工場などでの作業内容やレイアウトの頻繁な変化に柔軟に対応できるロボット制御AIを開発しました。本技術の活用により、人手に依存していた現場へのロボットの導入を促進し、生産性の向上や働き方の改革に貢献します。
作業内容の変化に柔軟に対応できるロボット制御技術について
近年、人手不足などを背景に、同じ作業を繰り返す単純な業務ではロボットなど自動化設備の導入が進んでいます。しかし、ハンドリング作業(注1)では扱う物品の形状・配置などが多様で、それらを扱う作業を網羅的に事前学習するには数ヶ月かかる可能性があり、一方で扱う物品や作業レイアウトは頻繁に変わることもあります。このため、ロボット導入は一部のハンドリング作業に限定され、多くの現場では人手に頼っています。
今回NECが開発した技術は、「世界モデル」をロボット制御に応用することで、事前学習の時間を大幅に短縮できるとともに、扱う物品や作業レイアウトなどの環境の変化に柔軟に対応することが可能です。NECは今後、物流倉庫や工場などのロボット作業で本技術の検証を進め、2024年度中の実用化を目指します。
「世界モデル」とロボット制御AIへの応用
現在、実世界理解やロボット活用の促進に向け、機械学習の分野では「世界モデル」という考え方が注目され、国内外で研究開発が盛んに行われています。世界モデルとは、ある行動の結果として実世界で何が起こるかを、現実に試すことなく予測することを可能にする技術です。例えば、物品をつかんでいる状態で手を離すと、重力で物品が床に落下します。その後、手を離したときの物品の姿勢に応じて、物品が倒れるなどしたうえで、静止します。人間は過去の経験により蓄積した常識に基づき、行動の結果として将来どうなるかを想像して適切に行動することができます。しかし同様のことをロボットで実現するためには、これら常識を網羅的にプログラムする必要があり(注2)、ロボットの自律制御における大きな課題となっています。世界モデルは、ロボットが実世界の構造や常識を理解して、将来を想像しながら行動を決定する、自律制御の実現におけるキー技術として期待されています。
今回NECが開発したロボット制御AIは、世界モデルをハンドリングに応用したもので、過去に試したことのない作業条件でも失敗の少ない最適な動作を自律生成し、実行することができる世界初の技術です(注3)。これにより、学習したものと異なるサイズ・形状で、不規則に置かれた物品に対しても、的確につかんで所定の位置と向きに正しく置くことができるようになります。


本技術の特長
- ①実行時の作業条件に応じて成功率の高い動作を生成
乱雑に置かれたさまざまな種類の物品を箱に整列して詰めるハンドリング作業をロボットで行うためには、物品の種類や置き方、箱の中の状態などの作業条件に応じて、ロボットが落とさないように物品をつかみ、指定された場所に置く、などの動き(タスク)を生成する必要があります。このようなタスクに対して、従来行われてきたロボット制御則を学習する機械学習手法では、学習した作業条件パターンに依存して動作候補が生成されるため、実際の作業条件によっては不適切な動作候補が生成・実行されることがあります。このため、物理特性を考慮したシミュレーションでの検証では作業成功率が約70%(注4)にとどまっていました。
今回NECが開発した技術では、ロボット制御則の学習に加え、「動作予測モデル」を事前学習します。動作予測モデルは、ある作業の実行に必要なロボット動作を入力したときに、その作業の成否を予測できる世界モデルです。実際にハンドリング作業を行う際には、学習済みの制御則によって作業条件の特徴にあわせて生成された複数の動作候補について、実行に移す直前に動作予測モデルを用いて動作の成否を予測し、成功率の高い動作候補を算出・実行します。これにより、現場で起こりうる作業条件の網羅的な学習なしに、現場で活用可能なレベルの安定性(注5)である約95%の作業成功率(注4)が達成できることをシミュレーションにより確認しました。 - ②短期間での事前学習
多様な物品・作業に対応可能な動作を学習するために、従来は想定される物品の配置や作業のパターンを網羅的に学習する必要がありました。例えば、多様なサイズの直方体を箱の中に所定の位置や向きに置く作業を学習する場合には、数万パターン以上の事前学習が必要となり、その学習に数か月以上を要すると想定されます。
これに対し、NECは2つの方法で事前学習の短期化を実現しました。1つ目は「動作予測モデル」を導入することで、網羅的な学習を不要としました。2つ目は、「動作予測モデル」の学習状況に応じて、次に学習すべき物品の配置や作業などのパターンを設定する能動学習手法を導入することで、動作予測モデルおよびロボット制御則をより少ないパターン数で学習することを可能としました。具体的には、前述の直方体を箱の中に置く作業に対応可能な動作の生成のためには、数百パターン程度の学習で対応することができ、事前学習の時間を数日に短縮することができます。


NECは本技術の一部を、昨年10月23日~27日に開催された、ロボティクス分野でのトップ国際会議「IROS (IEEE/RSJ International Conference on Intelligent Robots and Systems) 2022」にて発表いたしました。
以上
- (注1)物品をある箱からほかの箱に入れ替え整列させる、棚から出し入れするなどの作業。
- (注2)具体的には、事前に同じ状態から同じ行動をした試行データを用いて、動作パターンを最適化する必要がある。このため、さまざまな状況に臨機応変に対処するには、あらゆるパターンの状況や行動のデータを網羅的に取得しておく必要が生じる。
- (注3)NEC調べ
- (注4)二指ハンドを取り付けた垂直多関節ロボットを用いて、1辺5~15cmのランダムなサイズの直方体を、多様なサイズの箱の中に所定の位置や向きに置く作業を対象に、物理シミュレーション上で評価を実施。
- (注5)周辺技術(失敗時にロボット動作を再計算する、遠隔操作に切り替えるなど)と組み合わせ、従来の定型作業におけるロボット運用と同等の可用性(現場での異常系対応頻度がロボット1台あたり1日1回未満)を実現するためには、ハンドリング技術単体で95%の作業成功率が必要と試算。
ロボット制御AIについて
本件に関するお客様からのお問い合わせ先
NEC グローバルイノベーション戦略部門

NECは、安全・安心・公平・効率という社会価値を創造し、
誰もが人間性を十分に発揮できる持続可能な社会の実現を目指します。
https://jpn.nec.com/brand/