サイト内の現在位置

過去との類似性を瞬時に判断可能にする時系列データ モデルフリー分析

NECの最先端技術

2018年12月12日

NECの北米研究所によって開発されている時系列データ モデルフリー分析技術。現在、北米研究所と連携して応用研究を進めるセキュリティ研究所の研究部長に、その詳細を聞きました。

時間を超えて、大規模システムの特徴を検索

セキュリティ研究所
研究部長 朝倉 敬喜

― 時系列データ モデルフリー分析とは、どのような技術なのでしょうか?

センサ値などの時系列データにおける現在と過去の類似性を瞬時に照合可能にする技術です。現在のシステムの状況が「過去のあのときと似ている!」ということを高速かつ高精度に判断できるようになります。
たとえば、大型プラントやデータセンタ、社会インフラ施設では数千個に及ぶ大量のセンサから時系列データを収集してシステムを監視しています。このときに、「あ、このセンサ値の変化は過去のあの時と同じかな?」といったように、過去のシステム状態との類似性を瞬時に検索できるようになると、システムの状態をより正確に判断できるようになるわけです。しかしながら、直近の数十秒の時系列データと、過去から蓄積された膨大なデータの照合を単純にしようとしても、一年間の数千個のセンサ値の比較をする場合、数兆回の比較演算を実行する必要があり、必要な計算量は膨大なものになってしまいます。そこで今回活用したのが、ディープラーニングです。時系列データをディープラーニングで学習し、データの特徴だけを抽出した上で照合するので、比較演算を10万分の1程度に圧縮することが可能で、高速な検索が実現できるようになりました。また、時間が経ってデータが蓄積されればされるほど、より高精度なデータ照合ができるのも本技術の大きな特長ですね。
センサ値の時間的な変化の特徴とセンサ間の関係性の特徴を合成して、特徴をコンパクトな形態で抽出できるというのが、本技術の本質です。さらに詳しく言うと、蓄積された時系列データをディープラーニングで効率的に学習し、システムに応じた特徴抽出エンジンを生成できるようにした点が一番のポイントです。この学習方法に関しては、2018年8月にロンドンで開催されたデータマイニングに関する国際会議「24th SIGKDD Conference on Knowledge Discovery and Data Mining」にて発表しています。

図:時系列データ モデルフリー分析の概要
図:特徴抽出エンジンの構成

異常検知だけでなく、障害診断や故障予測が可能

― どんな応用先があるのでしょうか?

たとえば大型プラントであれば、異常検知へ応用することができます。方法としては、プラントに設置された数千個のセンサから得られる正常時の時系列データの特徴をデータベース化します。これによって、過去の正常状態には見られなかった特徴が現れた際には、いま異常が発生しているとリアルタイムに検知できるようになるわけです。
しかし、本技術によって可能になるのは異常検知だけではありません。過去に蓄積されていた異常データと照合できれば、いま起きている異常が過去のいつの事例と類似しているかという障害診断も可能です。関連する過去の情報を瞬時に提供できるようになります。
さらにいえば、異常が発生する前に決まって起こる特徴を自動で抽出し、これをもとに何日後に故障するといった故障予測も可能になります。
これらのシステムは、本質的には何かというと、これまで熟練のスタッフさんがやっていたことと、基本的には同じなんですよね。時系列データの動きをみながら、私たち人間が長年の経験やカンで判断していたことをディープラーニングによって高精度に実現できるのが、時系列データ モデルフリー分析技術です。

運用しながら精度が向上するので、データが少なくてもすぐに導入可能

― 従来の異常検知システムとは、どこが違うのでしょうか?

確かに、異常検知ということだけで考えれば、NECはインバリアント分析という技術も保有しています。これは、正常状態の時系列データ間の不変関係を示すモデル式を作成し、正常モデルから外れたデータが現れた際に、いつもと違う状態=異常を検知するという技術です。数式の塊を用いてシステム全体をまんべんなくカバーすることで、人間では気づきにくい異常や過去経験したことがない異常を早期に検知することができます。これらは時系列データ モデルフリー分析にはない特長であり、非常にユニークで強力な技術です。
これに対し、時系列データ モデルフリー分析は先にも述べたとおり、熟練のスタッフの方々がこれまでやってきた、長年の経験と勘に基づく異常検知を機械的に実現したものです。インバリアント分析と時系列データ モデルフリー分析を組み合わせることで、数式的なアプローチと、熟練者と同様の視点からのアプローチという二つのアプローチからシステムを監視することができるようになります。加えて、障害診断や故障予測までカバーできるようになりますから、非常に強力なシステム監視を実現できると考えています。
また、時系列データ モデルフリー分析は、その名の通り正常モデルをつくる手間がかからないので、低コストかつ短期間でスムーズに導入できるという特長も持ち合わせています。データの蓄積が少なくても運用を始められますし、時間が経過するに従い精度が上がるという仕組みになっているため、スモールスタートに適しています。一般的に、収集できるデータの90%以上は正常なものです。本システムでは正常なデータが集まれば集まるほど、正常の裏返しである異常を正確に検知できるようになります。だからこそ、導入時はまだデータが少ない場合でも、数カ月ほど経てば高精度なシステムをつくりあげることができるはずです。

朝倉 敬喜のインタビューの様子

気象予測など、プラント監視以外にも広がる可能性

― プラントの他には、どんな可能性があるでしょうか?

先にも述べたように、本技術の本質は、データの時間的動きの特徴と、センサ間の関係性の特徴から、比較可能な特徴量を生成することです。技術の応用先は大型プラントやデータセンタ、社会インフラ施設だけにとどまらず、まだまだ幅広い可能性があると考えています。
正常と異常の判別ということを強調して話をしましたが、本技術では正常状態であっても正常1、正常2、正常3……、と複数の状態を導き出すことができます。正常、異常を2元的に判断するのではなく、多様な状態を判別・分類することができる技術なので、時間を超えて過去との照合をしたいシーンなどで大きく活躍するはずです。
また、扱うことができるデータも数値データだけではありません。時系列に並んだものであれば、グラフデータやテキストデータも扱うことができるので、さらなる拡張性が期待できます。たとえば気象データの照合による気象予測なども一つですね。他にもさまざまな活用シーンがあり得るはずですので、これから積極的に、さまざまなお客様やパートナーとの共創を進めていきたいと考えています。

関連研究所