サイト内の現在位置を表示しています。

ビッグデータ分析とクラウド

Vol.67 No.2 2015年3月 ICTシステムを担うこれからのクラウド基盤特集~異常を見抜くインバリアント分析技術~

インバリアント分析技術は、さまざまなシステムから平常時に変化しない関係(インバリアント)を自動的に学習してモデル化し、そのモデルと一致しない「いつもと違う」挙動を検知するものです。クラウド基盤などの情報通信(ICT)システムの安定稼働に加えて、プラントの故障予兆検知や橋梁などの構造物ヘルスチェックなどで保全コストを最適化しつつ、社会インフラを支えるさまざまなシステムの安全・安心に貢献することができます。本稿では、ビッグデータ分析技術であるインバリアント分析技術の特長と、クラウド環境での分析の実現例について説明します。

1. はじめに

近年、クラウド・コンピューティングやユビキタス・コンピューティング、Internet of Things(IoT)といった概念の浸透に伴い、さまざまな機器からデータが収集され、データウェアハウス(DWH)などの共有データベースに蓄積、分析される環境が増えつつあります。このようにして集められた大量かつ詳細な情報は、機械学習によりそれらの特長を自ら学習するビッグデータ分析技術と、効果的な分析プラットフォームとしてのクラウド環境により、複雑な現代社会でも幅広く活用されることが期待されています1)。先行するアメリカの人工知能への投資や、ドイツの「インダストリー4.0」と呼ばれる産官学共同のアクションプランを参考に、日本でも今後このような情報の利活用が進むことになるでしょう。

インバリアント分析技術は、このようなビッグデータ分析技術の1つであり、さまざまなシステムの挙動を自動的に学習し、その挙動変化をリアルタイムに監視することで、社会インフラの安定稼働と運用コスト削減に貢献することができます。本稿では、クラウド環境を利用したインバリアント分析の構成と応用例について説明します。

2. インバリアント分析技術

2.1 手法と特長

インバリアント分析技術は、システムの性能情報やプラントのセンサ情報として得られる数値の時系列から、それらの関係性を網羅的に抽出する機械学習技術です2)。学習したセンサ情報間の関係性を対象システムの稼働モデルとし、その関係性が変化した時刻と場所をリアルタイムに監視することで、異常兆候を早期に発見することができます(図1)。システム運用業務に適用した場合、従来の閾値監視やベースライン監視では見つけづらかったサイレント障害(エラーメッセージで確認できない性能異常など)を検知できるため、障害影響が顕在化する前の早期対処により、サービス障害によるビジネス損失を防止し、運用コストを低減できます。

図1 インバリアント分析技術

また、基本的に数値の時系列であれば分析の対象とできるため、例えば、サービス提供に関係するサーバ、ネットワーク、データベース、アプリケーションソフトウェアなどの性能情報をまとめて分析(クロスドメイン分析)し、管理体制に応じた障害の一次切り分けを迅速に行うことができます。更に、データセンター設備の温度や電力などのさまざまな装置の状態や、売上や在庫量などの情報との関係性を発見することで、より広範囲なビジネス全体の見える化やシミュレーションへの応用も可能です。

2.2 分析対象システム

(1) クラウド環境自体の分析

インバリアント分析技術を用いた第一弾製品として、ICTシステムの性能分析を実現しています3)。ICTシステムでは、既存の統合運用管理ソフトウェア群による監視制御が可能なため、これらのインタフェースと連携することで、システムの性能収集から稼働モデル作成、異常通報や対処といった処理を自動化することができます(図2)。近年では、業務システムをクラウドに搭載する場合も多く、遠隔監視や分散データセンター運用への取り組みも進んでいるため、極めて高速なデータ処理を行う場合を除き、監視制御の遅延が実用上問題となることは少なくなりつつあります。

図2 サイレント障害監視

例えば、サービス事業者には構築したVM(Virtual Machine)やアプリケーションのサービス健全性が、クラウド事業者には基盤となるサーバやネットワークの性能ボトルネックなどが「見える化」されます。また、サービス提供中の異常検知だけでなく、保守作業前後の挙動変化なども確認することができるため、これまで手順書記述や管理者の経験に依存していた正常性判断を、観測データから客観的に補足することも可能です。

(2) 外部システムの分析

ICTシステム以外のインバリアント分析技術の適用では、プラント故障予兆監視ソリューションを提供しています(図3)。電力、化学、鉄鋼などのプラントでは、プラント制御システムによる監視制御が行われており、このインタフェースを用いてセンサ情報を収集することができます。モデルの作成や分析では、適用領域ごとの操業ポリシやドメイン知識の違いに対応するため、分析機能や画面をカスタマイズ可能な汎用ソフトウェア部品を用意し、領域ごとのソリューション提供を可能にしています。

図3 プラント故障予兆監視

例えば、プラントの運用者向けには予兆アラートの確認を中心とした画面(図4)を、運用設計の分析エキスパート向けには稼働モデルや過去データ分析で詳細なパラメータ調整ができる画面(図5)を提供できます。既存の操業システムと併用し、従来見つけづらかった故障前の挙動を早期検知することで、保全コストの最適化や操業停止による損失の低減ができます。

図4 故障予兆アラートの画面例
図5 モデル詳細の画面例

3. クラウド環境でのインバリアント分析

3.1 オンプレミス分析とクラウド分析の比較

インバリアント分析技術は、数値データの関係性を自動的かつ高速に分析するものです。対象システムのある場所で分析(オンプレミス分析)する場合は、詳細なデータを取得して分析でき、結果に応じたアクションを即時に実行することができます。一方、遠隔のデータセンターに集約されたデータを分析(クラウド分析)する場合は、収集や結果提示のレスポンス遅延があるものの、より広範囲のさまざまなデータを分析対象とすることができます。

プラント故障予兆監視の例で説明すると、プラントを構成する多数の機器の小さな異常兆候を検出するためには、詳細なデータを高頻度で収集する必要があります。故障による損害が大きくなる前に対処を行うためには、検出した異常個所を速やかに現場オペレーターに提示する必要があります。このためには、データを管理する監視制御システムや通報を行うインシデント管理システムなどと密連携できるオンプレミス分析が適しています。

クラウド分析では、分析対象システムから離れたクラウド環境とのデータ送受信が必要となるため、このような大量データのリアルタイム分析での性能は若干低下します。その代わり、より広範囲のデータや、より高度な専門家による深い分析が可能になります。例えば、複数のプラントのデータを収集することや、プラント以外の環境情報やビジネス情報との関係性の分析を行うことで、プラントごとの操業状態の違いを詳細に比較すること、中長期の改善計画を検討することができます。また、各プラントに分析エキスパートが配置できない場合でも、クラウド側に分析エキスパートを配置し、各プラントの監視設定などを検討する、必要に応じて現地の代わりに遠隔監視するなども可能になります。

3.2 適用領域ごとの特長

前述したように、オンプレミス分析とクラウド分析は、その分析の目的や分析エキスパートなどの体制によって一長一短があり、適用領域ごとの要件や実現レベルに応じて使い分けや併用が必要になります。以下、現在実証実験を進めている、いくつかの領域を例に説明します。

(1) 電力プラントの故障予兆監視

現在は、比較的安定した状態での小さな異常予兆を検出する要望が多く、既設のプラント制御システムから詳細なデータを即時収集できるオンプレミス分析が主となります。今後、LNG/石炭の代替など関連する複数プラント全体での発電コストや保全コストを削減するためには、各プラント情報を集約した企業内クラウドなどでの統合分析も必要になります。特に、発送電分離の海外プラントでは、プラントごとの操業にばらつきが大きく、外部サービスとしての客観的な分析も期待されています。

(2) 製造プラントの故障予兆監視

プロセス製造業(石油化学、鉄鋼など)のプラントでは、電力プラントと同様にオンプレミス分析への要望が主となります。この分野では、生産品の変更や外部環境変化による状態変更に応じた監視設定変更の機会も多くなりますが、操業コスト低減の要望が大きいため、各プラントに分析エキスパートを配置することは難しい状況です。対応としては、クラウド分析を併用して複数プラントのチューニングを支援するなどが考えられますが、現場のオペレーターと遠隔の分析エキスパートの間の役割分担を円滑にするなど、オンプレミス分析とクラウド分析の連携機能も充実させる必要があります。

(3) 大規模装置の故障分析

航空機などの大規模・複雑系の装置では、オンプレミス分析には装置への組み込みなどの専用設計が必要となるため、クラウド分析による燃料消費や部品交換の効率化から取り組む場合が多くなります。多数のセンサでの監視や多重の安全設計がされている場合が多く、既知の故障検知よりも未知の故障検知や稼働状態の見える化が期待されています。

今後、設計や分析の専門家によるクラウド分析で効果が明確になった機能から順に、組み込み型のオンプレミス分析で実施する流れになると考えられます。このため、クラウド分析での検証にも、従来のICT型の構成だけでなく、実際の設備をシミュレーションできる環境が必要となります。

(4) 建造物劣化診断

建造物の点検コスト削減や効果的な延命措置のために、センサによる新たな劣化診断方法が検討されています。ビル管理などでは制御室によるオンプレミス分析もありますが、橋梁などの土木建造物では現場に分析サーバを常設することは難しい状況です。そのため、基本的にクラウド分析(遠隔モニタ)となり、オンプレミス分析の場合も、常設機器ではなく、点検車両による巡回などの仕組みが検討されています。

実際にどうセンサを配置し、どうデータ収集するかは今後の課題ですが、特に、振動センサによる劣化診断などでは高頻度に大量のデータが発生するため、これらを巡回車両やクラウド環境に欠落や遅延なく収集する必要があります。技術的にはIoTなどの取り組みがあり、クラウド分析においても、これらのデータ収集基盤との連携が必要になります。

(5) 金融/ビジネス分析

さまざまな種類のデータをDWHに集約してビジネス状況の分析や不正検知などを行う用途です。ビジネスインテリジェンス(BI)として、分析エキスパート向けに種々の分析ツールが提供されており、これらと連携しやすいクラウド分析が適しています。分析エキスパートがデータから新たな知見を発見する目的で用いる場合は、既存のBI分析環境と入力データや分析結果を相互利用できる必要があります。また、ビジネス状況の可視化の場合は、既設の基幹システムとデータ連携し、分析結果をリアルタイムに概観できる新たなポータル画面を提供するなども必要です。

4. おわりに

以上説明したように、インバリアント分析は、さまざまなシステムの「いつもと違う」状態を検知し、システムの安定稼働を支援します。分析環境には、対象システムの場所に設置されるオンプレミス分析と、遠隔のDWHにデータを集約して行うクラウド分析があり、分析の目的や分析エキスパートなどの体制によって使い分けることが必要になります。今後、オンプレミス分析とクラウド分析の連携やデータ収集基盤との連携などの課題を解決するソリューションの開発を進め、社会インフラの安全・安心に貢献していきます。

参考文献

  • 1)
    経済産業省:ビッグデータ・人工知能について,日本の「稼ぐ力」 創出研究会(第7回)‐配布資料3-3,2014.10
  • 2)
    加藤清志,矢吹謙太郎:WebSAMの分析技術と応用例 ~インバリアント分析の特長と適用領域~,NEC 技報,Vol.65 No.2,2012.9
  • 3)
    加藤清志ほか:WebSAM Ver.8が実現するクラウド時代のデータセンター運用,NEC技報,Vol.63 No.2,2010.4

執筆者プロフィール

加藤 清志
ビッグデータ戦略本部
エキスパート
宮崎 寛之
ビッグデータ戦略本部
主任
相馬 知也
ビッグデータ戦略本部
マネージャー
高城 真弓
ビッグデータ戦略本部