ページの先頭です。
サイト内の現在位置を表示しています。
  1. ホーム
  2. ソフトウェア
  3. WebOTX
  4. コラム/特集
  5. 開発者が語る
  6. 安心してご利用いただけるシステム基盤を目指して ―サポート力―
  7. 一括情報収集機能
ここから本文です。

WebOTX開発者が語る「安心してご利用いただけるシステム基盤を目指して ―サポート力―」(一括情報収集機能)

一括情報収集機能(障害発生時に一括でログを採取する機能)

NEC 江間

NEC 第三ITソフトウェア事業部
江間 珠恵
一括情報収集機能などJMX基盤部分の開発を担当

一括情報収集機能を作ろうとしたきっかけは何だったのでしょうか?

WebOTX では、障害が発生した際、調査のために様々な情報の採取をシステム運用者に依頼することがあります。その中には、いくつかの手順が必要なケースがあり、手順を簡易化するための機能を開発する必要があると考えました。

手順を簡易化することにより、システム運用者が作業ミスをする可能性は減り、作業負荷が軽減されることで迅速な対応が可能となります。また、お客様からどのような情報を採取したのかについて説明を求められた場合でも、正確かつ迅速に回答することができるので、お客様の立場でも安心していただけます。

一括情報収集機能による情報採取方法

図2.1 一括情報収集機能による情報採取方法

一括情報採取機能を開発するにあたって、苦労した点やこだわりを教えてください。

障害調査のためには、WebOTX の情報だけでなく、CPU使用率やサーバ全体のメモリ状況など、サーバの情報も必要です。サーバの情報はOS毎に異なるので各OSに対して採取する方法が異なりますが、一括情報収集機能ではそれらの情報も適切に採取できるように対応しました。

また、障害が発生している状況下では、WebOTXのプロセスも正常に動作できない場合があります。一括情報採取機能では、WebOTXのプロセスが異常な際にも正常動作するように、ローカルモードという機能を備えています。ローカルモードは、WebOTXとは別のプロセスを起動して一括情報収集を実行するため、WebOTXが異常な状態でも、確実に情報を収集することができます。

一括情報収集機能は例えばどのようなときに利用できるのでしょうか?

障害発生時の情報収集に利用してください。一括情報採取機能では、調査に必要なOSの情報や製品バージョン、設定情報やログファイルを一通り採取できるため、ログが消失して調査ができなくなることを防止でき、ログ採取作業の負荷も軽減できます。また、問い合わせの際に添付して頂くことで、サポート部門の調査もスムーズに実行することができます。

実際に使ってみたお客様からはどのような反応がありましたか?

一括情報収集機能が収集する情報の中には、スレッドダンプも含まれています。あるお客様で、障害調査のためにスレッドダンプを採取する必要があった際に、一括情報収集機能を利用すると簡単に採取できたとの評価を頂きました。

一括情報収集機能では、情報採取のための設定が最適にチューニングされているため、採取されたスレッドダンプから障害原因を特定することができました。

「WebOTX開発者が語る」記事一覧はこちら


ページの先頭へ戻る