CLUSTERPRO X HA/ProcessSaver - 特長/機能
特長
1. プロセスの状態を監視し再開
- アプリケーションプログラムやOS標準デーモンのプロセス状態を監視し、予期せぬ障害で異常終了あるいはハングアップした場合にプロセスの自動再開を行います。
2. 柔軟な監視が可能
- 特定の関係を持つプロセス群をグループとして定義することで、グループ単位でプロセスの監視・再開を行うことができます。
- 親子関係を持つプロセスや依存関係を持つプロセスを監視する場合に有効です。
- 同一名のプロセスが複数動作しているシステムでのプロセス監視を実現します。
3. シングルサーバでもクラスタシステムでも可用性を向上
- プロセスの死活監視と自動再開により、高価なクラスタ環境を構築しなくてもシングルサーバ上で可用性の向上が図れます。
- クラスタ環境ではクラスタウェアと連携してフェイルオーバさせることでプロセス再起動では解決できない障害にも対応可能です。
4. ハングアップ状態の監視機能を提供
- ハングアップ監視を行うフレームワークを提供しており、独自に作成した業務プロセスなどのハングアップ監視を行うことが可能です。
- プロセスの死活監視では検出できないハングアップ状態を検出することで、より可用性を向上させることができます。
機能
HA/ProcessSaver
プロセスの状態監視と再開機能
アプリケーションプログラムやOS標準デーモン等のプロセスの動作状態を監視し、予期せぬ障害で異常終了した場合にプロセスの自動再開を行うフレームワークを提供します。
- プロセス監視を実行する プロセス(pcheck)によって一定間隔で、プロセスの動作状態を調べます。
- 対象プロセスの消滅またはゾンビ状態やハングアップ状態を検知します。
- 消滅を検知すると、指定された再起動スクリプトを実行します。
- 再起動スクリプトにより、指定された対象プロセスを起動します。
- 再起動スクリプトの実行が完了すると、1. の監視状態に戻ります。
監視ルールのカスタマイズ機能
プロセス監視の手順や異常検知時のアクションなど組み込み可能なフレームワークを提供します。これによりシステムのニーズにあったプロセスの監視や運用手順を構築できます。
障害解析機能
障害の発生時にダンプイメージとしてトレースを取得します。トレースにより、これまで人手・時間が掛かっていた障害の解析時間を短縮することが可能です。
コアダンプ検知機能
監視対象プロセスがコアダンプした場合に、コアファイルを保存し障害内容の一次解析レポートを作成します。
グループ監視機能
特定の関係をもつプロセス群をグループとして定義すると、グループ単位でプロセスの監視、再開を行います。親子関係をもつプロセスや依存関係を持つプロセスを監視する場合に有効です。
クラスタウェア連携機能
クラスタウェアのパッケージとして定義されるプロセス(サービス)の起動、監視、再起動、フェイルオーバをコントロールすることにより、クラスタシステムでのプロセス監視を実現します。障害の発生したプロセスを一定回数リスタートすることで、無用なパッケージ切り替えやノード切り替えを防止します。
運用管理コマンドを提供
プロセス毎の状態監視および動的な停止・再開を実現できます。これによりアプリケーションの動的な設定変更が可能です。
同一名プロセスの監視機能
同一の名称をもつプロセス群を、プロセス単位に監視する機能を提供します。監視対象のプロセスを、プロセスの起動数や引数、さらにuidによって識別することが可能となります。
設定ファイルの自動生成、チェック機能
putilコマンドを使用することで、これまで手動で作成していた、設定ファイルを自動で生成することが可能です。また作成したSGファイルの正当性をチェックすることもできます。
HA/ProcessSaver WebEdition
Webサーバプロセスの消滅監視機能と自動再開機能
Webサーバプロセスの消滅監視を行い、異常終了した場合にはプロセスの自動再開を行うフレームワークを提供します。
Webサーバプロセスのハングアップ監視機能と自動再開機能
Webサーバプロセスに定期的にアクセスすることでハングアップ状態を監視します。無限ループや高負荷状態により動作不能となると、プロセスを再開します。
- *Solaris版は、httpsプロトコルを利用するWebサーバのハングアップ監視は行えません。
Webサーバの自動リブート機能
Webサーバプロセスの状態監視をおこない、致命的な障害により自動再開不能になった場合、コンピュータをリブートすることでシステムの復旧を行います。
- *本機能はApacheおよびZeusでご利用いただけます。
ソケット監視機能
監視対象プロセスがsocket通信(TCPポート)を有する場合、通信資源の枯渇、異常を監視します。
- *本機能はWebサーバだけでなく、一般的なプロセスでもご利用いただけます。
クラスタウェア連携機能
Webサーバプロセスの状態監視を行い、致命的な障害により自動再開不能になった場合、クラスタウェアと連携してフェイルオーバさせることで、プロセス再起動では解決できない障害にも対応します。
HA/ProcessSaver ApsEdition
APサーバプロセスの状態監視と再開機能
APサーバプロセスの動作状態を監視し、異常終了した場合にプロセスの自動再開を行うフレームワークを提供します。
設定ファイル自動生成機能
自動生成ツールを利用することで、従来導入が困難であったAPサーバの監視設定を自動的に行うことが出来ます。これにより大幅に導入コストを削減できます。また、設定ミスの可能性を抑えることができます。
HA/ProcessSaver FailSafe Option
プロセス監視ステータスの引継ぎ機能
同一ノードまたはクラスタを構成するノード間でプロセス監視のステータスを引き継ぐ機能を用意し、さらにオンライン保守機能の強化を図りました。
- クラスタ構成の場合
これまで監視対象のプロセスが起動できない状態で想定外のパッケージ切り替えが発生した場合、待機ノードでのパッケージ起動に失敗しクラスタ停止に繋がる場合がありました。
本機能によりProcessSaverのプロセス監視ステータスを現用ノードから待機ノードに引き継ぐことができるため、無用なパッケージ/クラスタ停止を防止することができます。 - シングル構成の場合
OSリブート後にプロセス監視ステータスを引き継ぐことができます。
プロセス障害によって起動できないプロセスが存在した場合であっても、プロセス監視を停止した状態でProcessSaverを起動することができます。これにより、不要なプロセス再起動やリブートを防止することができます。
- *上記はクラスタ構成の場合の図です。シングル構成の場合にはOSリブート時に監視ステータスを引き継いだ状態でProcessSaverを起動します。
オンライン保守機能の強化
従来、ProcessSaverのリビジョンアップやアンインストールを行う場合、パッケージを停止する必要がありました。本機能によりこれらの処理をパッケージを起動したまま行うことができるようになり、クラスタ停止時の手順誤りなどによる無用なパッケージ停止を防止することができます。
プロセス個別監視停止・開始機能
ProcessSaverで使用するプロセス監視の設定ファイル(pfile)単位でしか行えなかったプロセス監視の停止・開始を監視対象プロセス単位に行う機能を提供します。本機能により、柔軟なプロセス監視の運用が可能となり、これまで、監視対象プロセスごとに作成する必要があったpfileを、ひとつにまとめることができますので管理が容易になります。