Japan
サイト内の現在位置を表示しています。
診断サービスの障害対策機能により業務アプリケーションの性能劣化を引き起こす場合がある問題
1. 概要
WebOTX Application Server V9.1 より提供する診断サービスの障害対策機能において、業務実行プロセスに対する負荷状況の判断結果によっては負荷軽減処置が解除されず、業務アプリケーションの性能劣化を引き起こす場合があります。
この問題の発生を回避するため、診断サービスに対する設定を変更する必要があります。
2. 詳細
診断サービスの障害対策機能は、業務アプリケーションのスローダウンを検出し、同時処理実行数の増加により業務実行プロセスの負荷が高まったと判断した場合に、負荷軽減処置として業務アプリケーションへのリクエストに対する応答を待ち合わせるように制御します。そして、スローダウンの解消や同時処理実行数の減少により業務実行プロセスの負荷が下がったと判断した場合に、負荷軽減処置を解除します。
ここで、次に示す [発生条件] をすべて満たした場合、その後業務実行プロセスの負荷が下がった後も負荷軽減処置が解除されなくなる問題を検出しました。その結果、業務アプリケーションへのリクエストに対する応答を待ち合わせる制御が効き続け、リクエストの応答が通常時と比べて所定の期間分(※1)の遅延が発生します。
発生条件
- 障害対策機能により業務アプリケーションのスローダウン(※2)を検出後、負荷軽減処置が作動する。
- 負荷軽減処置の解除後、障害対策機能により再度スローダウンが検出される。
(※1) 診断サービスの設定「障害回復待機時間」。製品既定では、同設定の値は 5 秒。
(※2) リクエストの処理時間が、診断サービスの設定「障害とみなす応答時間」を超えた場合。製品既定では、同設定の値は 40 秒。
なお、本問題に該当しているかどうかは、応答の遅延が発生している業務アプリケーションが配備されたドメインの次のログから確認することができます。
- Windows : <ドメインディレクトリ>\logs\webotx_agent.log
- Linux : <ドメインディレクトリ>/logs/webotx_agent.log
上記ログより、該当の時間帯にて、次のメッセージが出力されていることを確認します。
OTX01191402: Performance Analyzer : Start to recovery of performance. ...
上記メッセージが出力されてから所定の検証期間(※3)を経過後も、業務アプリケーションに対するリクエストの応答が(※1)で示した期間分遅延する場合、本問題に該当します。
(※3) 診断サービスの設定「障害回復検証時間」。製品既定では、同設定の値は 300 秒。
3. 影響のある製品
次の製品に影響があります。
- WebOTX Application Server Express V9.1
- WebOTX Application Server Express Embedded V9.1
4. 対処方法
該当する製品の最新パッチモジュールを適用してください。
WebOTX Application Server V9.1
WebOTX Application Server V9.11
(※)パッチモジュールは製品保守契約を結んでいただいたお客様に限定して提供させていただいています。まだ契約がお済でないお客様は、保守契約締結の後、ダウンロードをお願いいたします。
5. 回避策
何らかの理由でパッチが適用できない場合のみ、本手順で回避してください。
回避手順
- WebOTX が提供する運用管理ツールを使用して、対象のドメインにログインします。
- 診断サービスの障害対策機能に対する設定を変更します。
- 統合運用管理ツール / Web 版統合運用管理コンソール を使用する場合
「アプリケーションサーバ」ツリー配下の「診断サービス」をクリックします。
画面右に表示される「フェイルセーフ(共通)」タブ内に表示される設定項目「障害回復待機時間」の値を 0 に変更し、「更新」ボタンを押下します。- 運用管理コマンド (otxadmin) を使用する場合
次の set サブコマンドを実行します。
set server.diagnostic-service.recoveryWaitTime=0
なお、本設定は障害対策機能に対して即時反映されるため、設定変更に伴うドメインの再起動は不要です。
- リクエストの応答が遅延していた業務アプリケーションに対して再度リクエストを発行し、その応答の遅延がないことを確認します。
なお、本回避策に伴い、負荷軽減処置として業務アプリケーションへのリクエストに対する応答を待ち合わせる制御は実施されなくなります。そのため、リクエストが集中して同時処理実行数が増加した際には、業務実行プロセス全体の負荷増加に伴うリクエストの実行タイムアウトや、HTTP リクエストにおける 503 エラー(※4)として応答を返すことがあります。なお、この挙動については旧バージョンと相違ありません。
(※4) 業務実行プロセスの過負荷に伴いリクエストを処理できない場合に返却されるエラーコード。
6. 更新履歴
- 2014/05/12
- 2013/09/26