ページの先頭です。
サイト内の現在位置を表示しています。
  1. ホーム
  2. ソフトウェア
  3. CLUSTERPRO
  4. ブログ
  5. 2017/10/16 記事
ここから本文です。

CLUSTERPRO オフィシャルブログ ~クラブロ~

HAクラスター入門 ~用語解説3~

はじめに

第3回目は、HAクラスターの基本的な機能について学びます。ここから聞きなれない言葉が増えますが、今回の内容がHAクラスターの仕組みを押えるときのキモになります。頑張っていきましょう。

グループリソース

HAクラスター内のある一つの業務に含まれる個々の資源を表します。

主要なグループリソースには下記のものがあります。

  • アプリケーション、サービス
  • 共有データを格納するディスク (共有ディスク、ミラーディスク など)
  • 現用系サーバーの宛先情報 (フローティングIPアドレス、仮想ホスト名 など)

フェールオーバーグループ

フェールオーバーグループは、HAクラスター内のある一つの独立した業務を実行するために必要な資源の集まりのことで、フェールオーバーを行う単位になります。

業務を実行するために必要な資源をまとめることによって、HAクラスターの設定や運用が容易になります。業務の起動・停止、フェールオーバーなどを一連の操作として扱えるようになります。

HAクラスターは、フェールオーバーグループおよびグループリソースが現用系サーバーで起動している状態を維持するために必要な制御を行います。これによって、クライアントから見たときに、宛先やデータが変わることなく業務にアクセスすることができます。

フェイルオーバーグループ

モニタリソース

モニタリソースは、HAクラスターの保護対象となる業務が健全に実行できているかを監視します。監視対象の異常を検出した場合には、業務を継続するために必要な回復動作を行います(グループリソースの再起動やフェールオーバーなど) 。

モニタリソースの監視対象には、グループリソース(アプリケーションやフローティングIPアドレスなど)に加えて、業務の実行や業務へのアクセスに必要となる資源(ネットワークやOSなど)を指定することができます。

モニタリソースによっては、待機系サーバーでも監視を行っており、待機系サーバーの異常を検出し通報します。これによって、待機系サーバーで業務が起動・実行できる状態であるかを監視できます。

モニタリソース(Linux)

ハートビート

HAクラスターの基本的な機能の一つに、クラスター内の他のサーバーの死活監視があります。HAクラスターにおいて相手サーバーの死活監視を行う仕組みのことをハートビートと呼びます。

サーバーの電源断などによってハートビートが遮断された場合には、フェールオーバーなどの回復動作を行います。

ハートビートの経路には、ネットワークのほかに共有ディスクやシリアルポート(COMポート)などを利用することができます。ネットワーク以外の経路を組合わせて複数のハートビートを構成することによって、個々の資源の障害の影響を受けにくくなり、より障害に強いHAクラスターにすることができます。

ハートビート

ネットワークパーティション

ネットワークパーティションは、クラスターサーバー間の全ての通信路に障害が発生し、クラスターサーバーがネットワーク的に分断されてしまう状態のことです。ネットワークパーティションのことを「スプリットブレイン」と呼ぶ場合もあります。

ネットワークパーティションに対応できていないHAクラスターでは、通信路の障害とサーバーの障害を区別できず、共有ディスクなどの同一資源に複数のサーバーからアクセスしてデータ破壊を引き起こす場合があります。

ネットワークパーティション

ネットワークパーティション解決

ネットワークパーティションの対策としては、「ハートビート」の欄で述べた複数種類のハートビートの使用によってネットワークパーティションが発生しにくい環境にすることが大切です。それでもネットワークパーティションが発生した場合の対策としてネットワークパーティション解決を行います。

ネットワークパーティション解決では、相手サーバーとのハートビートの遮断を検出すると、相手サーバーのダウンか、ネットワークパーティションか、を判別する処理を行います。その際に、あらかじめ指定した対象(ネットワーク装置、共有ディスク、サーバー)に各サーバーからアクセスを試みて、その結果からネットワークパーティションであるかを判別します。

例えば、PING方式によるネットワークパーティション解決では、ネットワークパーティションであるかを判別するとき、各サーバーがクライアントからのアクセス経路にあるネットワーク装置と疎通確認を行います。

疎通可能なサーバーは、自分が業務継続するべきサーバー=現用系と判断してフェールオーバーを行います。一方で疎通不可なサーバーは、自分がネットワーク的に分断されたと判断してシャットダウンします。これによって共有データの破壊を防止します。

ネットワークパーティション解決

まとめ

今回はHAクラスターの基本的な機能を学びました。次回はCLUSTERPRO固有の用語について解説します。
次回もお楽しみに!

お問い合わせ

当ブログに関するお問い合わせは、CLUSTERPRO プリセールスお問い合わせ窓口(info@clusterpro.jp.nec.com)までお問い合わせください。

CLUSTERPRO

ページの先頭へ戻る