Microsoft Windows Server2008フェールオーバークラスター

このテンプレートは、パフォーマンスカウンターとWindowsシステムイベントログから情報を取得することによって、Microsoft Windows2008フェールオーバークラスターの状態と全体的なパフォーマンスを評価します。 詳細については、次のマイクロソフトの資料を参照してください:http://technet.microsoft.com/en-us/library/cc720058%28WS.10%29.aspx。

前提条件

ターゲットサーバーへのWMIアクセス。

資格情報

ターゲットサーバー上のWindows管理者。

すべてのWindowsイベントログモニターはゼロ値を返す必要があります。 ゼロ以外の戻り値は異常を示します。 Windowsシステムログファイルを調べると、問題に関連する情報が提供されます。 これらのイベントに関する詳細な情報はここにあります:http://technet.microsoft.com/en-us/library/dd353290(WS.10).aspx。

コンポーネントモニタ

SAMアプリケーションモニタテンプレートとコンポーネントモニタの概要はこちらをクリックしてください。 SAM API Pollerテンプレートも利用可能です。

お使いの環境に応じてカウンタのしきい値を設定する必要があります。 潜在的な値の範囲を理解し、それに応じてしきい値を設定するために、ある期間カウンタを監視することをお勧めします。

サービス:Windowsタイム

このモニターは、WindowsタイムサービスのCPUとメモリの使用量を返します。 このサービスは、ネットワーク内のすべてのクライアントとサーバーで日付と時刻の同期を維持します。 このサービスを停止すると、日付と時刻の同期は使用できなくなります。 このサービスが無効になっている場合、明示的に依存しているサービスは起動に失敗します。

: クラスターサービス

このモニターは、クラスターサービスのCPUとメモリの使用量を返します。 このサービスを使用すると、個々のコンポーネントの障害に関係なく、サーバーベースのアプリケーションを高可用性に保つために、サーバー このサービスが停止した場合、クラスタリングは使用できません。 このサービスが無効になっている場合、明示的に依存しているサービスは起動に失敗します。

ネットワーク再接続:再接続回数

このモニタは、ノードが再接続した回数を返します。

インスタンスフィールドはインストール固有です。 クラスターノードのホスト名を指定する必要があります(例:node1)。 既定では、このコンポーネントモニターは無効になっており、トラブルシューティングの目的でのみ有効にする必要があります。

ネットワーク再接続:通常のメッセージキューの長さ

このモニターは、送信を待っているキュー内にある通常のメッセージの数を返します。 通常、この数値は0ですが、TCP接続が切断された場合、TCP接続が再確立され、それらすべてを送信できるまで上昇していることがわかります。

インスタンスフィールドはインストール固有です。 クラスターノードのホスト名を指定する必要があります(例:node1)。 既定では、このコンポーネントモニターは無効になっており、トラブルシューティングの目的でのみ有効にする必要があります。

ネットワーク再接続:緊急メッセージキューの長さ

このモニターは、送信を待っているキュー内にある緊急メッセージの数を返します。 通常、この数値は0ですが、TCP接続が切断された場合、TCP接続が再確立されるまで上昇し、すべてのメッセージの送信が許可されることがあります。

インスタンスフィールドはインストール固有です。 クラスターノードのホスト名を指定する必要があります(例:node1)。 既定では、このコンポーネントモニターは無効になっており、トラブルシューティングの目的でのみ有効にする必要があります。

未処理のメッセージ

このモニターは、クラスター MRR未処理のメッセージの数を返します。 戻り値はゼロに近い値にする必要があります。

Resource Control Manager:Groups Online

このモニターは、このノード上のオンラインクラスタリソースグループの数を返します。 戻り値は常にゼロを超える必要があります。

Resource Control Manager:RHS Processes

このモニターは、実行中のリソースホストサブシステムプロセス(rhs.exe)。 戻り値は常にゼロを超える必要があります。

Resource Control Manager:RHS Restartes

このモニターは、リソースホストサブシステムプロセス(rhs.exe)を再起動します。

デフォルトでは、このコンポーネントモニタは無効になっており、トラブルシューティングの目的でのみ有効にする必要があります。

: リソース障害

このモニターは、リソース障害の数を返します。 戻り値は可能な限り低くする必要があります。

Resources:Resource Failure Access Violation

このモニターは、アクセス違反によって発生したリソース障害の数を返します。 戻り値は可能な限り低くする必要があります。

デフォルトでは、このコンポーネントモニタは無効になっており、トラブルシューティングの目的でのみ有効にする必要があります。

Resources:Resource Failure Deadlock

このモニターは、デッドロックによって発生したリソース障害の数を返します。 デッドロックは通常、リソースが特定の操作を実行するのに時間がかかりすぎることによって発生します。 戻り値は可能な限り低くする必要があります。

デフォルトでは、このコンポーネントモニタは無効になっており、トラブルシューティングの目的でのみ有効にする必要があります。

バックアップと復元の機能の問題

このモニターは、次の場合に発生するイベントの数を返します:

    • クラスターのクォーラムがまだ達成されていないため、クラスター構成データのバックアップ操作が中止されました;
    • “復元前”または”復元後”の段階で、クラスタ構成データの復元要求が失敗しました。

イベントの種類:エラー。 イベントID:1541、1542、1543。

次の前提条件が満たされていることを確認し、バックアップまたは復元操作を再試行します:

    • クラスターはクォーラムを達成する必要があります。 つまり、クラスターが大多数、つまりクォーラムを達成したのに十分なノードが実行され、通信している必要があります(クォーラム構成に応じて、ミラーリング監視ディスクまたはミラーリング監視ファイル共有を使用することもあります)。
    • バックアップを実行するユーザーが使用するアカウントは、クラスター化された各サーバーのローカルAdministratorsグループに属し、ドメインアカウントであるか、同等の権限
    • 復元中、復元ソフトウェアは特定のノード上のクラスタ構成データベースへの排他的アクセスを取得する必要があります。 他のソフトウェアがアクセス権を持っている場合(データベースへのハンドルを開いている場合)、復元は実行できません。

クラスタネットワーク接続の問題

このモニターは、次の場合に発生するイベントの数を返します:

  • クラスターネットワークがパーティション化されており、接続されているフェールオーバークラスターノードがネットワーク経由で相互に通信できません。
  • クラスター;
  • 特殊なネットワークアダプターにIpv4を使用しようとしましたが失敗しました。

イベントの種類:警告およびエラー。 イベントID: 1127, 1129, 1130, 1360, 1555.

構成の検証ウィザードを実行し、ネットワークテストのみを選択します。 また、ネットワークデバイス(アダプタ、ケーブル、ハブ、スイッチなど)とクォーラム構成も確認します。

IPアドレスリソースのプロパティと対応するネットワークのプロパティを比較して、ネットワークとサブネット情報が一致することを確認します。 これがIpv6リソースの場合は、このリソースのクラスタネットワークに、リンクローカルまたはトンネルではないIpv6プレフィックスが少なくとも1つ

クラスターサービスの起動時の問題

このモニターは、次の場合に発生するイベントの数を返します:

  • クラスターサービスに予期しない致命的なエラーが発生しました。
  • 他のクラスターノードとの接続が不完全なためにクラスターサービスが停止しました。
  • フェールオーバークラスター内の不整合を防ぐためにクラスターサービスが停止しました;
  • クラスタリソースホストサブシステム(RHS)が予期せず停止しました。
  • クラスタリソースがクラッシュしたかデッドロックされました。
  • クラスタサービスが予期しない問題に遭遇し、シャットダウンされます。
  • クラスタサービスがこのノードで起動できなくなりました。 (このノードには、クラスター構成データの最新のコピーがありません。)
  • メンバーシップエンジンは、クォーラムデバイスの調停プロセスが停止していることを検出しました。

イベントの種類:エラー。 イベントID: 1000, 1006, 1073, 1146, 1230, 1556, 1561, 1178.

ノード上でクラスタサービスが起動されないようにするには、さまざまなソフトウェアまたはハードウェア関連の原因があります。 これらの原因のいずれかによって中断された後、クラスターサービスが正常に再起動することがあります。 イベントログを確認して、問題の兆候を確認します。

ネットワークハードウェアと設定を確認します。 構成の検証ウィザードを使用して、ネットワーク構成を確認します。

どのリソースDLLが問題の原因となっているかを確認し、リソースベンダーに問題を報告します。 リソースが独自のリソースモニタで実行されるように構成することを検討してください。 リソースDLLの問題は、クラスタサービスの実行を停止することはありませんが、リソースが独自のリソースモニターで実行されない限り、他のリソースDllの実行を

クラスター内の他のすべてのノードでクラスターサービスを開始してみてください。 クラスター構成データの最新のコピーを持つノードでクラスターサービスを開始できる場合、以前に開始できなかったノードは、おそらく最新のコピーを取得して、クラスターに正常に参加できるようになります。

クラスター共有ボリューム機能の問題

このモニターは、次の場合に発生するイベントの数を返します:

  • クラスター共有ボリュームがこのノードで使用できなくなりました。
  • クラスター共有ボリュームがこのクラスターノードから直接アクセスできなくなりました。
  • クラスターサービスがクラスター共有ボリュームのルートディレクトリの作成に失敗しました。
  • クラスターサービスがクラスター共有ボリュームのルートディレクトリに対するアクセス許可(ACL)の設定に失敗しました。;
  • クラスター共有ボリュームは、このクラスターノードからアクセスできなくなりました。
  • クラスターサービスは、クラスター共有ボリュームのクラスター idトー

イベントの種類:エラー。 イベントID: 5120, 5121, 5123, 5134, 5135, 5142, 5200.

ボリュームとの通信に関連するイベントを確認します。

ストレージとネットワークの設定を確認します。

クラスター共有ボリュームフォルダの作成と権限を確認します。

ドメインコントローラとノード間の通信を確認します。

クラスター記憶域機能の問題

このモニターは、次の場合に発生するイベントの数を返します:

  • ディスクリソースがオンラインになっている間、一つ以上のボリュームへのアクセスがエラーで失敗しました。
  • リソースのディスク上の一つ以上のパーテ;
  • クラスターディスクリソースに無効なマウントポイントが含まれています。

イベントの種類:エラー。 イベントID: 1034, 1035, 1037, 1066, 1208.

影響を受けるディスクが利用可能であることを確認します。

基盤となるストレージハードウェアを確認し、デバイスがクラスタノードに正しく表示されていることを確認します。

ディスク上のパーティションに問題がある場合や破損がある場合は、ファイルシステムの問題を修正できるようにChkdskを実行することをお勧めします。

マウントされたディスクが次のガイドラインに従って構成されていることを確認します。

クラスター化されたディスクは、クラスター化されたデ また、クラスター内の使用可能なストレージの一般プールに含めることはできません。

クラスター監視の問題

このモニターは、次の場合に発生するイベントの数を返します:

  • クラスタサービスは、リソースのアクセス不能のために監視リソース上のクラスタ構成データを更新できませんでした。
  • クラスタサービスは監視リソースに問題を検出しました。
  • ファイル共有監視リソースが定期的なヘルスチェックに失敗しました。
  • ファイル共有監視リソースがオンラインになりませんでした。
  • ファイル共有監視リソースが特定のファイル共有のアービトレートに失敗しました。
  • ファイル共有監視リソースが特定のファイル共有のアービトレートに失敗しました。
  • ファイル共有監視リソースが特定のファイル共有のアービトレートに失敗しました。
  • ミラーリング監視にアクセスできなかったため、ノードがクラスターを形成できませんでした。

イベントの種類:エラー。 イベントID: 1557, 1558, 1562, 1563, 1564, 1573.

フェールオーバークラスターのクォーラム構成とミラーリング監視ディスクの状態を表示して、ミラーリング監視のアクセシビリティを確認します。

構成の可用性の問題

このモニターは、次の場合に発生するイベントの数を返します:

  • クラスター構成データベースをロードまたはアンロードできませんでした。
  • 構成データの読み取りに失敗したため、クラスターサービスを開始できません。

イベントの種類:エラー。 イベントID: 1057, 1090, 1574, 1575, 1593.

ノードのクラスタ構成が欠落しているか破損している場合、クラスタサービスは構成をロードできないため、開始できません。 可能であれば、クラスターサービスは、クラスター内の他のノードから最新のクラスター構成を取得します。 他のノードが起動されていることを確認します。 起動可能なノードのみにクラスタ構成データベースが存在しないか破損しているように見える場合は、システム状態のバックアップからノードの1つを復元する必要がある可能性があります。 (フェールオーバークラスターノードの場合、システム状態のバックアップにはクラスター構成が含まれます。)ノードがクラスタ構成データベースをアンロードしようとすると、アクションが完全に完了しないことがあります。 クラスターサービスを停止して再起動してみてください。 これが成功しない場合は、影響を受けるノードでオペレーティングシステムを再起動します。

DFS名前空間リソースの可用性の問題

このモニターは、次の場合に発生するイベントの数を返します:

  • dfs名前空間ルートの作成がエラーで失敗しました。
  • dfsルートターゲットの再同期がエラーで失敗しました;
  • dfs名前空間のクラスターファイル共有リソースは、エラーのためオンラインにできません。

イベントの種類:エラー。 イベントID:1138、1141、1142。
DFS名前空間の設定を確認します。

クラスターリソースの暗号化された設定が適用できませんでした

このモニターは、クラスターリソースの暗号化された設定がこのノードのコンテナに正常に適用できなかった場合のイベント数を返します。

イベントの種類:エラー。 イベントID:1121。

イベントによって示されたレジストリチェックポイントへのオープンハンドルを持つ可能性のあるアプリケーションを閉じます。 これにより、リソースプロパティで構成されたレジストリキーをレプリケートできます。 必要に応じて、この問題についてアプリケーションベンダーに連絡してください。 レジストリへのハンドルを表示するには、-aオプションを指定してHandleというユーティリティーを使用できます。

Failed to Form Cluster

このモニターは、Failed to Form clusterイベントの数を返します。

イベントの種類:エラー。 イベントID:1092、1009。

クラスターサービスを再起動すると、この問題を修正できる場合があります。

ファイル共有リソースの可用性の問題

このモニターは、次の場合に発生するイベントの数を返します:

  • 特定の共有の情報を取得するとエラーコードが返されました。
  • 特定の共有の情報を取得すると、共有が存在しないことが示されました。
  • エラーのた;
  • クラスターファイル共有リソースが共有フォルダーの競合を検出しました。
  • クラスターファイルサーバーリソースは、共有フォルダーの一部にアクセスできな

イベントの種類:警告およびエラー。 イベントID: 1053, 1054, 1055, 1068, 1560, 1585, 1586, 1587, 1588.

共有が存在し、アクセス許可が共有へのアクセスを許可していることを確認します。

可能であれば、共有へのパスが変更されているかどうかを確認します。 その場合は、正しい名前で共有を再作成します。

クラスター化されたファイルサーバーインスタンス内のすべてのリソースを表示して、それらがオンラインになっていることを確認し、リソース間の依存 問題を修正するために必要に応じて再設定します。

同じ共有名を持つ共有フォルダが2つないことを確認します。

共有フォルダのアクセシビリティとサーバーサービスの状態を確認します。

汎用アプリケーションをオンラインにできませんでした

このモニターは、次の理由でプロセスを作成しようとしたときに汎用アプリケーションをオ; アプリケーションがこのノードに存在しない、正しくないパス名、または正しくないバイナリ名。

イベントの種類:エラー。 イベントID:1039。

クラスター化された汎用アプリケーションインスタンスで使用されるアプリケーションに次のことが当てはまることを確認します:

  • アプリケーションは、汎用アプリケーションリソースの所有者である可能性のあるすべてのノードに完全にインストールされます。
  • 汎用アプリケーションリソースの;
  • 汎用アプリケーションリソースの構成では、レジストリレプリケーションの適切なパラメーターと設定が指定されます。

一般的なサービスリソースの可用性の問題

このモニターは、次の場合に発生するイベントの数を返します:

  • 汎用サービスがインストールされていないか、指定されたサービス名が無効です。
  • 指定された汎用サービスパラメータが無効である可能性があります。
  • 汎用サービスがエラーで失敗しました。

イベントの種類:エラー。 イベントID:1040、1041、1042。

汎用サービスリソースの構成で正しいサービスが指定されていることを確認し、リソースの所有者である可能性のあるすべてのノードにサービスが完全にイ

サービス動作を確認し、アプリケーションイベントログを調べます。

IPアドレスリソースの可用性の問題

このモニターは、次の場合に発生するイベントの数を返します:

  • サブネットマスクの値が無効であるため、クラスター IPアドレスリソースをオンラインにすることはできません;
  • アドレス値が無効であるため、クラスタIPアドレスリソースをオンラインにできません。
  • クラスタネットワークインターフェイスに対応するネットワー;
  • クラスタIPアドレスリソースに関連付けられたIPアドレスのリースが期限切れになったか、期限切れになりつつあり、現在更新できません。
  • Ipv6トンネルアドレスリソースは、IPアドレス(Ipv4)リソースに依存しないため、オンラインになりませんでした。
  • 依存IPアドレス(Ipv4)リソースに関連付けられたクラスタネットワークは、ISATAPトンネリングをサポートしていません。

イベントの種類:エラー。 イベントID: 1046, 1047, 1048, 1049, 1078, 1242, 1361, 1363.

IPアドレスリソースのアドレス、サブネット、およびネットワークプロパティを確認します。

リソースがIpv6トンネルアドレスリソースの場合は、少なくとも一つのIPアドレス(Ipv4)リソースに依存していることを確認してください。 また、ネットワークがIntra-Site Automatic Tunnel Addressing Protocol(ISATAP)トンネリングをサポートしていることを確認します。

IPアドレスリソースが正しく構成されているように見える場合は、クラスタで使用されているネットワークアダプタやその他のネットワークコンポーネ

ネットワーク接続と構成の問題

このモニターは、次の場合に発生するイベントの数を返します:

  • クラスターサービスがネットワークアダプターにアクセスできなかったか、クラスターノードにネットワーク接続がありません。
  • クラスターノードにネットワーク接続がありません。
  • クラスターノードにすべてのネットワーク接続が失われました。
  • フェールオーバークラスター仮想アダプターがミニポートアダプターの初期化に失敗しました。

イベントの種類:エラー。 イベントID:1289、1553、1554、4871。

物理ネットワークアダプターとクラスター仮想アダプターの問題を修正します。 構成の以前の変更がクラスター仮想アダプターの機能に干渉している場合は、ノード上のフェールオーバークラスタリング機能を再インストールする必要があ また、構成の検証ウィザードを使用して、ネットワーク構成を確認します。

Node Failed to Join Cluster

このモニターは、ノードがエラーのためにフェールオーバークラスターに参加できなかったときに発生するイベントの数を返します。

イベントの種類:エラー。 イベントID:1070。

クラスターサービスを再起動すると、この問題を修正できる場合があります。

クラスターサービスの問題

このモニターは、次の場合に発生するイベントの数を返します:

  • クラスター化されたサービスまたはアプリケーションのクラスターリソースが失敗しました。
  • クラスター化されたサービスまたはアプリケーションを完全にオンラ

イベントの種類:警告およびエラー。 イベントID:1039、1205。

リソースに関連付けられているアプリケーションまたはサービスの問題を確認して修正します。

ケーブルやクラスタ関連機器の問題を確認して修正します。

クラスタ構成内のリソースのプロパティ、特にリソースの保留中のタイムアウトの値を調整します。 この値は、関連するアプリケーションまたはサービスを開始するのに十分な時間を許可する必要があります。
クラスター化されたサービスまたはアプリケーション内のすべてのリソースの状態を確認します。

Quorum was Lost

このモニターは、quorumが失われたためにクラスタサービスがシャットダウンしているときに発生するイベントの数を返します。

イベントの種類:エラー。 イベントID: 1177.

これは、クラスター内の一部またはすべてのノード間でネットワーク接続が失われた場合、または監視ディスクがフェールオーバーした場合に発生します。 また、現在オンラインになっているノードの数が少なすぎて、新しい構成でクォーラムを達成できない場合に、ノードの数を増やすなど、クラスター構成を変更した場合にも発生する可能性があります。 構成の検証ウィザードを実行し、ネットワークテストのみを選択します。 また、ネットワークデバイス(アダプタ、ケーブル、ハブ、スイッチなど)も確認してください。)およびクォーラム構成。

レジストリチェックポイントをレジストリキーに復元できませんでした

このモニターは、クラスターリソースのレジストリチェックポイントをレジストリキーに復元できなかったときに発生するイベントの数を返します。

イベントの種類:エラー。 イベントID:1024。

イベントによって示されたレジストリチェックポイントへのオープンハンドルを持つ可能性のあるアプリケーションを閉じます。 これにより、リソースプロパティで構成されたレジストリキーをレプリケートできます。 必要に応じて、この問題についてアプリケーションベンダーに連絡してください。 レジストリへのハンドルを表示するには、-aオプションを指定してHandleというユーティリティーを使用できます。

システムが応答しない

このモニターは、フェールオーバークラスター仮想アダプターがプロセスとの接触を失ったときに発生するイベントの数を返します。

イベントの種類:エラー。 イベントID:4869、4870。

Write a Comment

メールアドレスが公開されることはありません。