장애 조치 클러스터

이 템플릿은 성능 카운터와 시스템 이벤트 로그에서 정보를 검색하여 장애 조치 클러스터의 상태와 전반적인 성능을 평가합니다. 자세한 내용은 다음 문서를 참조하십시오.

필수 구성 요소

대상 서버에 대한 액세스.

자격 증명

대상 서버의 관리자.

모든 윈도우 이벤트 로그 모니터는 0 값을 반환해야 합니다. 0 이 아닌 반환된 값은 이상을 나타냅니다. 윈도우 시스템 로그 파일을 검사하면 문제에 관한 정보를 제공해야합니다. 이러한 이벤트에 대한 자세한 정보는 여기에서 찾을 수 있습니다.

환경에 따라 카운터에 대한 임계값을 설정해야 합니다. 특정 기간 동안 카운터를 모니터링하여 잠재적 값 범위를 이해하고 그에 따라 임계값을 설정하는 것이 좋습니다.

서비스:윈도우 시간

이 모니터는 윈도우 시간 서비스의 메모리 사용량을 반환합니다. 이 서비스는 네트워크의 모든 클라이언트 및 서버에서 날짜 및 시간 동기화를 유지합니다. 이 서비스가 중지되면 날짜 및 시간 동기화를 사용할 수 없습니다. 이 서비스를 사용하지 않도록 설정하면 명시적으로 종속된 모든 서비스가 시작되지 않습니다.

서비스: 클러스터 서비스

이 모니터는 클러스터 서비스의 메모리 사용량을 반환합니다. 이 서비스를 통해 서버는 개별 구성 요소 오류에 관계없이 서버 기반 응용 프로그램을 항상 사용할 수 있도록 클러스터로 함께 작업할 수 있습니다. 이 서비스가 중지되면 클러스터링을 사용할 수 없습니다. 이 서비스를 사용하지 않도록 설정하면 명시적으로 종속된 모든 서비스가 시작되지 않습니다.

네트워크 재연결:재연결 횟수

이 모니터는 노드가 다시 연결된 횟수를 반환합니다.

인스턴스 필드는 설치에 따라 다릅니다. 클러스터 노드의 호스트 이름을 지정해야 합니다(예:노드 1). 기본적으로 이 구성 요소 모니터는 비활성화되어 있으며 문제 해결을 위한 용도로만 사용하도록 설정해야 합니다.

네트워크 다시 연결:일반 메시지 큐 길이

이 모니터는 전송 대기 중인 큐에 있는 일반 메시지 수를 반환합니다. 일반적으로 이 숫자는 0 이지만,만약 연결이 끊어진 경우,연결이 다시 설정될 때까지 이 숫자가 올라가고 있는 것을 관찰할 수 있습니다.

인스턴스 필드는 설치에 따라 다릅니다. 클러스터 노드의 호스트 이름을 지정해야 합니다(예:노드 1). 기본적으로 이 구성 요소 모니터는 비활성화되어 있으며 문제 해결을 위한 용도로만 사용하도록 설정해야 합니다.

네트워크 다시 연결:긴급 메시지 큐 길이

이 모니터는 전송 대기 중인 큐에 있는 긴급 메시지 수를 반환합니다. 일반적으로 이 숫자는 0 입니다.

인스턴스 필드는 설치에 따라 다릅니다. 클러스터 노드의 호스트 이름을 지정해야 합니다(예:노드 1). 기본적으로 이 구성 요소 모니터는 비활성화되어 있으며 문제 해결을 위한 용도로만 사용하도록 설정해야 합니다.

미결 메시지

이 모니터는 클러스터 미결 메시지 수를 반환합니다. 반환된 값은 0 에 가까워 야 합니다.

리소스 제어 관리자:그룹 온라인

이 모니터는 이 노드의 온라인 클러스터 리소스 그룹 수를 반환합니다. 반환된 값은 항상 0 이상이어야 합니다.

리소스 제어 관리자:프로세스

이 모니터는 실행 중인 리소스 호스트 하위 시스템 프로세스 수를 반환합니다.(예) 반환된 값은 항상 0 이상이어야 합니다.

리소스 제어 관리자:

이 모니터는 리소스 호스트 하위 시스템 프로세스 수를 반환합니다.다시 시작합니다.

기본적으로 이 구성 요소 모니터는 비활성화되어 있으며 문제 해결을 위해서만 사용하도록 설정해야 합니다.

리소스: 리소스 오류

이 모니터는 리소스 오류 수를 반환합니다. 반환된 값은 가능한 한 낮아야 합니다.

리소스:리소스 오류 액세스 위반

이 모니터는 액세스 위반으로 인한 리소스 오류 수를 반환합니다. 반환된 값은 가능한 한 낮아야 합니다.

기본적으로 이 구성 요소 모니터는 비활성화되어 있으며 문제 해결을 위해서만 사용하도록 설정해야 합니다.

리소스:리소스 오류 교착 상태

이 모니터는 교착 상태로 인한 리소스 오류 수를 반환합니다. 교착 상태는 일반적으로 리소스가 특정 작업을 실행하는 데 너무 오래 걸리기 때문에 발생합니다. 반환된 값은 가능한 한 낮아야 합니다.

기본적으로 이 구성 요소 모니터는 비활성화되어 있으며 문제 해결을 위해서만 사용하도록 설정해야 합니다.

백업 및 복원 기능 문제

이 모니터는 다음과 같은 경우에 발생하는 이벤트 수를 반환합니다:

    • 클러스터의 쿼럼이 아직 달성되지 않았기 때문에 클러스터 구성 데이터에 대한 백업 작업이 중단되었습니다;
    • “복원 전”또는”복원 후”단계에서 클러스터 구성 데이터에 대한 복원 요청이 실패했습니다.

이벤트 유형:오류. 이벤트 번호:1541,1542,1543.

다음 사전 조건이 충족되었는지 확인한 다음 백업 또는 복원 작업을 다시 시도하십시오:

    • 클러스터는 쿼럼을 달성해야 합니다. 즉,클러스터가 과반수,즉 쿼럼을 달성한 충분한 노드가 실행되고 통신(쿼럼 구성에 따라 감시 디스크 또는 감시 파일 공유)해야 합니다.
    • 백업을 수행하는 사람이 사용하는 계정은 클러스터된 각 서버의 로컬 관리자 그룹에 있어야 하며 도메인 계정이거나 해당 권한을 위임받은 계정이어야 합니다.
    • 복원 중에 복원 소프트웨어는 지정된 노드의 클러스터 구성 데이터베이스에 단독으로 액세스해야 합니다. 다른 소프트웨어에 액세스 할 수있는 경우(데이터베이스에 대한 핸들 열기)복원을 수행 할 수 없습니다.

클러스터 네트워크 연결 문제

이 모니터는 다음과 같은 경우에 발생하는 이벤트 수를 반환합니다:

  • 특수 네트워크의 일부 클러스터 노드에 대한 클러스터 네트워크 인터페이스가 실패했습니다.
  • ;
  • 특수 네트워크 어댑터에 대해 사용하려고 하지 못했습니다.

이벤트 유형:경고 및 오류. 이벤트 아이디: 1127, 1129, 1130, 1360, 1555.

네트워크 테스트만 선택하여 구성 유효성 검사 마법사를 실행합니다. 또한 네트워크 장치(어댑터,케이블,허브,스위치 등)및 쿼럼 구성을 확인하십시오.

네트워크 및 서브넷 정보가 일치하는지 확인하기 위해 해당 네트워크의 속성과 네트워크 주소 리소스의 속성을 비교합니다. 클러스터 네트워크에 연결 로컬 또는 터널이 아닌 접두사가 하나 이상 있는지 확인합니다.

클러스터 서비스 시작 문제

이 모니터는 다음과 같은 경우에 발생하는 이벤트 수를 반환합니다:

  • 다른 클러스터 노드와의 불완전한 연결로 인해 클러스터 서비스가 중지되었습니다.;
  • 클러스터 서비스에서 예기치 않은 문제가 발생하여 종료됩니다. 이 노드에는 클러스터 구성 데이터의 최신 복사본이 없습니다.)
  • 멤버 자격 엔진이 쿼럼 장치에 대한 중재 프로세스가 중지되었음을 감지했습니다.

이벤트 유형:오류. 이벤트 아이디: 1000, 1006, 1073, 1146, 1230, 1556, 1561, 1178.

노드에서 클러스터 서비스가 시작되지 않도록 할 수 있는 다양한 소프트웨어 또는 하드웨어 관련 원인이 있습니다. 때로는 클러스터 서비스가 이러한 원인 중 하나에 의해 중단된 후 성공적으로 다시 시작될 수 있습니다. 문제의 표시에 대 한 이벤트 로그를 검토 합니다.

네트워크 하드웨어 및 구성을 확인하십시오. 구성 유효성 검사 마법사를 사용하여 네트워크 구성을 검토합니다.

문제를 일으키는 리소스를 확인하고 리소스 공급업체에 문제를 보고합니다. 자체 리소스 모니터에서 실행되도록 리소스를 구성하는 것이 좋습니다. 클러스터 서비스 실행이 중지되지는 않지만 리소스가 자체 리소스 모니터에서 실행되지 않으면 다른 리소스가 실행되지 않을 수 있습니다.

클러스터의 다른 모든 노드에서 클러스터 서비스를 시작하십시오. 클러스터 구성 데이터의 최신 복사본이 있는 노드에서 클러스터 서비스를 시작할 수 있는 경우 이전에 시작할 수 없는 노드는 최신 복사본을 가져온 다음 클러스터에 성공적으로 가입할 수 있습니다.

클러스터 공유 볼륨 기능 문제

이 모니터는 다음 경우에 발생하는 이벤트 수를 반환합니다:

  • 이 노드에서 클러스터 공유 볼륨을 더 이상 사용할 수 없습니다.
  • 클러스터 공유 볼륨이 더 이상 이 클러스터 노드에서 직접 액세스할 수 없습니다.
  • 클러스터 서비스가 클러스터 공유 볼륨 루트 디렉터리를 만들지 못했습니다.
  • 클러스터 서비스가 클러스터 공유 볼륨 루트 디렉터리에 대한 사용 권한을 설정하지 못했습니다.;
  • 이 클러스터 노드에서 클러스터 공유 볼륨에 더 이상 액세스할 수 없습니다.

이벤트 유형:오류. 이벤트 아이디: 5120, 5121, 5123, 5134, 5135, 5142, 5200.

볼륨과의 통신과 관련된 이벤트를 검토합니다.

스토리지 및 네트워크 구성을 확인합니다.

클러스터 공유 볼륨 폴더 생성 및 사용 권한을 확인합니다.

도메인 컨트롤러와 노드 간의 통신을 확인합니다.

클러스터 저장소 기능 문제

이 모니터는 다음 경우에 발생하는 이벤트 수를 반환합니다:

  • 디스크 리소스가 온라인 상태가 되는 동안 하나 이상의 볼륨에 대한 액세스가 오류로 인해 실패했습니다.;
  • 클러스터 디스크 리소스에 잘못된 마운트 지점이 포함되어 있습니다.

이벤트 유형:오류. 이벤트 아이디: 1034, 1035, 1037, 1066, 1208.

영향을 받는 디스크를 사용할 수 있는지 확인합니다.

기본 저장소 하드웨어를 확인하고 장치가 클러스터 노드에 올바르게 표시되는지 확인합니다.

디스크의 파티션에 문제가 있거나 손상된 경우 파일 시스템의 문제를 해결할 수 있도록 파티션을 실행하는 것이 좋습니다.

클러스터된 디스크는 로컬 디스크가 아닌 클러스터된 디스크에만 마운트할 수 있습니다. 두 개의 서로 다른 클러스터된 서비스나 응용 프로그램에 있을 수 없으며 클러스터의 사용 가능한 저장소의 일반 풀에 있을 수 없습니다.

클러스터 감시 문제

이 모니터는 다음 경우에 발생하는 이벤트 수를 반환합니다:

  • 클러스터 서비스에서 미러링 모니터 리소스의 문제를 발견했습니다.
  • 파일 공유 미러링 모니터 리소스가 정기적인 상태 검사에 실패했습니다.
  • 파일 공유 미러링 모니터 리소스가 온라인 상태가 되지 못했습니다.
  • 파일 공유 미러링 모니터 리소스가 특정 파일 공유에 대해 중재하지 못했습니다.
  • 파일 공유 미러링 모니터 리소스가 특정 파일 공유에 대해 중재하지 못했습니다.
  • >미러링 모니터 서버에 액세스할 수 없기 때문에 노드가 클러스터를 형성하지 못했습니다.

이벤트 유형:오류. 이벤트 아이디: 1557, 1558, 1562, 1563, 1564, 1573.

장애 조치 클러스터의 쿼럼 구성 및 감시 디스크의 상태를 확인하여 감시 접근성을 확인합니다.

구성 가용성 문제

이 모니터는 다음과 같은 경우에 발생하는 이벤트 수를 반환합니다:

  • 클러스터 구성 데이터베이스를 로드하거나 언로드할 수 없습니다.

이벤트 유형:오류. 이벤트 아이디: 1057, 1090, 1574, 1575, 1593.

노드의 클러스터 구성이 없거나 손상되면 클러스터 서비스에서 구성을 로드할 수 없으므로 시작할 수 없습니다. 가능한 경우 클러스터 서비스는 클러스터의 다른 노드에서 최신 클러스터 구성을 가져옵니다. 다른 노드가 시작되었는지 확인합니다. 시작할 수 있는 유일한 노드에 클러스터 구성 데이터베이스가 없거나 손상된 것으로 보이는 경우 시스템 상태 백업에서 노드 중 하나를 복원해야 할 수 있습니다. 장애 조치 클러스터 노드의 경우 시스템 상태 백업에 클러스터 구성이 포함됩니다.)노드가 클러스터 구성 데이터베이스를 언로드하려고 할 때 작업이 완전히 완료되지 않는 경우가 있습니다. 클러스터 서비스를 중지하고 다시 시작하십시오. 성공하지 못하면 영향을 받는 노드에서 운영 체제를 다시 시작하십시오.

이 모니터는 다음과 같은 경우에 발생하는 이벤트 수를 반환합니다:

  • ;
  • 오류로 인해 클러스터 파일 공유 리소스를 온라인 상태로 만들 수 없습니다.

이벤트 유형:오류. 이벤트 번호:1138,1141,1142.
네임스페이스 구성을 확인합니다.

클러스터 리소스에 대한 암호화된 설정을 적용할 수 없음

이 모니터는 클러스터 리소스에 대한 암호화된 설정을 이 노드의 컨테이너에 성공적으로 적용할 수 없을 때 이벤트 수를 반환합니다.

이벤트 유형:오류. 이벤트 아이디:1121.

이벤트에 의해 표시된 레지스트리 검사점에 대해 열린 핸들이 있을 수 있는 모든 응용 프로그램을 닫습니다. 이렇게 하면 리소스 속성으로 구성된 대로 레지스트리 키를 복제할 수 있습니다. 필요한 경우 이 문제에 대해 응용 프로그램 공급업체에 문의하십시오. 핸들이라는 유틸리티를 사용하여-레지스트리 핸들을 볼 수 있는 옵션을 사용할 수 있습니다.

클러스터 형성 실패

이 모니터는 클러스터 형성 실패 이벤트 수를 반환합니다.

이벤트 유형:오류. 이벤트 아이디:1092,1009.

클러스터 서비스를 다시 시작하여 이 문제를 해결할 수 있습니다.

파일 공유 리소스 가용성 문제

이 모니터는 다음 경우에 발생하는 이벤트 수를 반환합니다:

  • 특정 공유에 대한 정보 검색에서 오류 코드가 반환되었습니다.;
  • 일부 공유 폴더에 액세스할 수 없기 때문에 클러스터 파일 서버 리소스가 상태 검사에 실패했습니다.

이벤트 유형:경고 및 오류. 이벤트 아이디: 1053, 1054, 1055, 1068, 1560, 1585, 1586, 1587, 1588.

공유가 있고 공유에 대한 액세스 권한이 있는지 확인합니다.

가능한 경우 공유 경로가 변경되었는지 확인합니다. 이 경우 올바른 이름으로 공유를 다시 만듭니다.

클러스터된 파일 서버 인스턴스의 모든 리소스를 보고 해당 리소스가 온라인 상태인지 확인하고 리소스 간의 종속성을 검토합니다. 문제를 해결하기 위해 필요에 따라 재구성.

두 개의 공유 폴더에 동일한 공유 이름이 없는지 확인합니다.

공유 폴더 액세스 가능성 및 서버 서비스 상태를 확인합니다.

일반 응용 프로그램을 온라인 상태로 만들 수 없습니다

이 모니터는 다음과 같은 이유로 인해 프로세스를 만드는 동안 일반 응용 프로그램을 온라인 상태로 만들 수 없을 때 발생하는 이벤트 수를 반환합니다; 이 노드에 응용 프로그램이 없거나 경로 이름이 잘못되었거나 이진 이름이 잘못되었습니다.

이벤트 유형:오류. 이벤트 아이디:1039.

클러스터된 일반 응용 프로그램 인스턴스에서 사용하는 응용 프로그램에 대해 다음 사항이 해당되는지 확인합니다:

  • 응용 프로그램이 일반 응용 프로그램 리소스의 가능한 소유자인 모든 노드에 완전히 설치됩니다.
  • 일반 응용 프로그램 리소스에 대한 구성은 올바른 응용 프로그램과 경로를 지정합니다;
  • 일반 응용 프로그램 리소스에 대한 구성은 레지스트리 복제에 적합한 매개 변수와 설정을 지정합니다.

일반 서비스 리소스 가용성 문제

이 모니터는 다음과 같은 경우에 발생하는 이벤트 수를 반환합니다:

  • 제네릭 서비스가 설치되지 않았거나 지정된 서비스 이름이 잘못되었습니다.
  • 지정된 제네릭 서비스 매개 변수가 잘못되었을 수 있습니다.
  • 제네릭 서비스가 오류로 인해 실패했습니다.

이벤트 유형:오류. 이벤트 번호:1040,1041,1042.

일반 서비스 리소스에 대한 구성에 올바른 서비스가 지정되었는지 확인하고 리소스의 가능한 소유자인 모든 노드에 서비스가 완전히 설치되었는지 확인합니다.

서비스 작업을 확인하고 응용 프로그램 이벤트 로그를 검사합니다.

이 모니터는 다음과 같은 경우에 발생하는 이벤트 수를 반환합니다:

  • 서브넷 마스크 값이 잘못되었기 때문에 클러스터 주소 리소스를 온라인 상태로 만들 수 없습니다;
  • 클러스터 네트워크 인터페이스에 해당하는 네트워크 어댑터의 구성 데이터를 확인할 수 없습니다.;
  • 클러스터 주소 리소스가 만료되었거나 만료 예정이며 현재 갱신할 수 없습니다.

이벤트 유형:오류. 이벤트 아이디: 1046, 1047, 1048, 1049, 1078, 1242, 1361, 1363.

주소,서브넷 및 네트워크 속성을 확인합니다.

리소스가 터널 주소 리소스인 경우 하나 이상의 리소스가 종속되어 있는지 확인합니다. 또한 네트워크가 사이트 내 자동 터널 주소 지정 프로토콜을 지원하는지 확인하십시오.

클러스터에서 사용하는 네트워크 어댑터 및 기타 네트워크 구성 요소의 상태를 확인합니다.

네트워크 연결 및 구성 문제

이 모니터는 다음과 같은 경우에 발생하는 이벤트 수를 반환합니다:

  • 클러스터 노드에 네트워크 연결이 없습니다.
  • 클러스터 노드가 모든 네트워크 연결이 끊어졌습니다.
  • 장애 조치 클러스터 가상 어댑터가 미니포트 어댑터를 초기화하지 못했습니다.

이벤트 유형:오류. 이벤트 번호:1289,1553,1554,4871.

실제 네트워크 어댑터 및 클러스터 가상 어댑터의 문제를 해결하십시오. 이전 구성 변경이 클러스터 가상 어댑터의 기능을 방해하는 경우 노드에서 장애 조치 클러스터링 기능을 다시 설치해야 할 수 있습니다. 또한 구성 유효성 검사 마법사를 사용하여 네트워크 구성을 검토합니다.

노드가 클러스터에 가입하지 못함

이 모니터는 노드가 오류로 인해 장애 조치 클러스터에 가입하지 못했을 때 발생하는 이벤트 수를 반환합니다.

이벤트 유형:오류. 이벤트 아이디:1070.

클러스터 서비스를 다시 시작하여 이 문제를 해결할 수 있습니다.

클러스터 서비스 문제

이 모니터는 다음과 같은 경우에 발생하는 이벤트 수를 반환합니다:

  • 클러스터 서비스가 클러스터된 서비스 또는 응용 프로그램을 완전히 온라인 또는 오프라인으로 만들지 못했으며 하나 이상의 리소스가 실패 상태일 수 있습니다.

이벤트 유형:경고 및 오류. 이벤트 아이디:1039,1205.

리소스와 관련된 응용 프로그램 또는 서비스의 문제를 확인하고 수정합니다.

케이블 또는 클러스터 관련 장치의 문제를 확인하고 수정하십시오.

클러스터 구성에서 리소스에 대한 속성,특히 리소스에 대한 보류 제한 시간 값을 조정합니다. 이 값은 연결된 응용 프로그램 또는 서비스를 시작하는 데 충분한 시간을 허용해야 합니다.
클러스터된 서비스 또는 응용 프로그램의 모든 리소스 상태를 확인합니다.

쿼럼이 손실되었습니다

이 모니터는 쿼럼이 손실되어 클러스터 서비스가 종료될 때 발생하는 이벤트 수를 반환합니다.

이벤트 유형:오류. 이벤트 아이디: 1177.

클러스터의 일부 또는 모든 노드 간에 네트워크 연결이 끊어지거나 감시 디스크가 장애 조치될 때 이 문제가 발생할 수 있습니다. 현재 온라인 상태인 노드 수가 새 구성에서 쿼럼을 달성하기에 너무 적을 때 노드 수를 늘리는 등 클러스터 구성을 변경하는 경우에도 발생할 수 있습니다. 네트워크 테스트만 선택하여 구성 유효성 검사 마법사를 실행합니다. 또한 네트워크 장치(어댑터,케이블,허브,스위치 등)를 확인하십시오.)및 쿼럼 구성.

레지스트리 검사점을 레지스트리 키로 복원할 수 없습니다

이 모니터는 클러스터 리소스에 대한 레지스트리 검사점을 레지스트리 키로 복원할 수 없을 때 발생하는 이벤트 수를 반환합니다.

이벤트 유형:오류. 이벤트 아이디:1024.

이벤트에 의해 표시된 레지스트리 검사점에 대해 열린 핸들이 있을 수 있는 모든 응용 프로그램을 닫습니다. 이렇게 하면 리소스 속성으로 구성된 대로 레지스트리 키를 복제할 수 있습니다. 필요한 경우 이 문제에 대해 응용 프로그램 공급업체에 문의하십시오. 핸들이라는 유틸리티를 사용하여-레지스트리 핸들을 볼 수 있는 옵션을 사용할 수 있습니다.

시스템이 응답하지 않음

이 모니터는 장애 조치 클러스터 가상 어댑터가 프로세스와의 연결이 끊어졌을 때 발생하는 이벤트 수를 반환합니다.

이벤트 유형:오류. 이벤트 아이디:4869,4870.

Write a Comment

이메일 주소는 공개되지 않습니다.