Microsoft Windows Server 2008 Failover Cluster

Tato šablona hodnotí stav a celkový výkon clusteru Microsoft Windows 2008 Failover získáním informací z čítačů výkonu a protokolu událostí systému Windows. Další informace naleznete v následujícím článku společnosti Microsoft: http://technet.microsoft.com/en-us/library/cc720058%28WS.10%29.aspx.

předpoklady

WMI přístup k cílovému serveru.

pověření

správce systému Windows na cílovém serveru.

všechny monitory protokolu událostí systému Windows by měly vrátit nulové hodnoty. Vrácené hodnoty jiné než nula indikují abnormalitu. Zkoumání souborů protokolu systému Windows by mělo poskytnout informace týkající se problému. Podrobné informace o těchto událostech naleznete zde: http://technet.microsoft.com/en-us/library/dd353290(WS.10).aspx.

monitory komponent

Klikněte zde pro přehled o šablonách monitoru aplikací SAM a monitorech komponent. SAM API Poller šablony jsou také k dispozici.

je třeba nastavit prahové hodnoty pro čítače podle vašeho prostředí. Doporučuje se monitorovat čítače po určitou dobu, abyste porozuměli rozsahům potenciálních hodnot a poté odpovídajícím způsobem nastavili prahové hodnoty.

služba: Windows Time

tento monitor vrací využití procesoru a paměti služby Windows Time. Tato služba udržuje synchronizaci data a času na všech klientech a serverech v síti. Pokud je tato služba zastavena, synchronizace data a času nebude k dispozici. Pokud je tato služba zakázána, všechny služby, které na ní výslovně závisí, se nespustí.

servis: Cluster Service

tento monitor vrací využití CPU a paměti clusterové služby. Tato služba umožňuje serverům spolupracovat jako cluster, aby byly serverové aplikace vysoce dostupné, bez ohledu na selhání jednotlivých komponent. Pokud je tato služba zastavena, shlukování nebude k dispozici. Pokud je tato služba zakázána, všechny služby, které na ní výslovně závisí, se nespustí.

opětovné připojení sítě: Počet opětovného připojení

tento monitor vrací počet opětovného připojení uzlů.

pole instance je specifické pro instalaci. Musíte zadat název hostitele uzlu clusteru (například: node1). Ve výchozím nastavení je tento monitor komponent zakázán a měl by být povolen pouze pro účely řešení problémů.

opětovné připojení k síti: normální délka fronty zpráv

tento monitor vrací počet normálních zpráv, které jsou ve frontě čekající na odeslání. Normálně je toto číslo 0, ale pokud se spojení TCP přeruší, můžete pozorovat, že se zvyšuje, dokud není spojení TCP obnoveno a my je můžeme všechny odeslat.

pole instance je specifické pro instalaci. Musíte zadat název hostitele uzlu clusteru (například: node1). Ve výchozím nastavení je tento monitor komponent zakázán a měl by být povolen pouze pro účely řešení problémů.

opětovné připojení k síti: délka fronty urgentních zpráv

tento monitor vrací počet urgentních zpráv, které jsou ve frontě čekající na odeslání. Normálně je toto číslo 0, ale pokud se spojení TCP přeruší, můžete pozorovat, že se zvyšuje, dokud není spojení TCP obnoveno, což umožňuje odesílání všech zpráv.

pole instance je specifické pro instalaci. Musíte zadat název hostitele uzlu clusteru (například: node1). Ve výchozím nastavení je tento monitor komponent zakázán a měl by být povolen pouze pro účely řešení problémů.

zprávy Outstanding

tento monitor vrací počet clusteru MRR outstanding zpráv. Vrácená hodnota by měla být téměř nulová.

Správce řízení zdrojů: skupiny Online

tento monitor vrací počet skupin zdrojů online clusteru v tomto uzlu. Vrácená hodnota by měla být vždy nad nulou.

Správce řízení zdrojů: procesy RHS

tento monitor vrací počet spuštěných procesů hostitelského podsystému zdrojů (rhs.exe). Vrácená hodnota by měla být vždy nad nulou.

Správce řízení zdrojů: RHS restartuje

tento monitor vrací počet procesů hostitelského subsystému zdrojů (rhs.exe) restartuje.

ve výchozím nastavení je tento monitor komponent zakázán a měl by být povolen pouze pro účely řešení problémů.

zdroje: Selhání zdroje

tento monitor vrací počet selhání zdrojů. Vrácená hodnota by měla být co nejnižší.

zdroje: narušení přístupu k selhání zdrojů

tento monitor vrací počet selhání zdrojů způsobených porušením přístupu. Vrácená hodnota by měla být co nejnižší.

ve výchozím nastavení je tento monitor komponent zakázán a měl by být povolen pouze pro účely řešení problémů.

zdroje: zablokování selhání zdrojů

tento monitor vrací počet selhání zdrojů způsobených zablokováním. Zablokování je obvykle způsobeno tím, že zdroj trvá příliš dlouho, než provede určité operace. Vrácená hodnota by měla být co nejnižší.

ve výchozím nastavení je tento monitor komponent zakázán a měl by být povolen pouze pro účely řešení problémů.

problémy s funkčností zálohování a obnovení

tento monitor vrací počet událostí, ke kterým dochází, když:

    • operace zálohování konfiguračních dat clusteru byla přerušena, protože dosud nebylo dosaženo kvora pro cluster;
    • požadavek na obnovení konfiguračních dat clusteru selhal během fáze „před obnovením“ nebo „po obnovení“.

typ události: Chyba. ID události: 1541, 1542, 1543.

zkontrolujte následující předběžné podmínky, abyste se ujistili, že byly splněny, a opakujte operaci zálohování nebo obnovení:

    • klastr musí dosáhnout usnášeníschopnosti. Jinými slovy, musí být spuštěno a komunikováno dost uzlů (možná s diskem svědků nebo sdíleným souborem svědků, v závislosti na konfiguraci kvora), že cluster dosáhl většiny, tj.
    • účet používaný osobou provádějící zálohu musí být ve skupině místních správců na každém klastrovaném serveru a musí být účtem domény nebo musí být delegován rovnocennou autoritou.
    • během obnovení musí software pro obnovení získat exkluzivní přístup do konfigurační databáze clusteru v daném uzlu. Pokud má jiný software přístup (otevřené úchyty k databázi), obnovení nelze provést.

problémy s připojením k síti clusteru

tento monitor vrací počet událostí, ke kterým dochází, když:

  • síťové rozhraní clusteru pro nějaký uzel clusteru ve speciální síti selhalo;
  • síť clusteru je rozdělena na oddíly a některé připojené uzly clusteru při selhání nemohou vzájemně komunikovat přes síť;
  • síť clusteru je nefunkční;
  • zdroj IP adresy clusteru se nepodařilo připojit online;
  • Pokus o použití IPv4 pro speciální síťový adaptér selhal.

typ události: varování a chyba. ID události: 1127, 1129, 1130, 1360, 1555.

Spusťte Průvodce ověřením konfigurace a vyberte pouze síťové testy. Zkontrolujte také síťová zařízení (adaptéry, kabely, rozbočovače, přepínače atd.)

Porovnejte vlastnosti zdroje adresy IP s vlastnostmi odpovídající sítě, abyste zajistili shodu informací o síti a podsíti. Pokud se jedná o prostředek IPv6, ujistěte se, že clusterová síť pro tento prostředek má alespoň jednu předponu IPv6, která není link-local nebo tunnel.

problémy se spuštěním clusterové služby

tento monitor vrací počet událostí, ke kterým dochází, když:

  • Clusterová služba utrpěla neočekávanou fatální chybu;
  • Clusterová služba byla zastavena kvůli neúplné konektivitě s jinými uzly clusteru;
  • Clusterová služba byla zastavena, aby se zabránilo nekonzistenci v clusteru převzetí služeb při selhání;
  • cluster resource host subsystem (RHS) se neočekávaně zastavil;
  • Cluster resource buď havaroval, nebo byl zablokován;
  • Cluster service narazil na neočekávaný problém a bude vypnut;
  • Cluster service zabránila spuštění na tomto uzlu. (Tento uzel nemá nejnovější kopii konfiguračních dat clusteru.)
  • modul členství zjistil, že rozhodčí Proces pro zařízení kvora se zastavil.

typ události: Chyba. ID události: 1000, 1006, 1073, 1146, 1230, 1556, 1561, 1178.

existují různé příčiny související se softwarem nebo hardwarem, které mohou zabránit spuštění služby clusteru na uzlu. Někdy se služba clusteru může úspěšně restartovat poté, co byla přerušena jednou z těchto příčin. Zkontrolujte protokoly událostí pro indikace problému.

zkontrolujte síťový hardware a konfiguraci. Pomocí Průvodce ověřením konfigurace Zkontrolujte konfiguraci sítě.

zkontrolujte, který zdroj DLL způsobuje problém, a nahlaste problém dodavateli prostředků. Zvažte konfiguraci zdroje pro spuštění ve vlastním monitoru zdrojů. Všimněte si, že zatímco problém s DLL zdroje nezastaví službu clusteru v běhu, může zabránit spuštění jiných dll zdrojů, pokud zdroj neběží ve svém vlastním monitoru zdrojů.

zkuste spustit službu clusteru na všech ostatních uzlech v clusteru. Pokud lze službu clusteru spustit na uzlu s nejnovější kopií konfiguračních dat clusteru, pak uzel, který dříve nemohl být spuštěn, bude pravděpodobně schopen získat nejnovější kopii a poté se úspěšně připojit ke klastru.

problémy s funkčností sdíleného svazku clusteru

tento monitor vrací počet událostí, ke kterým dochází, když:

  • sdílený svazek clusteru již není v tomto uzlu k dispozici;
  • sdílený svazek clusteru již není přímo přístupný z tohoto uzlu clusteru;
  • clusterové službě se nepodařilo vytvořit kořenový adresář sdílených svazků clusteru;
  • clusterové službě se nepodařilo nastavit oprávnění (ACL) v kořenovém adresáři sdílených svazků clusteru;
  • sdílený svazek clusteru již není přístupný z tohoto uzlu clusteru;
  • clusterové službě se nepodařilo vytvořit Token identity clusteru pro sdílené svazky clusteru.

typ události: Chyba. ID události: 5120, 5121, 5123, 5134, 5135, 5142, 5200.

zkontrolujte události související s komunikací se svazkem.

Zkontrolujte konfiguraci úložiště a sítě.

zkontrolujte vytvoření a oprávnění složky sdílených svazků clusteru.

zkontrolujte komunikaci mezi řadiči domény a uzly.

problémy s funkčností úložiště clusteru

tento monitor vrací počet událostí, ke kterým dochází, když:

  • fyzický diskový prostředek clusteru nelze přenést online, protože přidružený disk nebyl nalezen;
  • zatímco diskový prostředek byl přiveden online, přístup k jednomu nebo více svazkům selhal s chybou;
  • souborový systém pro jeden nebo více oddílů na disku pro prostředek může být poškozen;
  • diskový prostředek clusteru označuje poškození pro konkrétní svazek;
  • diskový prostředek clusteru obsahuje neplatný připojovací bod.

typ události: Chyba. ID události: 1034, 1035, 1037, 1066, 1208.

potvrďte, že je postižený disk k dispozici.

zkontrolujte základní hardware úložiště a ověřte, zda je zařízení správně prezentováno do uzlů clusteru.

pokud máte problémy s oddíly na disku nebo s poškozením, doporučujeme spustit Chkdsk, aby mohl opravit jakékoli problémy se systémem souborů.

potvrďte, že připojený disk je nakonfigurován podle následujících pokynů:

clusterové disky lze připojit pouze na clusterové disky (nikoli lokální disky);

připojený disk a disk, na který je namontován, musí být součástí stejné clusterové služby nebo aplikace. Nemohou být ve dvou různých clusterových službách nebo aplikacích a nemohou být v obecném fondu dostupného úložiště v clusteru.

Cluster Witness Problems

tento monitor vrací počet událostí, ke kterým dochází, když:

  • služba clusteru nedokázala aktualizovat konfigurační data clusteru na prostředku svědka kvůli nedostupnosti zdroje;
  • služba clusteru zjistila problém se zdrojem svědka;
  • zdroj svědka sdílení souborů selhal při pravidelné kontrole stavu;
  • zdroj svědka sdílení souborů se nepodařilo připojit online;
  • zdroj svědka sdílení souborů selhal v arbitráži pro konkrétní sdílení souborů;
  • uzel se nepodařilo vytvořit cluster, protože svědek nebyl přístupný.

typ události: Chyba. ID události: 1557, 1558, 1562, 1563, 1564, 1573.

potvrďte Přístupnost svědka zobrazením konfigurace kvora clusteru převzetí služeb při selhání a stavu disku svědka.

problémy s dostupností konfigurace

tento monitor vrací počet událostí, ke kterým dochází, když:

  • databáze konfigurace clusteru nemohla být načtena ani vyložena;
  • služba clusteru se nemůže spustit kvůli neúspěšným pokusům o čtení konfiguračních dat.

typ události: Chyba. ID události: 1057, 1090, 1574, 1575, 1593.

pokud konfigurace clusteru v uzlu chybí nebo je poškozena, služba clusteru nemůže načíst konfiguraci, a proto ji nemůže spustit. Pokud je to možné, služba clusteru získá nejnovější konfiguraci clusteru z jiných uzlů v clusteru. Ujistěte se, že jsou spuštěny další uzly. Pokud se zdá, že jediný uzel nebo uzly, které lze spustit, mají chybějící nebo poškozenou konfigurační databázi clusteru, budete pravděpodobně muset obnovit jeden z uzlů ze zálohy stavu systému. (Pro uzel clusteru failover obsahuje záloha stavu systému konfiguraci clusteru.) Někdy, když se uzel pokusí uvolnit konfigurační databázi clusteru, akce není zcela dokončena. Zkuste zastavit a restartovat službu clusteru. Pokud se to nepodaří, restartujte operační systém v postiženém uzlu.

problémy s dostupností prostředků jmenného prostoru DFS

tento monitor vrací počet událostí, ke kterým dochází, když:

  • vytvoření kořenového jmenného prostoru DFS selhalo s chybou;
  • resynchronizace kořenového cíle DFS selhala s chybou;
  • zdroj sdílení souborů clusteru pro jmenný prostor DFS nelze kvůli chybě přenést online.

typ události: Chyba. ID události: 1138, 1141, 1142.
Zkontrolujte konfiguraci jmenného prostoru DFS.

šifrovaná nastavení pro Cluster Resource nemohla být použita

tento monitor vrací počet událostí, kdy šifrovaná nastavení pro cluster resource nemohla být úspěšně použita na kontejner v tomto uzlu.

typ události: Chyba. ID události: 1121.

zavřete všechny aplikace, které mohou mít otevřený popisovač, do kontrolního bodu registru označeného událostí. To umožní replikaci klíče registru tak, jak je nakonfigurováno s vlastnostmi zdroje. V případě potřeby kontaktujte dodavatele aplikace o tomto problému. Můžete použít nástroj s názvem Handle s možností-a pro zobrazení úchytů do registru.

Nepodařilo se vytvořit Cluster

tento monitor vrací počet událostí clusteru se nepodařilo vytvořit.

typ události: Chyba. Číslo události: 1092, 1009.

tento problém můžete napravit restartováním služby clusteru.

problémy s dostupností sdílení souborů

tento monitor vrací počet událostí, ke kterým dochází, když:

  • sdílení souborů clusteru nelze přenést online, protože sdílení souborů nebylo možné vytvořit;
  • načítání informací pro konkrétní akcii vrátilo kód chyby;
  • načítání informací pro konkrétní akcii naznačilo, že sdílení neexistuje;
  • vytvoření sdílení souborů selhalo kvůli chybě;
  • zdroj sdílení souborů clusteru zjistil konflikty sdílených složek;
  • zdroj serveru souborů clusteru selhal při kontrole stavu, protože některé jeho sdílené složky byly nepřístupné.

typ události: varování a chyba. ID události: 1053, 1054, 1055, 1068, 1560, 1585, 1586, 1587, 1588.

potvrďte, že sdílení existuje a že oprávnění umožňují přístup ke sdílení.

pokud je to možné, určete, zda byla změněna cesta ke sdílení. Pokud ano, znovu vytvořte sdílení se správným názvem.

Zobrazit všechny zdroje v instanci clusterového souborového serveru, abyste se ujistili, že přicházejí online, a zkontrolovat závislosti mezi zdroji. Překonfigurovat podle potřeby opravit případné problémy.

ujistěte se, že žádné dvě sdílené složky nemají stejný název sdílení.

zkontrolujte dostupnost sdílené složky a stav serverové služby.

generická Aplikace nelze přenést Online

tento monitor vrací počet událostí, ke kterým dochází, když generická aplikace nemohla být během pokusu o vytvoření procesu přivedena online; aplikace není přítomen na tomto uzlu, nesprávný název cesty, nebo nesprávný binární název.

typ události: Chyba. Číslo akce: 1039.

potvrďte, že pro aplikaci používanou clusterovou generickou instancí aplikace platí následující:

  • aplikace je plně nainstalována na všech uzlech, které jsou možnými vlastníky generického aplikačního prostředku;
  • konfigurace generického aplikačního prostředku určuje správnou aplikaci a cestu;
  • konfigurace generického aplikačního prostředku určuje příslušné parametry a nastavení pro replikaci registru.

obecné problémy s dostupností zdrojů služby

tento monitor vrací počet událostí, ke kterým dochází, když:

  • generická služba buď není nainstalována, nebo je zadaný název služby neplatný;
  • zadané parametry generické služby mohou být neplatné;
  • generická služba selhala s chybou.

typ události: Chyba. ID události: 1040, 1041, 1042.

potvrďte, že je v konfiguraci generického zdroje služby zadána správná služba, a potvrďte, že je služba plně nainstalována na všech uzlech, které jsou možnými vlastníky zdroje.

zkontrolujte provoz služby a zkontrolujte protokol událostí aplikace.

problémy s dostupností zdrojů IP adresy

tento monitor vrací počet událostí, ke kterým dochází, když:

  • prostředek IP adresy clusteru nelze přenést online, protože hodnota masky podsítě je neplatná;
  • zdroj IP adresy clusteru nelze přenést online, protože hodnota adresy je neplatná;
  • konfigurační data pro síťový adaptér odpovídající síťovému rozhraní clusteru nelze určit;
  • zdroj IP adresy clusteru nelze přenést online, protože v síti byla detekována duplicitní adresa IP;
  • zdroj IP adresy clusteru nelze přenést online, protože vyhraje registraci;
  • platnost pronájmu IP adresy přidružené ke zdroji IP adresy clusteru vypršela nebo brzy vyprší a v současné době ji nelze obnovit;
  • zdroj IPv6 Tunnel address se nepodařilo připojit, protože nezávisí na zdroji IP adresy (IPv4);
  • síť clusteru přidružená ke zdroji IP adresy (IPv4) nepodporuje tunelování ISATAP.

typ události: Chyba. ID události: 1046, 1047, 1048, 1049, 1078, 1242, 1361, 1363.

zkontrolujte vlastnosti adresy, podsítě a sítě zdroje adresy IP.

pokud je zdroj adresou tunelu IPv6, ujistěte se, že závisí na alespoň jednom prostředku IP adresy (IPv4). Také se ujistěte, že síť podporuje tunelování protokolu Isatap (Intra-Site Automatic Tunnel Addressing Protocol).

pokud se zdá, že prostředek IP adresy je správně nakonfigurován, zkontrolujte stav síťových adaptérů a dalších síťových komponent používaných clusterem.

problémy s připojením k síti a konfigurací

tento monitor vrací počet událostí, ke kterým dochází, když:

  • služba clusteru neměla přístup k síťovému adaptéru nebo uzel clusteru nemá připojení k síti;
  • uzel clusteru nemá připojení k síti;
  • uzel clusteru ztratil veškeré připojení k síti;
  • virtuální adaptér clusteru při selhání selhal při inicializaci adaptéru miniportu.

typ události: Chyba. ID události: 1289, 1553, 1554, 4871.

opravte všechny problémy s fyzickými síťovými adaptéry a virtuálním adaptérem clusteru. Pokud předchozí změna konfigurace narušuje funkci virtuálního adaptéru clusteru, může být nutné přeinstalovat funkci clusteru při selhání v uzlu. Také pomocí Průvodce ověřením konfigurace Zkontrolujte konfiguraci sítě.

Node Failed to Join Cluster

tento monitor vrací počet událostí, ke kterým došlo, když se uzel nepodařilo připojit k clusteru failover kvůli chybě.

typ události: Chyba. ID události: 1070.

tento problém můžete napravit restartováním služby clusteru.

problémy se službou clusteru

tento monitor vrací počet událostí, ke kterým dochází, když:

  • prostředek clusteru v clusterové službě nebo aplikaci selhal;
  • clusterové službě se nepodařilo přenést Clusterovou službu nebo aplikaci zcela online nebo offline a jeden nebo více zdrojů může být v neúspěšném stavu.

typ události: varování a chyba. IČO: 1039, 1205.

Zkontrolujte a opravte všechny problémy s aplikací nebo službou spojenou se zdrojem.

Zkontrolujte a opravte případné problémy s kabely nebo zařízeními souvisejícími s klastry.

upravte vlastnosti prostředku v konfiguraci clusteru, zejména hodnotu čekajícího časového limitu prostředku. Tato hodnota musí poskytnout dostatek času pro spuštění přidružené aplikace nebo služby.
Zkontrolujte stav všech zdrojů v clusterové službě nebo aplikaci.

kvorum bylo ztraceno

tento monitor vrací počet událostí, ke kterým dochází při vypnutí clusterové služby, protože došlo ke ztrátě kvorum.

typ události: Chyba. Idy: 1177.

k tomu může dojít, když dojde ke ztrátě připojení k síti mezi některými nebo všemi uzly v clusteru nebo k selhání disku svědka. Může také nastat, pokud provedete změnu konfigurace klastru, jako je zvýšení počtu uzlů, když je počet uzlů, které jsou aktuálně online, příliš malý na to, aby bylo v nové konfiguraci dosaženo kvora. Spusťte Průvodce ověřením konfigurace a vyberte pouze síťové testy. Zkontrolujte také síťová zařízení (adaptéry, kabely, rozbočovače, přepínače atd.) a konfigurace kvora.

kontrolní bod registru nelze obnovit do klíče registru

tento monitor vrací počet událostí, ke kterým dochází, když kontrolní bod registru pro prostředek clusteru nelze obnovit do klíče registru.

typ události: Chyba. ID události: 1024.

zavřete všechny aplikace, které mohou mít otevřený popisovač, do kontrolního bodu registru označeného událostí. To umožní replikaci klíče registru tak, jak je nakonfigurováno s vlastnostmi zdroje. V případě potřeby kontaktujte dodavatele aplikace o tomto problému. Můžete použít nástroj s názvem Handle s možností-a pro zobrazení úchytů do registru.

systém nereaguje

tento monitor vrací počet událostí, ke kterým dochází, když virtuální adaptér clusteru Failover ztratil kontakt s procesem.

typ události: Chyba. ID události: 4869, 4870.

Write a Comment

Vaše e-mailová adresa nebude zveřejněna.