den här mallen utvärderar status och övergripande prestanda för ett Microsoft Windows 2008 Failover Cluster genom att hämta information från prestandaräknare och Windows-systemhändelseloggen. Mer information finns i följande Microsoft-artikel: http://technet.microsoft.com/en-us/library/cc720058%28WS.10%29.aspx.
förutsättningar
WMI-åtkomst till målservern.
referenser
Windows-administratör på målservern.
alla Windows-händelseloggen ska returnera nollvärden. Andra returnerade värden än noll indikerar en abnormitet. Att undersöka Windows-systemloggfilerna bör ge information om problemet. Detaljerad information om dessa händelser finns här: http://technet.microsoft.com/en-us/library/dd353290(WS.10).aspx.
Komponentmonitorer
Klicka här för en översikt om Sam application monitor mallar och komponentmonitorer. SAM API Poller mallar finns också.
du måste ställa in tröskelvärden för räknare enligt din miljö. Det rekommenderas att övervaka räknare under en viss tid för att förstå potentiella värdeområden och sedan ställa in tröskelvärdena i enlighet därmed.
Service: Windows Time
denna bildskärm returnerar CPU och minnesanvändning för Windows Time service. Denna tjänst upprätthåller datum-och tidssynkronisering på alla klienter och servrar i nätverket. Om den här tjänsten stoppas kommer datum-och tidssynkronisering inte att vara tillgänglig. Om den här tjänsten är inaktiverad kommer alla tjänster som uttryckligen är beroende av den inte att starta.
Service: Klustertjänst
den här monitorn returnerar Klustertjänstens CPU och minnesanvändning. Denna tjänst gör det möjligt för servrar att arbeta tillsammans som ett kluster för att hålla serverbaserade applikationer mycket tillgängliga, oavsett enskilda komponentfel. Om den här tjänsten stoppas kommer klustringen inte att vara tillgänglig. Om den här tjänsten är inaktiverad kommer alla tjänster som uttryckligen är beroende av den inte att starta.
nätverksanslutningar: Återanslutningsantal
denna bildskärm returnerar antalet gånger noderna har återanslutits.
instansfältet är installationsspecifikt. Du måste ange värdnamnet för din klusternod (till exempel: node1). Som standard är denna komponentmonitor inaktiverad och bör endast aktiveras för felsökningsändamål.
nätverksanslutningar: Normal Meddelandekölängd
denna bildskärm returnerar antalet normala meddelanden som finns i kön som väntar på att skickas. Normalt är detta nummer 0, men om TCP-anslutningen bryts kan du observera att den går upp tills TCP-anslutningen återupprättas och vi kan skicka dem alla igenom.
instansfältet är installationsspecifikt. Du måste ange värdnamnet för din klusternod (till exempel: node1). Som standard är denna komponentmonitor inaktiverad och bör endast aktiveras för felsökningsändamål.
nätverksanslutningar: Kölängd för brådskande meddelanden
denna bildskärm returnerar antalet brådskande meddelanden som finns i kön som väntar på att skickas. Normalt är detta nummer 0, men om TCP-anslutningen bryts kan du observera att den går upp tills TCP-anslutningen återupprättas, vilket gör att alla meddelanden kan skickas.
instansfältet är installationsspecifikt. Du måste ange värdnamnet för din klusternod (till exempel: node1). Som standard är denna komponentmonitor inaktiverad och bör endast aktiveras för felsökningsändamål.
utestående meddelanden
denna bildskärm returnerar antalet utestående meddelanden i kluster. Det returnerade värdet ska vara nära noll.
Resurskontrollhanterare: grupper Online
den här skärmen returnerar antalet onlineklusterresursgrupper på den här noden. Det returnerade värdet bör alltid vara över noll.
Resource Control Manager: RHS-processer
denna bildskärm returnerar antalet processer som körs resource host subsystem (rhs.exe). Det returnerade värdet bör alltid vara över noll.
Resurskontrollhanterare: RHS startar om
denna bildskärm returnerar antalet resursvärdsundersystemprocess (rhs.exe) startar om.
som standard är denna komponentmonitor inaktiverad och bör endast aktiveras för felsökningsändamål.
resurser: Resursfel
denna bildskärm returnerar antalet resursfel. Det returnerade värdet ska vara så lågt som möjligt.
resurser: Resursfel Åtkomstöverträdelse
den här skärmen returnerar antalet resursfel orsakade av åtkomstöverträdelse. Det returnerade värdet ska vara så lågt som möjligt.
som standard är denna komponentmonitor inaktiverad och bör endast aktiveras för felsökningsändamål.
resurser: Resursfel dödläge
denna bildskärm returnerar antalet resursfel orsakade av dödläge. Deadlocks orsakas vanligtvis av att resursen tar för lång tid att utföra vissa operationer. Det returnerade värdet ska vara så lågt som möjligt.
som standard är denna komponentmonitor inaktiverad och bör endast aktiveras för felsökningsändamål.
problem med säkerhetskopiering och återställning av funktioner
denna bildskärm returnerar antalet händelser som inträffar när:
- säkerhetskopieringen för klusterkonfigurationsdata har avbrutits eftersom kvorum för klustret ännu inte har uppnåtts;
- återställningsbegäran för klusterkonfigurationsdata har misslyckats under scenen” föråterställning ”eller” efter återställning”.
typ av händelse: fel. Händelse-ID: 1541, 1542, 1543.
Kontrollera följande villkor för att se till att de har uppfyllts och försök sedan säkerhetskopiera eller återställa åtgärden:
- klustret måste uppnå kvorum. Med andra ord måste tillräckligt med noder köras och kommunicera (kanske med en vittnesdisk eller vittnesfildelning, beroende på kvorumkonfigurationen) att klustret har uppnått en majoritet, det vill säga kvorum.
- kontot som används av den person som utför säkerhetskopieringen måste finnas i gruppen lokala administratörer på varje grupperad server och måste vara ett domänkonto eller ha delegerats motsvarande behörighet.
- under en återställning måste återställningsprogramvaran få exklusiv åtkomst till klusterkonfigurationsdatabasen på en given nod. Om annan programvara har åtkomst (öppna handtag till databasen) kan återställningen inte utföras.
Klusternätverksanslutningsproblem
denna bildskärm returnerar antalet händelser som inträffar när:
- Klusternätverksgränssnittet för någon klusternod i ett speciellt nätverk misslyckades;
- Klusternätverket är partitionerat och vissa bifogade klusternoder för failover kan inte kommunicera med varandra via nätverket;
- Klusternätverket är nere;
- klusternätverksresursen kunde inte komma online;
- försök att använda IPv4 för en speciell nätverksadapter misslyckades.
typ av händelse: varning och fel. Händelse-ID: 1127, 1129, 1130, 1360, 1555.
kör guiden validera en konfiguration och välj bara nätverkstesterna. Kontrollera även nätverksenheter (Adaptrar, kablar, hubbar, switchar, etc) och kvorumkonfiguration.
jämför egenskaperna för IP-adressresursen med egenskaperna för motsvarande nätverk för att säkerställa att nätverks-och subnätinformationen matchar. Om det här är en IPv6-resurs kontrollerar du att klusternätverket för den här resursen har minst ett IPv6-prefix som inte är link-local eller tunnel.
problem med start av klustertjänster
denna bildskärm returnerar antalet händelser som inträffar när:
- klustertjänsten fick ett oväntat allvarligt fel;
- klustertjänsten stoppades på grund av ofullständig anslutning med andra klusternoder;
- klustertjänsten stoppades för att förhindra en inkonsekvens i failover-klustret;
- cluster resource host subsystem (RHS) stannade oväntat;
- Klusterresursen kraschade eller låstes fast;
- klustertjänsten stötte på ett oväntat problem och kommer att stängas av;
- klustertjänsten har hindrat sig från att starta på den här noden. (Den här noden har inte den senaste kopian av klusterkonfigurationsdata.)
- medlemskapsmotorn upptäckte att skiljeförfarandet för kvorumanordningen har avstannat.
typ av händelse: fel. Händelse-ID: 1000, 1006, 1073, 1146, 1230, 1556, 1561, 1178.
det finns olika mjukvaru-eller hårdvarurelaterade orsaker som kan förhindra att klustertjänsten startar på en nod. Ibland kan klustertjänsten starta om efter att den har avbrutits av en av dessa orsaker. Granska händelseloggarna för indikationer på problemet.
kontrollera nätverkshårdvara och konfiguration. Använd guiden validera en konfiguration för att granska nätverkskonfigurationen.
kontrollera vilken resurs DLL som orsakar problemet och rapportera problemet till resursleverantören. Överväg att konfigurera resursen som ska köras i sin egen Resursövervakare. Observera att även om ett problem med en resurs-dll inte hindrar klustertjänsten från att köras, kan det förhindra att andra resurs-dll-filer körs om inte resursen körs i sin egen Resursövervakare.
försök starta klustertjänsten på alla andra noder i klustret. Om klustertjänsten kan startas på en nod med den senaste kopian av klusterkonfigurationsdata, kommer noden som tidigare inte kunde startas troligen att kunna hämta den senaste kopian och sedan ansluta sig till klustret.
Klusterfunktionalitetsproblem med delad volym
denna bildskärm returnerar antalet händelser som inträffar när:
- den delade Klustervolymen är inte längre tillgänglig på den här noden;
- den delade Klustervolymen är inte längre direkt tillgänglig från den här klusternoden;
- klustertjänsten kunde inte skapa rotkatalogen för delade Klustervolymer;
- klustertjänsten kunde inte ange behörigheterna (ACL) för rotkatalogen för delade Klustervolymer;
- den delade Klustervolymen är inte längre tillgänglig från den här klusternoden;
- klustertjänsten kunde inte skapa en klusteridentitetstoken för delade Klustervolymer.
typ av händelse: fel. Händelse-ID: 5120, 5121, 5123, 5134, 5135, 5142, 5200.
granska händelser relaterade till kommunikation med volymen.
kontrollera lagring och nätverkskonfiguration.
kontrollera kluster delade volymer mapp skapande och behörigheter.
kontrollera kommunikationen mellan domänkontrollanter och noder.
Klusterlagringsfunktionalitetsproblem
denna bildskärm returnerar antalet händelser som inträffar när:
- den fysiska Diskresursen för kluster kan inte hämtas online eftersom den associerade disken inte kunde hittas;
- medan diskresursen togs online misslyckades åtkomst till en eller flera volymer med ett fel;
- filsystemet för en eller flera partitioner på disken för resursen kan vara korrupt;
- Klusterdiskresursen indikerar korruption för specifik volym;
- Klusterdiskresursen innehåller en ogiltig monteringspunkt.
typ av händelse: fel. Händelse-ID: 1034, 1035, 1037, 1066, 1208.
bekräfta att den berörda disken är tillgänglig.
kontrollera den underliggande lagringshårdvaran och bekräfta att enheten presenteras korrekt för klusternoder.
om du har problem med partitioner på disken eller korruption rekommenderar vi att du kör Chkdsk så att det kan korrigera eventuella problem med filsystemet.
bekräfta att den monterade disken är konfigurerad enligt följande riktlinjer:
klustrade diskar kan endast monteras på klustrade diskar (inte lokala diskar);
den monterade disken och disken den är monterad på måste ingå i samma klustrade tjänst eller program. De kan inte vara i två olika grupperade tjänster eller applikationer, och de kan inte vara i den allmänna poolen av tillgänglig lagring i klustret.
Klustervittnesproblem
denna bildskärm returnerar antalet händelser som inträffar när:
- klustertjänsten kunde inte uppdatera klusterkonfigurationsdata på witness-resursen på grund av resursens otillgänglighet;
- Cluster-tjänsten upptäckte ett problem med witness-resursen;
- File Share Witness-resursen misslyckades med en periodisk hälsokontroll;
- File Share Witness-resursen kunde inte komma online;
- File Share Witness-resursen kunde inte skiljas för den specifika filresursen;
- noden kunde inte bilda ett kluster eftersom vittnet inte var tillgängligt.
typ av händelse: fel. Händelse-ID: 1557, 1558, 1562, 1563, 1564, 1573.
bekräfta vittne tillgänglighet genom att visa kvorum konfiguration av en failover kluster och status för ett vittne disk.
Konfigurationstillgänglighetsproblem
denna bildskärm returnerar antalet händelser som inträffar när:
- klusterkonfigurationsdatabasen kunde inte laddas eller lossas;
- klustertjänsten kan inte starta på grund av misslyckade försök att läsa konfigurationsdata.
typ av händelse: fel. Händelse-ID: 1057, 1090, 1574, 1575, 1593.
när klusterkonfigurationen på en nod saknas eller är skadad kan klustertjänsten inte ladda konfigurationen och kan därför inte starta. Om möjligt kommer klustertjänsten att få den senaste klusterkonfigurationen från andra noder i klustret. Se till att andra noder startas. Om den enda noden eller noderna som kan startas verkar ha en saknad eller korrupt klusterkonfigurationsdatabas måste du förmodligen återställa en av noderna från en systemtillståndsbackup. (För en failover-klusternod innehåller system state backup klusterkonfigurationen.) Ibland när noden försöker lossa klusterkonfigurationsdatabasen, är åtgärden inte helt klar. Försök stoppa och starta om klustertjänsten. Om detta inte lyckas startar du om operativsystemet på den drabbade noden.
DFS-problem med resurstillgänglighet i namnrymden
den här skärmen returnerar antalet händelser som inträffar när:
- skapandet av DFS namespace root misslyckades med fel;
- resynkroniseringen av DFS root target misslyckades med fel;
- resursen för klusterfildelning för DFS-namnrymden kan inte hämtas online på grund av fel.
typ av händelse: fel. Händelse-ID: 1138, 1141, 1142.
kontrollera konfigurationen av DFS-namnrymden.
krypterade inställningar för Klusterresurs kunde inte tillämpas
den här skärmen returnerar antalet händelser när krypterade inställningar för en klusterresurs inte kunde tillämpas på behållaren på den här noden.
typ av händelse: fel. Händelse-ID: 1121.
stäng alla program som kan ha ett öppet handtag till registret checkpoint anges av händelsen. Detta gör att registernyckeln kan replikeras som konfigurerad med resursegenskaperna. Om det behövs, kontakta programleverantören om detta problem. Du kan använda ett verktyg som heter handtag med alternativet-a för att visa handtag i registret.
det gick inte att skapa kluster
den här skärmen returnerar antalet händelser som misslyckades med att skapa kluster.
typ av händelse: fel. Händelse-ID: 1092, 1009.
du kanske kan åtgärda problemet genom att starta om klustertjänsten.
Filresurstillgänglighetsproblem
den här skärmen returnerar antalet händelser som inträffar när:
- Klusterfilresursen kan inte hämtas online eftersom en filresurs inte kunde skapas;
- hämtningen av information för en viss resurs returnerade en felkod;
- hämtningen av information för en viss resurs indikerade att resursen inte existerar;
- skapandet av en filresurs misslyckades på grund av ett felmeddelande;
- resursen för Klusterfildelning har upptäckt delade mappkonflikter;
- resursen för Klusterfilserver misslyckades med en hälsokontroll eftersom vissa av dess delade mappar var otillgängliga.
typ av händelse: varning och fel. Händelse-ID: 1053, 1054, 1055, 1068, 1560, 1585, 1586, 1587, 1588.
bekräfta att aktien finns och att behörigheterna tillåter åtkomst till aktien.
om möjligt, Bestäm om sökvägen till aktien har ändrats. Om så är fallet, återskapa delningen med rätt namn.
Visa alla resurser i den grupperade filserverinstansen för att säkerställa att de kommer online och granska beroenden mellan resurserna. Omkonfigurera vid behov för att korrigera eventuella problem.
se till att inga två delade mappar har samma delningsnamn.
kontrollera tillgängligheten för delad mapp och tillståndet för servertjänsten.
Generisk applikation kunde inte hämtas online
denna bildskärm returnerar antalet händelser som inträffar när en generisk applikation inte kunde hämtas online under ett försök att skapa processen på grund av; applikationen finns inte på den här noden, ett felaktigt sökvägsnamn eller ett felaktigt binärt namn.
typ av händelse: fel. Händelse-ID: 1039.
bekräfta att följande gäller för den applikation som används av den grupperade generiska Applikationsinstansen:
- applikationen är helt installerad på alla noder som är möjliga ägare till den generiska Applikationsresursen;
- konfigurationen för den generiska Applikationsresursen anger rätt applikation och sökväg;
- konfigurationen för den generiska Applikationsresursen anger lämpliga parametrar och inställningar för registerreplikation.
Generic Service Resource availability Problems
denna bildskärm returnerar antalet händelser som inträffar när:
- den generiska tjänsten är antingen inte installerad eller det angivna servicenamnet är ogiltigt;
- de angivna parametrarna för generiska tjänster kan vara ogiltiga;
- den generiska tjänsten misslyckades med ett fel.
typ av händelse: fel. Händelse-ID: 1040, 1041, 1042.
bekräfta att rätt tjänst anges i konfigurationen för Generic Service resource och bekräfta att tjänsten är helt installerad på alla noder som är möjliga ägare av resursen.
kontrollera tjänsten drift och undersöka ansökan händelseloggen.
IP-adress Resurstillgänglighetsproblem
denna bildskärm returnerar antalet händelser som inträffar när:
- resursen för klustrets IP-adress kan inte hämtas online eftersom värdet för subnätmask är ogiltigt;
- resursen för klustrets IP-adress kan inte hämtas online eftersom adressvärdet är ogiltigt;
- konfigurationsdata för nätverksadaptern som motsvarar klustrets nätverksgränssnitt kunde inte fastställas;
- resursen för klustrets IP-adress kan inte hämtas online eftersom en dubblett IP-adress upptäcktes i nätverket;
- resursen för klustrets IP-adress kan inte hämtas online eftersom WINS-registrering;
- leasingen av IP-adressen som är associerad med resursen för klustrets IP-adress har gått ut eller håller på att gå ut och kan för närvarande inte förnyas;
- resursen för IPv6-Tunneladress gick inte att komma online eftersom den inte är beroende av en resurs för IP-adress (IPv4);
- Klusternätverket som är associerat med resursen för beroende IP-adress (IPv4) stöder inte ISATAP-tunnling.
typ av händelse: fel. Händelse-ID: 1046, 1047, 1048, 1049, 1078, 1242, 1361, 1363.
kontrollera adress -, delnät-och nätverksegenskaperna för IP-Adressresursen.
om resursen är en IPv6 Tunnel adress resurs, se till att det beror på minst en IP-adress (IPv4) resurs. Se också till att nätverket stöder intra-Site Automatic Tunnel Addressing Protocol (ISATAP) tunneling.
om IP-adressresursen verkar vara korrekt konfigurerad, kontrollera tillståndet för nätverkskort och andra nätverkskomponenter som används av klustret.
nätverksanslutning och konfigurationsproblem
denna bildskärm returnerar antalet händelser som inträffar när:
- klustertjänsten kunde inte komma åt nätverkskortet eller så har klusternoden ingen nätverksanslutning;
- Klusternoden har ingen nätverksanslutning;
- Klusternoden har förlorat all nätverksanslutning;
- den virtuella adaptern för failover-kluster kunde inte initiera miniportadaptern.
typ av händelse: fel. Händelse-ID: 1289, 1553, 1554, 4871.
korrigera eventuella problem med de fysiska nätverksadaptrarna och den virtuella klusteradaptern. Om en tidigare ändring i konfigurationen stör funktionen för den virtuella klusteradaptern kan det vara nödvändigt att installera om funktionen failover clustering på noden. Använd också guiden validera en konfiguration för att granska nätverkskonfigurationen.
Node misslyckades med att gå med i kluster
denna bildskärm returnerar antalet händelser som inträffar när noden misslyckades med att gå med i failover-klustret på grund av ett fel.
typ av händelse: fel. Händelse-ID: 1070.
du kanske kan åtgärda problemet genom att starta om klustertjänsten.
problem med Klustertjänst
denna bildskärm returnerar antalet händelser som inträffar när:
- klusterresursen i den klustrade tjänsten eller programmet misslyckades;
- klustertjänsten kunde inte hämta den klustrade tjänsten eller programmet helt online eller offline och en eller flera resurser kan vara i ett misslyckat tillstånd.
typ av händelse: varning och fel. Händelse-ID: 1039, 1205.
kontrollera och korrigera eventuella problem med applikationen eller tjänsten som är associerad med resursen.
kontrollera och korrigera eventuella problem med kablar eller klusterrelaterade enheter.
justera egenskaperna för resursen i klusterkonfigurationen, särskilt värdet för den väntande Timeout för resursen. Detta värde måste ge tillräckligt med tid för den associerade applikationen eller tjänsten att starta.
kontrollera tillståndet för alla resurser i den grupperade tjänsten eller applikationen.
kvorum förlorades
denna bildskärm returnerar antalet händelser som inträffar när klustertjänsten stängs av eftersom kvorum förlorades.
typ av händelse: fel. Händelse-ID: 1177.
detta kan inträffa när nätverksanslutning går förlorad mellan några eller alla noder i klustret, eller om witness-skivan misslyckas. Det kan också inträffa om du gör en ändring i klusterkonfigurationen, till exempel att öka antalet noder, när antalet noder som för närvarande är online är för få för att uppnå kvorum i den nya konfigurationen. Kör guiden validera en konfiguration och välj bara nätverkstesterna. Kontrollera även nätverksenheter (Adaptrar, kablar, nav, växlar etc.) och kvorumkonfiguration.
Registerkontrollpunkten kunde inte återställas till registernyckeln
den här skärmen returnerar antalet händelser som inträffar när Registerkontrollpunkten för Klusterresursen inte kunde återställas till en registernyckel.
typ av händelse: fel. Händelse-ID: 1024.
stäng alla program som kan ha ett öppet handtag till registret checkpoint anges av händelsen. Detta gör att registernyckeln kan replikeras som konfigurerad med resursegenskaperna. Om det behövs, kontakta programleverantören om detta problem. Du kan använda ett verktyg som heter handtag med alternativet-a för att visa handtag i registret.
systemet svarar inte
denna bildskärm returnerar antalet händelser som inträffar när den virtuella adaptern för Failover-kluster har tappat kontakten med processen.
typ av händelse: fel. Händelse-ID: 4869, 4870.