Microsoft 2008 Failover Cluster

denne skabelon vurderer status og den samlede ydeevne for en Microsoft 2008 Failover Cluster ved at hente oplysninger fra ydelsestællere og hændelsesloggen. Du kan finde flere oplysninger i følgende Microsoft-artikel: http://technet.microsoft.com/en-us/library/cc720058%28WS.10%29.aspx.

forudsætninger

adgang til målserveren.

legitimationsoplysninger

vinduer Administrator på målserveren.

alle vinduer hændelseslog skærme skal returnere nul værdier. Returnerede værdier bortset fra nul indikerer en abnormitet. Undersøgelse af vinduer system logfiler bør give oplysninger vedrørende problemet. Detaljerede oplysninger om disse begivenheder kan findes her: http://technet.microsoft.com/en-us/library/dd353290(vs.10).asp.

Komponentmonitorer

Klik her for en oversigt over Sam-applikationsmonitorskabeloner og komponentmonitorer. SAM API Poller skabeloner er også tilgængelige.

du skal indstille tærskler for tællere i henhold til dit miljø. Det anbefales at overvåge tællere i et stykke tid for at forstå potentielle værdiområder og derefter indstille tærsklerne i overensstemmelse hermed.

Service: vinduer tid

denne skærm returnerer CPU og hukommelsesforbrug af vinduer tid tjeneste. Denne service opretholder dato-og tidssynkronisering på alle klienter og servere i netværket. Hvis denne tjeneste stoppes, vil synkronisering af dato og klokkeslæt ikke være tilgængelig. Hvis denne tjeneste er deaktiveret, vil alle tjenester, der udtrykkeligt er afhængige af den, ikke starte.

Service: Cluster Service

denne skærm returnerer CPU og hukommelsesforbrug af Cluster service. Denne service gør det muligt for servere at arbejde sammen som en klynge for at holde serverbaserede applikationer meget tilgængelige, uanset individuelle komponentfejl. Hvis denne tjeneste er stoppet, vil clustering være utilgængelig. Hvis denne tjeneste er deaktiveret, vil alle tjenester, der udtrykkeligt er afhængige af den, ikke starte.

netværkstilslutninger: Tilslut Antal

denne skærm returnerer det antal gange, noderne har tilsluttet igen.

forekomstfeltet er installationsspecifikt. Du skal angive værtsnavnet på din klyngenode (for eksempel: node1). Som standard er denne komponentmonitor deaktiveret og bør kun aktiveres til fejlfindingsformål.

netværkstilslutninger: normal Meddelelseskølængde

denne skærm Returnerer antallet af normale meddelelser, der er i køen og venter på at blive sendt. Normalt er dette nummer 0, men hvis TCP-forbindelsen går i stykker, kan du observere, at den går op, indtil TCP-forbindelsen er genoprettet, og vi kan sende dem alle igennem.

forekomstfeltet er installationsspecifikt. Du skal angive værtsnavnet på din klyngenode (for eksempel: node1). Som standard er denne komponentmonitor deaktiveret og bør kun aktiveres til fejlfindingsformål.

netværkstilslutninger: haster Message kø Længde

denne skærm Returnerer antallet af haster beskeder, der er i køen venter på at blive sendt. Normalt er dette nummer 0, men hvis TCP-forbindelsen går i stykker, kan du observere, at den går op, indtil TCP-forbindelsen er genoprettet, hvorved alle meddelelser kan sendes.

forekomstfeltet er installationsspecifikt. Du skal angive værtsnavnet på din klyngenode (for eksempel: node1). Som standard er denne komponentmonitor deaktiveret og bør kun aktiveres til fejlfindingsformål.

beskeder udestående

denne skærm Returnerer antallet af klynge MRR udestående meddelelser. Den returnerede værdi skal være nær nul.

Resource Control Manager: Groups Online

denne skærm Returnerer antallet af online klyngeressourcegrupper på denne node. Den returnerede værdi skal altid være over nul.

Resource Control Manager: RHS-processer

denne skærm Returnerer antallet af kørende resource host-undersystemprocesser (rhs.eks). Den returnerede værdi skal altid være over nul.

Resource Control Manager: RHS genstarter

denne skærm Returnerer antallet af resource host delsystem proces (rhs.genstarter.

denne komponentmonitor er som standard deaktiveret og bør kun aktiveres til fejlfindingsformål.

ressourcer: Ressourcefejl

denne skærm Returnerer antallet af ressourcefejl. Den returnerede værdi skal være så lav som muligt.

ressourcer: Ressourcefejl Adgangsovertrædelse

denne skærm Returnerer antallet af ressourcefejl forårsaget af adgangsovertrædelse. Den returnerede værdi skal være så lav som muligt.

denne komponentmonitor er som standard deaktiveret og bør kun aktiveres til fejlfindingsformål.

ressourcer: Ressourcefejl Deadlock

denne skærm Returnerer antallet af ressourcefejl forårsaget af deadlock. Deadlocks skyldes normalt, at ressourcen tager for lang tid at udføre visse operationer. Den returnerede værdi skal være så lav som muligt.

denne komponentmonitor er som standard deaktiveret og bør kun aktiveres til fejlfindingsformål.

problemer med sikkerhedskopiering og gendannelse af funktionalitet

denne skærm Returnerer antallet af hændelser, der opstår, når:

    • sikkerhedskopieringen af klyngekonfigurationsdataene er afbrudt, fordi kvorum for klyngen endnu ikke er opnået;
    • gendannelsesanmodningen for klyngekonfigurationsdataene er mislykket under “pre-restore” eller “post-restore” – fasen.

type begivenhed: fejl. Begivenhed-ID: 1541, 1542, 1543.

kontroller for følgende forudsætninger for at sikre, at de er opfyldt, og prøv derefter backup-eller gendannelsesoperationen igen:

    • klyngen skal opnå beslutningsdygtighed. Med andre ord skal nok noder køre og kommunikere (måske med en vidnedisk eller vidnefildeling, afhængigt af kvorumskonfigurationen), at klyngen har opnået et flertal, det vil sige kvorum.
    • den konto, der bruges af den person, der udfører sikkerhedskopien, skal være i gruppen lokale administratorer på hver grupperet server og skal være en domænekonto eller skal være delegeret den tilsvarende myndighed.
    • under en gendannelse skal gendannelsesprogrammet opnå eksklusiv adgang til klyngekonfigurationsdatabasen på en given node. Hvis andre programmer har adgang (åbne håndtag til databasen), kan gendannelsen ikke udføres.

problemer med Klyngenetværksforbindelse

denne skærm Returnerer antallet af hændelser, der opstår, når:

  • klyngenetværksgrænsefladen for en eller anden klyngeknude på et specielt netværk mislykkedes;
  • Klyngenetværket er partitioneret, og nogle vedhæftede failover-klyngenoder kan ikke kommunikere med hinanden over netværket;
  • Klyngenetværket er nede;
  • klyngens IP-adresseressource kunne ikke komme online;
  • forsøg på at bruge IPv4 til en særlig netværksadapter mislykkedes.

type begivenhed: advarsel og fejl. Event ID: 1127, 1129, 1130, 1360, 1555.

Kør guiden Valider en konfiguration, og vælg kun netværkstestene. Kontroller også netværksenheder (adaptere, kabler, nav, kontakter osv.) og kvorumskonfiguration.

Sammenlign egenskaberne for IP-Adresseressourcen med egenskaberne for det tilsvarende netværk for at sikre, at netværket og undernetoplysningerne stemmer overens. Hvis dette er en IPv6-ressource, skal du sørge for, at klyngenetværket for denne ressource har mindst et IPv6-præfiks, der ikke er link-local eller tunnel.

problemer med opstart af Cluster Service

denne skærm Returnerer antallet af hændelser, der opstår, når:

  • Klyngetjenesten LED en uventet fatal fejl;
  • Klyngetjenesten blev stoppet på grund af ufuldstændig forbindelse med andre klyngenoder;
  • Klyngetjenesten blev stoppet for at forhindre en inkonsekvens inden for failover-klyngen;
  • cluster resource host subsystem (RHS) stoppede uventet;
  • Cluster resource enten styrtede ned eller fastlåst;
  • Cluster service stødte på et uventet problem og vil blive lukket ned;
  • Cluster service har forhindret sig i at starte på denne node. (Denne node har ikke den seneste kopi af klyngekonfigurationsdata.)
  • medlemskabsmotoren opdagede, at voldgiftsprocessen for kvorumsenheden er gået i stå.

type begivenhed: fejl. Event ID: 1000, 1006, 1073, 1146, 1230, 1556, 1561, 1178.

der er forskellige program-eller maskinrelaterede årsager, der kan forhindre, at Klyngetjenesten starter på en node. Nogle gange kan Klyngetjenesten genstarte med succes, efter at den er blevet afbrudt af en af disse årsager. Gennemgå hændelseslogfilerne for at få indikationer på problemet.

Tjek netværks udstyr og konfiguration. Brug guiden Valider en konfiguration til at gennemgå netværkskonfigurationen.

Kontroller, hvilken ressource DLL der forårsager problemet, og rapporter problemet til ressourceleverandøren. Overvej at konfigurere ressourcen til at køre i sin egen Ressourcemonitor. Bemærk, at mens et problem med en ressource-DLL ikke forhindrer Cluster-tjenesten i at køre, kan den forhindre, at andre ressource-DLL ‘ er kører, medmindre ressourcen kører i sin egen Ressourcemonitor.

prøv at starte Klyngetjenesten på alle andre noder i klyngen. Hvis Klyngetjenesten kan startes på en node med den nyeste kopi af klyngekonfigurationsdataene, vil den node, der tidligere ikke kunne startes, sandsynligvis være i stand til at få den nyeste kopi og derefter slutte sig til klyngen med succes.

problemer med Cluster Shared Volume-funktionalitet

denne skærm Returnerer antallet af hændelser, der opstår, når:

  • Cluster Shared Volume er ikke længere tilgængelig på denne node;
  • Cluster Shared Volume er ikke længere direkte tilgængelig fra denne cluster node;
  • Cluster service kunne ikke oprette Cluster Shared Volumes root directory;
  • Cluster service kunne ikke indstille tilladelserne (ACL) på Cluster Shared Volumes root directory;
  • Cluster Shared Volume er ikke længere tilgængelig fra denne cluster node;
  • Cluster service kunne ikke oprette et cluster identity token for Cluster Shared Volumes.

type begivenhed: fejl. Event ID: 5120, 5121, 5123, 5134, 5135, 5142, 5200.

gennemgå begivenheder relateret til kommunikation med lydstyrken.

kontroller opbevaring og netværkskonfiguration.

kontroller Cluster Shared Volumes mappeoprettelse og tilladelser.

kontroller kommunikationen mellem domænecontrollere og noder.

problemer med Klyngelagringsfunktionalitet

denne skærm Returnerer antallet af hændelser, der opstår, når:

  • klyngens fysiske Diskressource kan ikke bringes online, fordi den tilknyttede disk ikke kunne findes;
  • mens diskressourcen blev bragt online, mislykkedes adgang til en eller flere volumener med en fejl;
  • filsystemet til en eller flere partitioner på disken til ressourcen kan være korrupt;
  • Klyngediskressourcen indikerer korruption for bestemt lydstyrke;
  • Cluster disk resource indeholder et ugyldigt monteringspunkt.

type begivenhed: fejl. Event ID: 1034, 1035, 1037, 1066, 1208.

Bekræft, at den berørte disk er tilgængelig.

Kontroller det underliggende lagringsudstyr, og bekræft, at enheden præsenteres korrekt for klyngenoderne.

hvis du har problemer med partitioner på disken eller korruption, anbefaler vi, at du kører Chkdsk, så det kan rette eventuelle problemer med filsystemet.

Bekræft, at den monterede disk er konfigureret i henhold til følgende retningslinjer:

klyngede diske kan kun monteres på klyngede diske (ikke lokale diske);

den monterede disk og den disk, den er monteret på, skal være en del af den samme klyngetjeneste eller applikation. De kan ikke være i to forskellige grupperede tjenester eller applikationer, og de kan ikke være i den generelle pulje af tilgængelig lagerplads i klyngen.

Klyngevidneproblemer

denne skærm Returnerer antallet af hændelser, der opstår, når:

  • Klyngetjenesten kunne ikke opdatere klyngekonfigurationsdataene på vidneressourcen på grund af ressourcetilgængelighed;
  • Klyngetjenesten opdagede et problem med vidneressourcen;
  • fildeling Vidneressource mislykkedes en periodisk sundhedskontrol;
  • fildeling Vidneressource kunne ikke komme online;
  • fildeling Vidneressource kunne ikke mægle for den specifikke fildeling;
  • noden kunne ikke danne en klynge, fordi vidnet ikke var tilgængeligt.

type begivenhed: fejl. Event ID: 1557, 1558, 1562, 1563, 1564, 1573.

Bekræft vidne tilgængelighed ved at se beslutningsdygtig konfiguration af en failover klynge og status for et vidne disk.

problemer med Konfigurationstilgængelighed

denne skærm Returnerer antallet af hændelser, der opstår, når:

  • cluster configuration database kunne ikke indlæses eller losses;
  • cluster service kan ikke starte på grund af mislykkede forsøg på at læse konfigurationsdata.

type begivenhed: fejl. Event ID: 1057, 1090, 1574, 1575, 1593.

når klyngekonfigurationen på en node mangler eller er beskadiget, kan Klyngetjenesten ikke indlæse konfigurationen og kan derfor ikke starte. Hvor det er muligt, får Klyngetjenesten den nyeste klyngekonfiguration fra andre noder i klyngen. Sørg for, at andre noder startes. Hvis den eneste node eller noder, der kan startes, ser ud til at have en manglende eller korrupt klyngekonfigurationsdatabase, bliver du sandsynligvis nødt til at gendanne en af noderne fra en systemtilstandsbackup. (For en failover cluster node, system state backup omfatter klynge konfiguration.) Nogle gange, når noden forsøger at aflæse klyngekonfigurationsdatabasen, udføres handlingen ikke fuldt ud. Prøv at stoppe og genstarte Cluster-tjenesten. Hvis dette ikke lykkes, skal du genstarte operativsystemet på den berørte node.

DFS navneområde problemer med ressourcetilgængelighed

denne skærm Returnerer antallet af hændelser, der opstår, når:

  • oprettelsen af DFS namespace root mislykkedes med fejl;
  • resynkroniseringen af DFS root target mislykkedes med fejl;
  • cluster file share resource for DFS Namespace kan ikke bringes online på grund af fejl.

type begivenhed: fejl. Begivenhed ID: 1138, 1141, 1142.
Tjek DFS namespace konfiguration.

krypterede Indstillinger for Klyngeressource kunne ikke anvendes

denne skærm Returnerer antallet af hændelser, når krypterede indstillinger for en klyngeressource ikke kunne anvendes korrekt på containeren på denne node.

type begivenhed: fejl. Begivenhed ID: 1121.

Luk ethvert program, der muligvis har et åbent håndtag til det registerkontrolpunkt, der er angivet af begivenheden. Dette gør det muligt at replikere registreringsnøglen som konfigureret med ressourceegenskaberne. Kontakt om nødvendigt applikationsleverandøren om dette problem. Du kan bruge et værktøj kaldet håndtag med-A mulighed for at se håndtag til registreringsdatabasen.

kunne ikke danne klynge

denne skærm Returnerer antallet af ikke dannede klyngehændelser.

type begivenhed: fejl. Begivenhed ID: 1092, 1009.

du kan muligvis løse dette problem ved at genstarte Cluster-tjenesten.

problemer med fildeling af ressourcetilgængelighed

denne skærm Returnerer antallet af hændelser, der opstår, når:

  • klyngen fildeling kan ikke bringes online, fordi en fildeling ikke kunne oprettes;
  • hentning af oplysninger til en bestemt aktie returnerede en fejlkode;
  • hentning af oplysninger til en bestemt aktie angav, at aktien ikke findes;
  • oprettelsen af en fildeling mislykkedes på grund af en fejl;
  • Cluster file share resource har registreret delte mappekonflikter;
  • Cluster file server resource mislykkedes en sundhedskontrol, fordi nogle af dens delte mapper var utilgængelige.

type begivenhed: advarsel og fejl. Event ID: 1053, 1054, 1055, 1068, 1560, 1585, 1586, 1587, 1588.

Bekræft, at aktien eksisterer, og at tilladelserne tillader adgang til aktien.

hvis det er muligt, skal du afgøre, om stien til aktien er blevet ændret. I så fald skal du genskabe delingen med det rigtige navn.

se alle ressourcerne i den grupperede filserverforekomst for at sikre, at de kommer online, og gennemgå afhængighederne blandt ressourcerne. Omkonfigurere efter behov for at rette eventuelle problemer.

sørg for, at ikke to delte mapper har samme delenavn.

Kontroller tilgængeligheden af delt mappe og tilstanden for Servertjenesten.

generisk applikation kunne ikke bringes Online

denne skærm Returnerer antallet af hændelser, der opstår, når en generisk applikation ikke kunne bringes online under et forsøg på at oprette processen på grund af; applikationen er ikke til stede på denne node, et forkert stinavn eller et forkert binært navn.

type begivenhed: fejl. Begivenhed ID: 1039.

Bekræft, at følgende gælder for den applikation, der bruges af den klyngede generiske Applikationsinstans:

  • applikationen er fuldt installeret på alle noder, der er mulige ejere af den generiske Applikationsressource;
  • konfigurationen for den generiske Applikationsressource angiver den korrekte applikation og sti;
  • konfigurationen for den generiske Applikationsressource angiver de relevante parametre og indstillinger for registreringsreplikation.

generiske problemer med Tilgængelighed af serviceressourcer

denne skærm Returnerer antallet af hændelser, der opstår, når:

  • den generiske tjeneste er enten ikke installeret, eller det angivne servicenavn er ugyldigt;
  • de angivne generiske serviceparametre kan være ugyldige;
  • den generiske tjeneste mislykkedes med en fejl.

type begivenhed: fejl. Begivenhed ID: 1040, 1041, 1042.

Bekræft, at den korrekte tjeneste er angivet i konfigurationen for den generiske serviceressource, og bekræft, at tjenesten er fuldt installeret på alle noder, der er mulige ejere af ressourcen.

tjek service drift og undersøge ansøgningen hændelseslog.

problemer med Tilgængelighed af IP-adresse

denne skærm Returnerer antallet af hændelser, der opstår, når:

  • klyngens IP-adresseressource kan ikke bringes online, fordi undernetmaskeværdien er ugyldig;
  • klyngens IP-adresseressource kan ikke bringes online, fordi adresseværdien er ugyldig;
  • konfigurationsdataene for netværksadapteren svarende til klyngenetværksgrænsefladen kunne ikke bestemmes;
  • klyngens IP-adresseressource kan ikke bringes online, fordi der blev registreret en duplikat IP-adresse på netværket;
  • klyngens IP-adresseressource kan ikke bringes online, fordi vinder registrering;
  • leasing af den IP-adresse, der er knyttet til klyngen IP-adresseressource, er udløbet eller er ved at udløbe og kan i øjeblikket ikke fornyes;
  • IPv6-Tunneladresseressourcen kunne ikke komme online, fordi den ikke afhænger af en IP-adresse (IPv4) ressource;
  • Klyngenetværket, der er knyttet til afhængig IP-adresse (IPv4) ressource, understøtter ikke ISATAP-tunneling.

type begivenhed: fejl. Event ID: 1046, 1047, 1048, 1049, 1078, 1242, 1361, 1363.

kontroller IP-Adresseressourcens adresse, undernet og netværksegenskaber.

hvis ressourcen er en IPv6-Tunneladresseressource, skal du sørge for, at den afhænger af mindst en IP-adresse (IPv4) ressource. Sørg også for, at netværket understøtter intra-Site automatisk Tunnel adressering protokol (ISATAP) tunneling.

hvis IP-Adresseressourcen ser ud til at være konfigureret korrekt, skal du kontrollere tilstanden for netværkskort og andre netværkskomponenter, der bruges af klyngen.

problemer med netværksforbindelse og konfiguration

denne skærm Returnerer antallet af hændelser, der opstår, når:

  • Klyngetjenesten kunne ikke få adgang til netværksadapteren, eller klyngenoden har ingen netværksforbindelse;
  • Klyngenoden har ingen netværksforbindelse;
  • Klyngenoden har mistet al netværksforbindelse;
  • failover cluster virtual adapter kunne ikke initialisere miniportadapteren.

type begivenhed: fejl. Begivenhed-ID: 1289, 1553, 1554, 4871.

ret eventuelle problemer med de fysiske netværkskort og cluster virtual adapter. Hvis en tidligere ændring i konfigurationen forstyrrer funktionen af cluster virtual adapter, kan det være nødvendigt at geninstallere failover clustering-funktionen på noden. Brug også guiden Valider en konfiguration til at gennemgå netværkskonfigurationen.

Node kunne ikke deltage i klyngen

denne skærm Returnerer antallet af hændelser, der opstår, når noden ikke kunne deltage i failover-klyngen på grund af en fejl.

type begivenhed: fejl. Begivenhed ID: 1070.

du kan muligvis løse dette problem ved at genstarte Cluster-tjenesten.

problemer med Cluster Service

denne skærm Returnerer antallet af hændelser, der opstår, når:

  • klyngeressourcen i den klyngede tjeneste eller applikation mislykkedes;
  • Klyngetjenesten kunne ikke bringe den klyngede tjeneste eller applikation helt online eller offline, og en eller flere ressourcer kan være i en mislykket tilstand.

type begivenhed: advarsel og fejl. Begivenhed-ID: 1039, 1205.

kontroller og ret eventuelle problemer med applikationen eller tjenesten, der er knyttet til ressourcen.

kontroller og ret eventuelle problemer med kabler eller klyngerelaterede enheder.

Juster egenskaberne for ressourcen i klyngekonfigurationen, især værdien for den ventende Timeout for ressourcen. Denne værdi skal give tilstrækkelig tid til, at den tilknyttede applikation eller tjeneste kan starte.
Kontroller tilstanden af alle ressourcer i den grupperede tjeneste eller applikation.

kvorummet er tabt

denne skærm Returnerer antallet af hændelser, der opstår, når Klyngetjenesten lukker ned, fordi kvorummet er tabt.

type begivenhed: fejl. Event ID: 1177.

dette kan forekomme, når netværksforbindelsen går tabt mellem nogle eller alle knudepunkter i klyngen, eller vidndisken mislykkes. Det kan også forekomme, hvis du foretager en ændring i klyngekonfigurationen, såsom at øge antallet af noder, når antallet af noder, der i øjeblikket er online, er for få til at opnå beslutningsdygtighed i den nye konfiguration. Kør guiden Valider en konfiguration, og vælg kun netværkstestene. Kontroller også netværksenheder (adaptere, kabler, nav, kontakter osv.) og beslutningsdygtig konfiguration.

Registry Checkpoint kunne ikke gendannes til registreringsnøgle

denne skærm Returnerer antallet af hændelser, der opstår, når Registry Checkpoint for Cluster resource ikke kunne gendannes til en registreringsnøgle.

type begivenhed: fejl. Begivenhed ID: 1024.

Luk ethvert program, der muligvis har et åbent håndtag til det registerkontrolpunkt, der er angivet af begivenheden. Dette gør det muligt at replikere registreringsnøglen som konfigureret med ressourceegenskaberne. Kontakt om nødvendigt applikationsleverandøren om dette problem. Du kan bruge et værktøj kaldet håndtag med-A mulighed for at se håndtag til registreringsdatabasen.

systemet reagerer ikke

denne skærm Returnerer antallet af hændelser, der opstår, når Failover cluster virtual adapter har mistet kontakten med processen.

type begivenhed: fejl. Begivenhed-ID: 4869, 4870.

Write a Comment

Din e-mailadresse vil ikke blive publiceret.