MON Hjælp til servicedefinitioner Dette er andet og sidste trin for MON-konfiguration.
Standardværdier vises for de obligatoriske tjenester . Se det respektive hjælpeemne herunder for mere hjælp til servicedefinitionerne. For "mail.alert" skal du sikre dig, at sendmail er konfigureret, og "sendmail" deamon startes på værtsmaskinen.
Servicedefinitioner
- tjeneste tjenestenavn
- En servicedefinition begynder med, at de søgeordstjeneste , efterfulgt af et ord, der er mærket for denne tjeneste.
Komponenterne i en tjeneste er en interval-, monitor- og en eller flere tidsperiode-definitioner som defineret nedenfor.
Hvis et servicenavn "standard" er defineret i en overvågningsgruppe kaldet "dafault" (se ovenfor), bruges standard / standarddefinitionen til håndtering af ukendte mon fælder.
- interval timeval
- Nøgleordets interval efterfulgt af en tidsværdi specificerer hyppigheden af, at et skærmscript udløses. Tidsværdier er defineret som "30s", "5m", "1h" eller "1d", hvilket betyder 30 sekunder, 5 minutter, 1 time eller 1 dag. Den numeriske del kan være en brøkdel, såsom "1,5 time" eller en og en halv time. Dette format af en tidsspecifikation vil blive omtalt som tidseval .
- tid for traptimeout
- Dette nøgleord tager samme tidsspecifikationsargument som interval , og får tjenesten til at forvente en fælde fra en ekstern kilde i det mindste ofte, ellers registreres der en fejl. Dette bruges til en service med hjerteslag.
- trapduration timeval
- Hvis der modtages en fælde, forbliver status for den service, som fælden blev leveret til, normalt konstant. Hvis trapduration er specificeret, forbliver tjenestens status i en fiaskustilstand i den varighed, der er specificeret af tidsperioden , og derefter nulstilles den til "succes".
- randskew timeval
- I stedet for at planlægge monitorskriptet til at køre i starten af hvert interval, skal du tilfældigt justere det interval, der er specificeret af intervalparameteren med plus-eller-minus randskew. Skævværdien er specificeret som intervalparameteren : "30s", "5m" osv. ... For eksempel hvis intervallet er 1m, og randskew er "5s", planlægger mon derefter monitorskriptet et stykke tid mellem hvert 55 sekund og 65 sekunder. Hensigten er at hjælpe med at fordele belastningen på serveren, når mange tjenester er planlagt med de samme intervaller.
- monitor monitor-navn [arg ...]
- Nøgleordet skærm efterfulgt af et script navn og argumenter Angiver skærmen til at køre, når timeren udløber. Shell-lignende citatkonventioner følges, når du specificerer de argumenter, der skal sendes til monitorskriptet. Skriptet påberåbes fra det bibliotek, der er givet med -s- argumentet, og alle følgende ord leveres som argumenter til monitorprogrammet, efterfulgt af listen over værter i den gruppe, der er omtalt af den aktuelle overvågningsgruppe. Hvis monitorlinjen slutter med ";;" som et separat ord føjes værtsgrupperne ikke til argumentlisten, når programmet kaldes op.
- allow_empty_group
- Indstillingen allow_empty_group tillader, at en skærm aktiveres, selv når værtsgruppen for dette ur er tom på grund af deaktiverede værter. Standardadfærden er ikke at påkalde skærmen, når alle værter i en værtsgruppe er deaktiveret.
- beskrivelse beskrivelse tekst
- Teksten, der følger, beskrives ved hjælp af klientprogrammer, sendes til advarsler og skærme via en miljøvariabel. Den skal indeholde en kort beskrivelse af tjenesten, der er velegnet til optagelse i en e-mail eller på en webside.
- ekskluder_hosts vært [vært ...]
- Eventuelle værter, der er anført efter exclude_hosts, vil blive ekskluderet fra servicecheck.
- ekskluder periodeperiode
- Kør ikke en planlagt skærm i den periode, der er identificeret med periodspec .
- afhænger af afhængighed
- Det afhængige nøgleord bruges til at specificere et afhængighedsudtryk, der evalueres til enten sandt for usant, i boolsk forstand. Afhængigheder er faktiske Perl-udtryk og skal overholde alle syntaktiske regler. Udtrykkene evalueres i deres eget pakkerum for ikke at have en uønsket bivirkning ved et uheld. Hvis der findes en syntaksfejl ved evaluering af udtrykket, logges det via syslog.
Før evaluering forekommer følgende substitutioner på udtrykket: sætninger, der ligner "gruppe: service", erstattes med værdien af den aktuelle driftsstatus for den specificerede tjeneste. Disse opstatus-substitutioner beregnes rekursivt, så hvis service A afhænger af service B, og service B afhænger af service C, afhænger service A af service C. Vellykkede driftsstatus (som vurderer til "1") er "STAT_OK", "STAT_COLDSTART "," STAT_WARMSTART "og" STAT_UNKNOWN ". Ordet "SELF" (i alle kasketter) kan bruges til gruppen (f.eks. "SELF: service") og er en forkortelse for den aktuelle uregruppe.
Denne funktion kan bruges til at styre alarmer for tjenester, der er afhængige af andre tjenester, f.eks. En SMTP-test, der er afhængig af, at maskinen kan nås til ping.
- dep_behavior {a | m}
- Evalueringen af afhængighedsgrafer kan kontrollere undertrykkelsen af enten alarm eller overvåge påkaldelser.
Undertrykkelse af alarm . Hvis denne indstilling er indstillet til "a", evalueres afhængighedsudtrykket efter monitoren for tjenesteudgangen eller efter modtagelse af en fælde. Der sendes kun en advarsel, hvis evalueringen lykkes, hvilket betyder, at ingen af knudepunkterne i afhængighedsgrafen indikerer fiasko.
Overvåg undertrykkelse . Hvis det er indstillet til "m", vil afhængighedsudtrykket blive undgået, før monitoren for tjenesten er ved at køre. Hvis evakueringen lykkes, køres monitoren. Ellers køres monitoren ikke, og status for tjenesten forbliver den samme.
Periode Definitioner
Perioder bruges til at definere betingelserne, der skal give mulighed for at blive leveret.
- periode [label:] periodspec
- En periode grupperer en eller flere alarmer og variabler, der kontrollerer, hvor ofte en alarm sker, når der er en fejl. Periode nøgleordet har to former. Den første tager et argument, som er en periodespecifikation fra Patrick Ryan's Time :: Period Perl 5-modul. Se "perldoc Time :: Period" for mere information.
Den anden form kræver en etiket efterfulgt af en periodespecifikation som defineret ovenfor. Etiketten er et mærke, der består af et alfabetisk tegn eller understreg efterfulgt af nul eller flere alfanumeriske eller understregede og slutter med et kolon. Denne form muliggør flere perioder med den samme periodedefinition. Én anvendelse er at have en periodedefinition, der ikke har nogen altertafter eller alertevery- parametre for en bestemt tidsperiode, og en anden for den samme tidsperiode med et andet sæt advarsler, der indeholder disse parametre.
- alertevery tid
- Alertevery- nøgleordet (inden for en periode- definition) tager den samme type argument som intervalvariablen og begrænser antallet af gange en alarm sendes, når tjenesten fortsætter med at mislykkes. For eksempel, hvis intervallet er "1 t", udløses kun advarslerne i periodesektionen kun en gang hver time. Hvis nøgleordet alertevery udelades i en periodeindgang, sendes en advarsel, hver gang en fejl opdages. Hvis output fra to på hinanden følgende fejl ændres som standard, tilsidesættes alertevery-intervallet som standard. Hvis ordet "resume" er det sidste argument, overvejes kun de sammendragte outputlinjer, når man sammenligner output fra successive fejl.
- alertafter num
- alertafter num timeval
- Det andet søgeord (inden for et periodesektion ) har to former: kun med argumentet "num" eller med "num timeval" argumenter. I den første form oprettes en alarm først efter "num" sammenhængende fejl.
I den anden form er argumenterne et positivt heltal efterfulgt af et interval som beskrevet af intervalvariablen ovenfor. Hvis disse parametre er specificeret, kaldes advarslerne for den periode kun, efter at der opstår mange fejl inden for dette interval. For eksempel, hvis der efterfølgende gives argumenterne "3 30m", kaldes alarmen, hvis 3 fejl opstår inden for 30 minutter.
- numalerts num
Denne variabel fortæller serveren at ikke ringe til mere end num alarm under en fejl. Alarmtælleren holdes på en periode og nulstilles efter hver succes.
- comp_alerts
Hvis denne indstilling er specificeret, kaldes upalerts kun, hvis der er kaldt en tilsvarende "down" -alarm.
- alarm alarm [arg ...]
- En periode kan indeholde flere alarmer, der udløses ved fejl i tjenesten. En alarm er angivet med advarslen søgeord, efterfulgt af en valgfri exit parmeter, og argumenter, som fortolkes på samme måde som den definition-skærm, men uden ";;" undtagelse. Udgangen parameter tager form af exit = x eller exit = xy og har den virkning, at indberetningen kun kaldes, hvis exit status på skærmen scriptet falder inden for området af exit parameter. Hvis for eksempel alarmlinjen er alarm exit = 10-20 mail.alert mis, bliver mail-alarm kun aktiveret med mis som dens argumenter, hvis monitorprogrammets exit værdi er mellem 10 og 20. Denne funktion giver dig mulighed for at udløse forskellige alarmer på forskellige sværhedsniveauer (som når ledig diskplads går fra 8% til 3%).
Se afsnittet ALERT PROGRAMMER ovenfor for at få en liste over prametre, der automatisk overgår til alarmprogrammer.
- upalert alarm [arg ...]
- En upalert er komplimentet med en alarm . En upalert kaldes, når en serviceydelser foretager staten overgangen fra fiasko til succes. Den upalert script kaldet levere de samme parametre som alarm script, med tilføjelse af den -u parameter, som blot bruges til at lade en alarm script ved, at det bliver kaldt som en upalert. Flere upalerts kan specificeres for hver periodedefinition. Bemærk, at standardopførselen er, at en upalert vil blive sendt uanset om der var sendt nogen forudgående "down" -alarmer, da upalerts udløses ved en statusovergang. Angiv indstillingen per periode for comp_alerts til at parre upalerts med "ned" -alarmer.
- startupalert alarm [arg ...]
- En startupalert kaldes kun, når mon- serveren starter udførelsen.
- upalertafter tidsperioden
- Parameteren upalertafter er specificeret som en streng, der følger syntaks for intervalparameteren ("30s", "1m" osv.) Og styrer udløsningen af en upalert . Hvis en tjeneste kommer op igen efter at have været nede i en tid, der er større end eller lig med værdien af denne indstilling, kaldes en upalert . Brug denne indstilling til at forhindre, at der opkaldes for ophæng på grund af "blips" (korte afbrydelser)