Pro správce databází, kteří mají na starosti reagovat na výstrahy SQL Serveru ve všech hodinách dne i noci, je pocit přetížení pravděpodobně umocněn neustálým přívalem upozornění, že něco vyžaduje vaši pozornost. ŽE JO. HNED.
Monitorování SQL Serveru je zásadní pro udržení vysoké dostupnosti a sledování problémů s výkonem ve vašem systému a výstrahy jsou nejúčinnějším způsobem, jak zjistit, že problém existuje. Ale je možné mít příliš mnoho dobrých věcí.
Jak se říká:"Když je prioritou vše, prioritou není nic." Únava z upozornění je skutečná a může vést k tomu, že budete ignorovat nebo odmítat události, které negativně ovlivňují vaše uživatele.
Když nastavujete sledování výkonu SQL Serveru, je důležité nakonfigurovat alarmy s vědomím a způsobem, který řídí, kdy, proč a jak často budete dostávat oznámení. Zde jsou čtyři způsoby, jak spravovat výstrahy, které vám pomohou zmírnit přetížení výstrahami a zachránit to, co vám zbylo z rozumu.
1. Vypněte budíky, které nepotřebujete
U mnoha správců databází se to snadněji řekne, než udělá. Při pomyšlení na to, jaké výstrahy přijímat, je cítit malý prvek hrůzy. Naštěstí existuje několik osvědčených postupů, které můžete implementovat a díky kterým bude vaše FOMO o něco méně bolestivé.
Jednou z nejjednodušších věcí, kterou můžete udělat, je zkontrolovat protokoly výstrah a vypnout výstrahy, které jsou chronicky falešnými poplachy nebo falešně pozitivními signály. Je pravděpodobné, že vám neunikne žádný skutečný problém, a váš mozek ocení přestávku od reakcí na zbytečná upozornění.
Další strategie pochází od inženýrů spolehlivosti stránek (SRE) společnosti Google. SRE mají na starosti dostupnost, latenci, výkon, efektivitu, řízení změn, monitorování, reakce na mimořádné události a plánování kapacity.
Týmy SRE mají zaveden systém Alert/Ticket/Log, který minimalizuje přetížení výstrahy tím, že přiřadí reakci na událost, která je založena na tom, jak rychle je vyžadován lidský zásah. Mezi tři možné odpovědi patří:
- Výstraha:Výstraha je odeslána pouze v případě, že osoba musí okamžitě jednat.
- Vstupenka:Pokud událost vyžaduje akci ze strany osoby, ale může počkat na běžnou pracovní dobu, je odeslána vstupenka a prochází normálními kanály.
- Protokol:Pokud není vyžadována žádná akce, událost se zaprotokoluje pro diagnostiku.
2. Pomocí inteligentních alarmů se rychle dostanete ke kořenové příčině výstrahy
Když váš telefon vybuchne s upozorněním ve 3:00, nechcete strávit hodinu šťoucháním, abyste problém vyřešili.
Inteligentní alarmy vám nejen sdělí, že máte problém, ale také navrhnou způsoby, jak jej vyřešit, a pomohou vám identifikovat hlavní příčinu. Inteligentní alarmy také poskytují historická data o události, takže víte, co se stalo bezprostředně před a po spuštění výstrahy.
3. Upřednostněte svá upozornění, abyste identifikovali nejnaléhavější problémy
Všechna upozornění nejsou vytvořena stejně, takže je důležité nakonfigurovat nástroj pro sledování výkonu SQL Server tak, aby odesílal upozornění pouze na nejdůležitější problémy. Upřednostněním výstrah podle úrovně závažnosti, dopadu na firmu nebo zákazníky a podle toho, zda je vyžadována okamžitá akce, eliminujete část hluku generovaného výstrahami, které nejsou kritické.
Zaměřte se na nastavení upozornění na problémy, které mohou způsobit přepnutí vašich serverů do režimu offline, vážné poškození dat nebo významnou ztrátu dat (tj. závažnost 17 nebo vyšší a chybové zprávy 823, 824 a 825).
4. Spravujte alarmy použitím konkrétních prahových hodnot a pravidel
Nastavení prahových hodnot a pravidel je obrovskou úsporou zdravého rozumu, protože vám pomůže vyhnout se bombardování několika výstrahami v krátkém čase.
Když definujete prahové hodnoty výkonu, SQL Server vás upozorní, dokud hodnota pro zadanou metriku nedosáhne příslušné úrovně – například volné místo na disku nebo volné fyzické paměti jsou nebezpečně nízké. DBA tak mohou pracovat na jiných úkolech bez neustálého sledování metrik.
Nastavení pravidel pro výstrahy vám umožňuje přizpůsobit akce, například jak často chcete být upozorňováni. Můžete například nastavit SQL Server tak, aby odeslal upozornění pouze v případě, že zadaná výstraha byla spuštěna čtyřikrát nebo pokud výstraha obsahuje určitý databázový objekt nebo jméno uživatele.
S tím, jak se DBA začínají po COVID-19 orientovat v novém a velmi odlišném podnikatelském prostředí, úroveň stresu určitě poroste. Velkou prioritou zůstane udržení vysoké dostupnosti a zajištění bezpečnosti a optimálního výkonu vašich systémů SQL Server. Nyní je však vhodný čas využít možnosti monitorování SQL Serveru, abyste převzali kontrolu nad konfiguracemi výstrah a zbavili se zbytečného hluku.