sql >> Databáze >  >> RDS >> Oracle

Hodnota dat v čase

Dnes už každý ví, že data jsou velmi cenná. Velké korporace používají data k rozhodování, která, doufejme, posouvají podnikání vpřed a dosahují vyšší úrovně ziskovosti. Jako správci databází chráníme údaje, zejména osobní údaje (PII). Systémy jsou hacknuty, aby získaly data. Data mají velkou hodnotu a museli byste žít pod pověstnou skálou, abyste se to dnes naučili.

O čem čtu jen zřídka a předmětem tohoto blogového příspěvku je, jak se hodnota dat mění v čase. Hodnota dat by měla být použita k řízení vašich zásad uchovávání.

Většina dat ztrácí svou hodnotu, čím jsou starší. Nedávno jsem pracoval na projektu týkajícím se výkonu aplikace a metrik, které zachycujeme pro měření tohoto výkonu. Někteří lidé na projektu chtěli tyto metriky ponechat déle než pět let. Promluvil jsem a oznámil skupině, že pět let staré metriky výkonu mají nulovou hodnotu. Naše aplikace se v průběhu let příliš mění. Výkon aplikace dnes nemůžeme srovnávat s výkonem aplikace před pěti lety. Nepůjde o srovnání jablek s jablky.

Ne všechny hodnoty dat klesají stejnou rychlostí. V příkladu, který jsem uvedl v předchozím odstavci, mají metrická data pro výkon aplikace za pět let hodnotu nula. Prodejce, který disponuje údaji, které ukazují, že zákazník koupil plenky před pěti lety, však nyní ví, že zákazník dnes pravděpodobně koupí oblečení pro pětileté nebo šestileté dítě. Toto dítě je s největší pravděpodobností na základní škole a může potřebovat školní pomůcky. V tomto případě mají údaje o nákupech tohoto zákazníka před pěti lety stále určitou hodnotu. Data nejsou bezcenná. Jak již bylo řečeno, nepotřebujeme všechny datové body z doby před pěti lety. Potřebujeme pouze souhrn aktivit daného zákazníka, abychom mohli učinit smysluplné závěry o jeho současných a budoucích nákupech.

Až příliš často vidím, že lidé zacházejí s databázovými systémy jako se smetištěm. Data jsou tam jen vysypána a jen velmi málo lidí moc přemýšlí, co s těmito daty z dlouhodobého hlediska dělat. Jen velmi málo lidí přemýšlí nad tím, jakou hodnotu mají tato data z dlouhodobého hlediska. S ukládáním těchto dat jsou spojeny náklady. Pokud mají data kvůli svému stáří malou nebo nulovou hodnotu, vyplatí se náklady na udržování těchto dat v databázi?

Existují zmírňující strategie, které lze použít pro starší data. Správce databáze může přesunout starší data s nižší hodnotou do levnější vrstvy úložiště. Pokud mají data nulovou hodnotu, měla by být zničena. Mnohokrát již nepotřebujeme úplné podrobnosti o těchto starých datech, když budou stačit souhrny, v takovém případě data agregujeme a výsledky uložíme. Pak se zbavte detailů.

Jako správce databáze je vaší odpovědností být správcem vašich dat a zdrojů potřebných k jejich hostování. Vždy byste se měli ptát na příslušné kroky potřebné k péči o tato data, jak stárnou.


  1. 3 způsoby, jak získat jazyk aktuální relace na serveru SQL (T-SQL)

  2. Jak deklarovat proměnnou a používat ji ve stejném skriptu Oracle SQL?

  3. Chyba soketu Postgresql na OSX 10.7.3 při spuštění Django's syncdb

  4. Použití pg_dump k získání příkazů vložení pouze z jedné tabulky v databázi