sql >> Databáze >  >> RDS >> Database

RowGen v3 automatizuje generování testovacích dat databáze

Hodnota dobrých testovacích dat pro DBA je dobře známá:

„Testování databázově náročných aplikací má jedinečné problémy, které pramení ze skrytých závislostí, jemných rozdílů v sémantice dat, schémat cílových databází a implicitních obchodních pravidel. Tyto výzvy jsou ještě obtížnější, pokud aplikace zahrnuje integrované a heterogenní databáze nebo důvěrná data. Správná testovací data, která simulují problémy s reálnými daty, jsou zásadní pro dosažení přiměřených měřítek kvality pro funkční ověřování vstupu, zatížení, výkon a zátěžové testování. “ – Ali Raza a Stephen Clyde, abstrakt z Vytváření datových sad pro testování relačních databází

Testování databázových operací, prototypování datového skladu a úloh ETL/ELT, bezpečný outsourcing vzorků souborů a sestav a spouštění výkonnostních benchmarků na zařízeních DB – to vše vyžaduje testovací data se vzhledem a chováním produkční databáze, aby aplikace využívající tato testovací data nyní provést později úspěšně se skutečnými daty. Raza a Clyde ve své knize z roku 2012 porovnávají generování testovacích dat s extrakcí testovacích dat.

IRI a její uživatelé vědí, že použití skutečných dat pro testování je nežádoucí. Nejzřejmějším důvodem je dnes to, že skutečná data riskují odhalení osobně identifikovatelných informací (PII), které je třeba zachovat jako důvěrné. Vývojář nebo tester nechce během této fáze spouštět procesy nebo testovat databázový systém a riskovat sdílení informací o zákaznících, jako jsou čísla sociálního pojištění, informace o kreditních kartách, data narození atd. Aktuálně dostupná skutečná data také nemusí být dostatečně robustní nebo realistická pro zátěžové testování aplikací nebo databází, které budou muset zvládnout větší objemy a/nebo rozsahy hodnot.

Bohužel Raza a Clyde napsali svou knihu před vydáním RowGen v3, kdy mohli pozorovat, že generuje testovací data, která:

1) neodhaluje PII, protože obsahuje nové nebo randomizované skutečné hodnoty sloupců
2) zachovává strukturální a referenční integritu definovanou v původním DDL
3) není omezena na objemy dat původní databáze nebo rozsahy hodnot
4) lze přizpůsobit pomocí generování skriptů pro řešení složitých požadavků
5) je předtříděno a automaticky hromadně načteno pro co nejrychlejší populaci
6) jsou definovány v dávce skripty, které mají různou flexibilitu a lze je exportovat, znovu použít a upravit podle potřeby

IRI RowGen v3 je nejnovější vydání nejrychlejšího a nejrobustnějšího generátoru velkoobjemových testovacích dat pro relační databáze na světě. RowGen poběží z grafického rozhraní IRI Workbench GUI postaveného na Eclipse, na příkazovém řádku nebo z dávkových programů, aby produkoval kvalitu a množství testovacích dat nezbytných k přesnému zobrazení rozsahu, rozložení a vztahů v rámci produkčních databází, a dále, datové sklady a provozní datové sklady.

Nový průvodce DB Test Data od RowGen v3, když byl spuštěn z GUI IRI Workbench, provede uživatele specifikací a automatizací:

Analyzovat – výběrem schématu a tabulek k naplnění převede RowGen popisy databázových tabulek a omezení integrity do skriptů .rcl, které určují zdrojovou strukturu, závislé sady a vytváření dat v pořadí potřebném k naplnění tabulek ve správném formátu a s respektováním všech primárních klíčů, jedinečných indexů a vztahů cizích klíčů.

Generace – vytvořením a spuštěním skriptů .rcl k vytvoření jednoho testovacího souboru na tabulku, který lze hromadně načíst a/nebo uložit pro budoucí použití.

Populace – hromadným načtením cílových tabulek ve správném pořadí s předem seřazenými testovacími daty, která jsou strukturálně a referenční správně.

Tento proces může rychle načíst obrovské testovací databáze a vyhovět jak obchodním pravidlům, tak zákonům o ochraně osobních údajů. Vygenerovaná data jsou realistická a dostatečně robustní pro zátěžové testování databázových operací a dotazovacích aplikací.

RowGen v3 také podporuje možnosti založené na pravidlech a skriptech pro řízení specifických hodnot polí a distribucí rozsahů hodnot, které vyhovují specifickým omezením databáze a nejlépe reprezentují výskyt a četnost výskytu dat v produkci. Uživatelé mohou také zobrazit graf a vizuálně doložit, že testovací hodnoty odpovídají lineárnímu, normalizovanému, váženému nebo standardnímu rozdělení.

Další informace o RowGen v3 najdete na www.iri.com/products/rowgen,  www.iri.com/products/rowgen/gui  nebo si přečtěte další články v části Test Data na blogu IRI.


  1. PostgreSQL, kde je vše v poli

  2. Načíst poslední známou hodnotu pro každý sloupec řádku

  3. PDO::__construct():Server odeslal znakovou sadu (255) neznámou klientovi. Prosím, nahlaste to vývojářům

  4. Vytvoření virtuálního počítače pomocí virtuálního boxu Oracle VM