Nedělal bych to v MySQL bez vnější pomoci od aplikace napsané v Pythonu.
Ve vašem prohlášení je zabudováno několik požadavků, které lze nejlépe vyjádřit procedurálním stylem. SQL je jazyk založený na množinách; Nemyslím si, že se to tak dobře hodí k danému úkolu.
Budete chtít, aby aplikace přebírala data ze zdroje, provedla jakoukoli randomizaci a odstranění PII, které potřebujete, a poté vytvořila testovací data podle vašich požadavků.
Pokud je to databáze určená pouze pro testování, můžete zvážit databázi v paměti, kterou můžete naplnit, upravit, co chcete, a pak ji odfouknout pro další test. Přemýšlím o něčem jako Hypersonic nebo Derby nebo TimesTen.