to může fungovat, ale může docházet k falešným shodám bez možnosti jim zabránit, protože máte pouze algoritmické řešení. Nejlepším řešením je vytvořit tabulku aliasů. Zahrňte všechny nalezené variace pro každý název společnosti a FK ke skutečnému ID společnosti. Zahrňte také řádek pro skutečné jméno.
AliasID CompanyID CompanyAlias
------- --------- ------------
1 1 Company X, Inc <<--actual real company name
2 1 Company X Inc
3 1 Company X
Pokud při importu dat není v této tabulce nalezena přesná shoda názvu, můžete použít vámi navržený algoritmus nebo jiný, nebo použít lidský vstup atd. k nalezení shody nebo vygenerování nové společnosti. V tomto okamžiku vložte do tabulky aliasů. Pokud zjistíte, že vaše shoda byla z nějakého důvodu nesprávná, můžete změnit tabulku aliasů, abyste vytvořili správné mapování. Pokud použijete pouze algoritmus, budete muset zahrnout výjimky a váš algoritmus se zvětší a zpomalí. S touto tabulkou a dobrým indexem by mělo být hledání shod rychlé.