sql >> Databáze >  >> RDS >> Mysql

mySQL:Použití Levenshteinovy ​​vzdálenosti k nalezení duplikátů ve 20 000 řádcích

Znám alespoň jednu optimalizaci, která by mohla zkrátit dobu běhu na polovinu:

AND a.id < b.id

To vám zabrání otestovat a=1, b=2, když jste již testovali a=2, b=1.

Stále to bude O(n^2), ale nechápu, jak s tím můžete mnoho udělat.



  1. Jak mohu vytisknout výsledky dotazů MySQL ve formátu CSV?

  2. Neznámá chyba sloupce v úplné syntaxi spojení

  3. Stránkování (Předchozí | Další) pomocí Smarty

  4. Použití podřetězců v kritériích MySQL