Vzorec vzdálenosti Jaro-Winkler je zaměřen na struny se společným začátkem. Například Valentina a Valentiria .
Má také některá ne tak intuitivní „pravidla“ (viz wikipedie ).
Pravděpodobně byste měli nejprve určit, jaký druh odlišnosti očekáváte, a poté hledat vhodný vzorec vzdálenosti. Například při psaní je „úhlový červ“ a „angelworm“ velmi pravděpodobnou chybou, takže vzdálenost mezi dvěma strunami by měla být malá. Zatímco nesoulad „tam“ a „tři“ je méně pravděpodobný a „éter“ ještě více. U delších anagramů může být vzdálenost Jaro úplně stejná a dokonce ani Winklerova korekce nemusí zasáhnout.
Jak si můžete přečíst na této stránce (zdůrazňuji můj)