sql >> Databáze >  >> NoSQL >> Redis

Jaká je dobrá strategie pro seskupování podobných slov?

Podívejte se na "fuzzy párování". Některé skvělé nástroje ve vláknu níže, které vypočítávají podobnosti mezi řetězci.

Obzvláště se mi líbí modul difflib

>>> get_close_matches('appel', ['ape', 'apple', 'peach', 'puppy'])
['apple', 'ape']
>>> import keyword
>>> get_close_matches('wheel', keyword.kwlist)
['while']
>>> get_close_matches('apple', keyword.kwlist)
[]
>>> get_close_matches('accept', keyword.kwlist)
['except']

https://stackoverflow.com/questions/682367/good-python-modules-for-fuzzy-string-comparison



  1. Vytvořte textový index s různými tloušťkami polí v MongoDB

  2. Implementace pub/sub v nodeJS

  3. Redis Vue Desktop

  4. Má master vždy redis instance s nejmenší prioritou?