sql >> Databáze >  >> RDS >> Mysql

Relevance fulltextového vyhledávání Mysql ve více tabulkách

Ano, můžete je velmi dobře sjednotit pomocí vyhledávače, jako je Apache Lucene a Solr.

http://lucene.apache.org/solr/

Pokud to potřebujete udělat pouze v MySQL, můžete to udělat pomocí UNION. Pravděpodobně budete chtít potlačit jakékoli výsledky, které nejsou relevantní.

Budete se muset rozhodnout, jak chcete ovlivnit relevanci v závislosti na tom, která tabulka odpovídá.

Předpokládejme například, že chcete, aby články byly nejdůležitější, události středně důležité a stránky nejméně důležité. Multiplikátory můžete použít takto:

set @articles_multiplier=3;
set @events_multiplier=2;
set @pages_multiplier=1;

Zde je pracovní příklad, který můžete vyzkoušet a který demonstruje některé z těchto technik:

Vytvořte ukázková data:

create database d;
use d;

create table articles (id int primary key, content text) ENGINE = MYISAM;
create table events (id int primary key, content text) ENGINE = MYISAM;
create table pages (id int primary key, content text) ENGINE = MYISAM;

insert into articles values 
(1, "Lorem ipsum dolor sit amet"),
(2, "consectetur adipisicing elit"),
(3, "sed do eiusmod tempor incididunt");

insert into events values 
(1, "Ut enim ad minim veniam"),
(2, "quis nostrud exercitation ullamco"),
(3, "laboris nisi ut aliquip");

insert into pages values 
(1, "Duis aute irure dolor in reprehenderit"),
(2, "in voluptate velit esse cillum"),
(3, "dolore eu fugiat nulla pariatur.");

Umožněte jej vyhledávat:

ALTER TABLE articles ADD FULLTEXT(content);
ALTER TABLE events ADD FULLTEXT(content);
ALTER TABLE pages ADD FULLTEXT(content);

K prohledání všech těchto tabulek použijte UNION:

set @target='dolor';

SELECT * from (
  SELECT 
    'articles' as 'table_name', id, 
    @articles_multiplier * (MATCH(content) AGAINST (@target)) as relevance
    from articles
  UNION
  SELECT 
    'events' as 'table_name', 
    id,
    @events_multiplier * (MATCH(content) AGAINST (@target)) as relevance
    from events
  UNION
  SELECT 
    'pages' as 'table_name', 
    id, 
    @pages_multiplier * (MATCH(content) AGAINST (@target)) as relevance
    from pages
)
as sitewide WHERE relevance > 0;

Výsledek:

+------------+----+------------------+
| table_name | id | relevance        |
+------------+----+------------------+
| articles   |  1 | 1.98799377679825 |
| pages      |  3 | 0.65545331108093 |
+------------+----+------------------+


  1. Postup pro export tabulky do více souborů csv

  2. Odstraňte duplicitní řádky mysql bez primárního klíče

  3. Jednoduchý dotaz Oracle:doslovný neodpovídá formátovacímu řetězci

  4. DATEDIFF() vs DATEDIFF_BIG() v SQL Server:Jaký je rozdíl?