sql >> Databáze >  >> RDS >> Sqlserver

Jak ignorovat html tagy v SQL Server 2008 Full Text Search

existuje filtr pro soubory .htm a .html.

Chcete-li zjistit, zda máte nainstalovaný filtr, spusťte tento sql:

SELECT * FROM sys.fulltext_document_types

měli byste vidět:

.htm E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation

.html E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation

takže pokud můžete převést sloupec článků na varbinary(max), můžete do něj přidat fulltextový index a zadat typ dokumentu '.html'

jakmile se index naplní, můžete klíčová slova ověřit pomocí tohoto sql:

SELECT display_term, column_id, document_count
FROM sys.dm_fts_index_keywords
(DB_ID('your_db'), OBJECT_ID('your_table')) 


  1. Řazení položek se shodnými štítky podle počtu odpovídajících štítků

  2. Pomalý dotaz MySQL na příkaz aktualizace

  3. Mapování polí v Oracle SQL Loader

  4. Převeďte Int32 na Oracle number(5) pomocí EF4