sql >> Databáze >  >> RDS >> Mysql

MySql:Spočítá, kolikrát se slova vyskytují ve sloupci

Zde je řešení pouze pomocí dotazu:

SELECT SUM(total_count) as total, value
FROM (

SELECT count(*) AS total_count, REPLACE(REPLACE(REPLACE(x.value,'?',''),'.',''),'!','') as value
FROM (
SELECT SUBSTRING_INDEX(SUBSTRING_INDEX(t.sentence, ' ', n.n), ' ', -1) value
  FROM table_name t CROSS JOIN 
(
   SELECT a.N + b.N * 10 + 1 n
     FROM 
    (SELECT 0 AS N UNION ALL SELECT 1 UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5 UNION ALL SELECT 6 UNION ALL SELECT 7 UNION ALL SELECT 8 UNION ALL SELECT 9) a
   ,(SELECT 0 AS N UNION ALL SELECT 1 UNION ALL SELECT 2 UNION ALL SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5 UNION ALL SELECT 6 UNION ALL SELECT 7 UNION ALL SELECT 8 UNION ALL SELECT 9) b
    ORDER BY n
) n
 WHERE n.n <= 1 + (LENGTH(t.sentence) - LENGTH(REPLACE(t.sentence, ' ', '')))
 ORDER BY value

) AS x
GROUP BY x.value

) AS y
GROUP BY value

Zde je kompletní pracovní housle:http://sqlfiddle.com/#!2/17481a/ 1

Nejprve provedeme dotaz, abychom extrahovali všechna slova, jak je vysvětleno zde od @peterm (pokud chcete upravit celkový počet zpracovaných slov, postupujte podle jeho pokynů). Pak to převedeme na dílčí dotaz a poté COUNT a GROUP BY hodnotu každého slova a poté nad tím proveďte další dotaz na GROUP BY případy nesdružených slov, kde mohou být přítomny doprovodné znaky. tj. ahoj =ahoj! s REPLACE



  1. Odstraňte duplicitní řádky v příkazu SELECT PostgreSQL

  2. Výkon podmíněné agregace

  3. 2 způsoby, jak zjistit, do kterého čtvrtletí patří datum v MariaDB

  4. Jak přenést moji databázi MySQL na jiný počítač?