sql >> Databáze >  >> RDS >> MariaDB

2 způsoby, jak vrátit řádky, které obsahují pouze nealfanumerické znaky v MariaDB

Níže jsou uvedeny dva způsoby vracení řádků, které obsahují pouze nealfanumerické znaky v MariaDB.

Nealfanumerické znaky zahrnují interpunkční znaménka jako [email protected]#&()–[{}]:;',?/* a symboly jako `~$^+=<>“ , stejně jako mezery, jako jsou mezery nebo tabulátory.

Ukázková data

Pro naše příklady použijeme následující data:

CREATE TABLE t1 (
    c1 varchar(255) NULL
    );

INSERT INTO t1 VALUES
    ('Music'),
    ('Live Music'),
    ('Café'),
    ('Café Del Mar'),
    ('100 Cafés'),
    ('[email protected]'),
    ('1 + 1'),
    ('()'),
    ('[email protected]#&()–[{}]:;'',?/*'),
    ('`~$^+=<>“'),
    ('$1.50'),
    ('Player 456'),
    ('007'),
    (null),
    (''),
    ('é'),
    ('É'),
    ('é 123'),
    ('ø'),
    ('ø 123');
SELECT c1 FROM t1;

Výsledek:

+----------------------+
| c1                   |
+----------------------+
| Music                |
| Live Music           |
| Café                 |
| Café Del Mar         |
| 100 Cafés            |
| [email protected]    |
| 1 + 1                |
| ()                   |
| [email protected]#&()–[{}]:;',?/*   |
| `~$^+=<>“            |
| $1.50                |
| Player 456           |
| 007                  |
| NULL                 |
|                      |
| é                    |
| É                    |
| é 123                |
| ø                    |
| ø 123                |
+----------------------+

Možnost 1:Porovnejte s [:alnum:]

Schopnost regulárního výrazu MariaDB zahrnuje podporu pro třídy znaků POSIX. Proto můžeme použít [:alnum:] Třída znaků POSIX v našich regulárních výrazech, abyste našli řádky, které obsahují pouze alfanumerické znaky, a poté to negujte pomocí NOT operátor.

SELECT c1 FROM t1 
WHERE c1 NOT REGEXP '[[:alnum:]]';

Výsledek:

+----------------------+
| c1                   |
+----------------------+
| ()                   |
| [email protected]#&()–[{}]:;',?/*   |
| `~$^+=<>“            |
|                      |
+----------------------+

Pokud potřebujete vyloučit konkrétní znak, můžete vždy použít NULLIF() funkce.

Vynechme například prázdný řetězec z posledního řádku:

SELECT c1 FROM t1 
WHERE NULLIF(c1, '') NOT REGEXP '[[:alnum:]]';

Výsledek:

+----------------------+
| c1                   |
+----------------------+
| ()                   |
| [email protected]#&()–[{}]:;',?/*   |
| `~$^+=<>“            |
+----------------------+

Možnost 2:Určete rozsah znaků

Dalším způsobem, jak to udělat, je zadat rozsah znaků v regulárním výrazu.

Příklad:

SELECT c1 FROM t1 
WHERE c1 NOT REGEXP '[A-Za-z0-9]';

Výsledek:

+----------------------+
| c1                   |
+----------------------+
| ()                   |
| [email protected]#&()–[{}]:;',?/*   |
| `~$^+=<>“            |
|                      |
| é                    |
| É                    |
| ø                    |
+----------------------+

A pro odstranění prázdného řetězce:

SELECT c1 FROM t1
WHERE NULLIF(c1, '') NOT REGEXP '[A-Za-z0-9]';

Výsledek:

+----------------------+
| c1                   |
+----------------------+
| ()                   |
| [email protected]#&()–[{}]:;',?/*   |
| `~$^+=<>“            |
| é                    |
| É                    |
| ø                    |
+----------------------+

V tomto případě můj rozsah vyloučení nezahrnoval alfanumerické znaky jako é , É a ø , takže výstup není skutečnou reprezentací nealfanumerických znaků. To znamená, že alespoň tato metoda vám dává možnost určit přesné znaky, které chcete zahrnout nebo vyloučit z výsledku.


  1. SQL Server rozdělil CSV do více řádků

  2. Vypočítané / vypočítané / virtuální / odvozené sloupce v PostgreSQL

  3. Jak GROUP BY funguje?

  4. Osvědčený postup pro vytváření indexů v tabulkách MySQL – Rolling Index Builds