sql >> Databáze >  >> RDS >> Oracle

Jak převést hodnoty oddělené čárkami na řádky v oracle?

Souhlasím s tím, že toto je opravdu špatný design. Pokud tento design nemůžete změnit, zkuste toto:

select distinct id, trim(regexp_substr(value,'[^,]+', 1, level) ) value, level
  from tbl1
   connect by regexp_substr(value, '[^,]+', 1, level) is not null
   order by id, level;

VÝSTUP

id value level
1   AA  1
1   UT  2
1   BT  3
1   SK  4
1   SX  5
2   AA  1
2   UT  2
2   SX  3
3   UT  1
3   SK  2
3   SX  3
3   ZF  4

Poděkování za to

Chcete-li odstranit duplikáty elegantnějším a účinnějším způsobem (poděkování @mathguy)

select id, trim(regexp_substr(value,'[^,]+', 1, level) ) value, level
  from tbl1
   connect by regexp_substr(value, '[^,]+', 1, level) is not null
      and PRIOR id =  id 
      and PRIOR SYS_GUID() is not null  
   order by id, level;

Pokud chcete „ANSIer“ přístup, použijte CTE:

with t (id,res,val,lev) as (
           select id, trim(regexp_substr(value,'[^,]+', 1, 1 )) res, value as val, 1 as lev
             from tbl1
            where regexp_substr(value, '[^,]+', 1, 1) is not null
            union all           
            select id, trim(regexp_substr(val,'[^,]+', 1, lev+1) ) res, val, lev+1 as lev
              from t
              where regexp_substr(val, '[^,]+', 1, lev+1) is not null
              )
select id, res,lev
  from t
order by id, lev;

VÝSTUP

id  val lev
1   AA  1
1   UT  2
1   BT  3
1   SK  4
1   SX  5
2   AA  1
2   UT  2
2   SX  3
3   UT  1
3   SK  2
3   SX  3
3   ZF  4

Další rekurzivní přístup od MT0, ale bez regulárního výrazu:

WITH t ( id, value, start_pos, end_pos ) AS
  ( SELECT id, value, 1, INSTR( value, ',' ) FROM tbl1
  UNION ALL
  SELECT id,
    value,
    end_pos                    + 1,
    INSTR( value, ',', end_pos + 1 )
  FROM t
  WHERE end_pos > 0
  )
SELECT id,
  SUBSTR( value, start_pos, DECODE( end_pos, 0, LENGTH( value ) + 1, end_pos ) - start_pos ) AS value
FROM t
ORDER BY id,
  start_pos;

Vyzkoušel jsem 3 přístupy s datovou sadou 30 000 řádků a vrácených 118 104 řádků a získal jsem následující průměrné výsledky:

  • Můj rekurzivní přístup:5 sekund
  • Přiblížení MT0:4 sekundy
  • Mathguy přístup:16 sekund
  • MT0 rekurzivní přístup bez regulárního výrazu:3,45 sekund

@Mathguy také testoval s větší datovou sadou:

Ve všech případech je rekurzivní dotaz (testoval jsem pouze ten s regularsubstr a instr) lepší, faktorem 2 až 5. Zde jsou kombinace počtu řetězců / tokenů na řetězec a doby provádění CTAS pro hierarchické vs. rekurzivní, hierarchické nejprve . Všechny časy v sekundách

  • 30 000 x 4:5/1.
  • 30 000 x 10:15/3.
  • 30 000 x 25:56/37.
  • 5 000 x 50:33/14.
  • 5 000 x 100:160/81.
  • 10 000 x 200:1 924 / 772


  1. Jak převést hodnotu data/času na řetězec v SQL Server pomocí CONVERT()

  2. Vyberte (načtěte) všechny záznamy z více schémat pomocí Postgres

  3. Jak LEFT() funguje v MariaDB

  4. PostgreSQL:Jak předat parametry z příkazového řádku?