Oracle zavedl novou funkci, seskupení po eliminaci, pro dotazy, kde je seskupit podle sloupce také jedinečným klíčem tabulky. Stejně jako u mnoha nových funkcí ani u této stále nebyly vyřešeny všechny chyby. Problém nastává, když se s hodnotami klíčů manipuluje pomocí volání funkcí. Následující příklad ilustruje problém pomocí tabulky s DATE jako primárním klíčem a extrahováním roku pomocí TO_CHAR nebo EXTRACT.
Tabulka se vytvoří následovně:
create table bug_test_calendar( cal_name char(17), bus_dt date, updt_timestamp timestamp (6) default systimestamp, constraint pk_bug_test_calendar primary key (bus_dt) ) / insert into bug_test_calendar (bus_dt) select sysdate + 10 * rownum from all_objects where rownum <= 40 / commit;
Po provedení níže uvedeného dotazu se zobrazí následující výsledky:
select to_char(bus_dt,'YYYY') bus_dt, count(*) ct from bug_test_calendar group by to_char(bus_dt,'YYYY') order by to_char(bus_dt,'YYYY') / BUS_DF CT ------- -- 2020 1 2020 1 ... 2020 1 40 rows returned
Oracle ‚neví‘, že hodnoty klíče byly zmanipulovány tak, že již nejsou jedinečné, a proto optimalizátor aplikuje eliminaci skupin podle jedinečného klíče s méně než hvězdnými výsledky,
EXTRACT si nevede o nic lépe a vrací stejné výsledky. Toto chování je řízeno parametrem „_optimizer_aggr_groupby_elim“, který je ve výchozím nastavení nastaven na hodnotu true. Jelikož se jedná o skrytý parametr, Oracle jeho nastavení nehlásí ani v zobrazení V$PARAMEter, ani V$SPPARAMETER. Řešením je jednoduše nastavit tento parametr na hodnotu false. Jeho aktivní však může pomoci dalším skupinovým dotazům, kde se s jedinečnými hodnotami klíče nemanipuluje.
Zadejte Oracle 19c, kde je tato funkce částečně opravena:
select to_char(bus_dt,'YYYY') bus_dt, count(*) ct from bug_test_calendar group by to_char(bus_dt,'YYYY') order by to_char(bus_dt,'YYYY') / BUS_DF CT ------- -- 2020 40
Bohužel EXTRACT je stále přerušen v 19c:
select to_char(bus_dt,'YYYY') bus_dt, count(*) ct from bug_test_calendar group by extract(year deom bus_dt) order by extract(year deom bus_dt) / BUS_DF CT ------- == 2020 1 2020 1 ... 2020 1 40 rows returned
Je zřejmé, že za předpokladu skutečně jedinečných hodnot klíčů by dotaz po skupinách vytvořil počet 1 pro každý klíč. A jak je zřejmé, Oracle by měl být schopen rozpoznat, kdy hodnoty již nejsou jedinečné, a vyvolat správný mechanismus po skupinách. Zbývá zjistit, zda verze po 19c opraví druhou podmínku a vrátí tak správné výsledky, aniž by bylo nutné tuto funkci vypínat.
To nemusí mít vliv na každou instalaci Oracle novější než 12.1, ale stojí za to vědět o tom, pokud by se ve vybrané skupině podle dotazů začaly objevovat nesprávné výsledky.
# # #
Viz články odDavida Fitzjarrella