sql >> Databáze >  >> RDS >> Database

Pivoting, Unpivoting a Spliting columns in Power BI Query Editor

Pro srovnání, Power BI je software pro vizualizaci a analýzu dat vyvinutý společností Microsoft. Power BI lze použít pro statickou i interaktivní vizualizaci dat. Než budete moci vytvářet skutečné vizualizace pomocí Power BI, můžete provést předběžné zpracování dat pomocí editoru dotazů Power BI.

Pomocí editoru dotazů můžete provádět různé úlohy transformace dat, jako je změna typů sloupců, manipulace s chybějícími hodnotami, mazání řádků a sloupců, otočení a odebrání sloupců, rozdělení sloupců atd.

V tomto článku se dozvíte, jak pomocí editoru dotazů Power BI otočit, zrušit a rozdělit sloupce.

Import souboru dat do editoru dotazů

Datový soubor použitý jako příklad v tomto článku je ve formátu souboru CSV, který lze stáhnout pomocí tohoto odkazu kaggle. Stáhněte si soubor CSV do místního systému souborů.

Dále otevřete Power BI Desktop a v horní nabídce klikněte na tlačítko Získat data. Z rozevíracího seznamu vyberte „Text/CSV“, jak je uvedeno níže.

Import dat Power BI nějakou dobu potrvá. Po načtení dat by se mělo zobrazit okno níže.

Datový soubor obsahuje informace o populaci, ploše, porodnosti, úmrtnosti, hustotě obyvatelstva, HDP na obyvatele, telefonech na 1000 atd. pro všechny země světa. Chcete-li načíst data do editoru dotazů, klikněte na tlačítko „Transformovat data“.

Editor dotazů vypadá takto:

V editoru dotazů můžete provádět různá předzpracování, jako je otočení, zrušení a rozdělení sloupců.

Pivoting and Unpivoting theory

Než se skutečně pustíme do otáčení a uvolňování sloupců pomocí editoru dotazů Power BI. Podívejme se na velmi základní příklad unpivoting.

Odklopení

Předpokládejme, že máte datovou sadu, která obsahuje následující informace. Řádky v následující tabulce odpovídají zemím, zatímco sloupce zobrazují informace o HDP na obyvatele a míře gramotnosti pro odpovídající země v řádcích. (Poznámka:Toto jsou pouze fiktivní hodnoty, nikoli skutečné hodnoty)

Země HDP na hlavu Míra gramotnosti
Francie 30 000 95 %
Německo 25 000 96 %

Pokud zrušíte pivotování jednoho sloupce, např. HDP na hlavu, bude datová sada s neotočeným sloupcem vypadat takto.

Země Atribut Hodnota gramotnost
Francie HDP na hlavu 30 000 95 %
Německo HDP na hlavu 25 000 96 %

Vidíte, že sloupec HDP na hlavu byl nahrazen dvěma sloupci, tedy Atribut a Hodnota. Hodnoty ve sloupci „Atribut“ odpovídají názvu sloupce, který není pivotován, zatímco sloupec „Value“ obsahuje hodnoty, které dříve existovaly v neotočném sloupci. Protože je neotočný pouze jeden sloupec, budou hodnoty ve sloupci „Atribut“ vždy stejné. Také počet řádků v datové sadě s jedním neotočným sloupcem zůstane stejný.

Zkusme se nyní podívat, co se stane, když otočíme dva sloupce. V původní datové sadě zrušíme pivotování sloupců HDP na obyvatele a míry gramotnosti. Datová sada se dvěma neotočnými sloupci vypadá takto.

Země Atribut Hodnota
Francie HDP na hlavu 30 000
Francie Míra gramotnosti 95 %
Německo HDP na hlavu 25 000
Německo Míra gramotnosti 96 %

Ve výše uvedené sadě dat můžete vidět, že pro každý název země sloupec „Atribut“ nyní obsahuje dvě jedinečné hodnoty:HDP na hlavu a Míra gramotnosti. Sloupec „Value“ obsahuje odpovídající hodnoty pro atributy. Všimněte si, že počet řádků se zdvojnásobil. Podobně, pokud otočíte tři sloupce, počet řádků v datové sadě se zvýší třikrát.

Otáčení

Pivoting, jak název napovídá, odkazuje na proces, který se používá k obrácení neotočné datové sady do její původní podoby. Například při otáčení vstupní tabulky vypadá takto:

Země Atribut Hodnota
Francie HDP na hlavu 30 000
Francie Míra gramotnosti 95 %
Německo HDP na hlavu 25 000
Německo Míra gramotnosti 96 %

Po použití pivotování ve sloupcích „Atribut“ a „Value“ získá datová sada následující podobu:

Země HDP na hlavu Míra gramotnosti
Francie 30 000 95 %
Německo 25 000 96 %

Nyní, když víme, co je to pivotování a unpivoting, pojďme se podívat, jak je implementovat pomocí Power BI.

Pivoting a Unpivoting pomocí Power BI

Podívejme se nejprve na příklad, jak uvolnit jeden sloupec pomocí editoru dotazů Power BI. Pokud se podíváte na datovou sadu, obsahuje sloupec s názvem „Populace“. Chcete-li sloupec „Populace“ uvolnit, klikněte na záhlaví sloupce a poté v horní nabídce vyberte možnost „Transformovat“. V horní části se zobrazí nová nabídka s několika možnostmi, v nabídce klikněte na možnost „Unpivot Columns“ a poté v rozevíracím seznamu klikněte na „Unpivot Columns“, jak je znázorněno níže:

Sloupec „Populace“ bude nahrazen sloupci „Atribut“ a „Hodnota“, jak je uvedeno níže:

Chcete-li otočit sloupec, máte dvě možnosti. Můžete kliknout na možnost „x Unpivoted Columns“ v okně „Applied Steps“, jak ukazuje následující snímek obrazovky.

Druhou možností je vybrat sloupec a poté z horní nabídky vybrat „Transformovat -> Pivot Column“, jak je znázorněno níže.

Při otáčení sloupce musíte určit sloupec, který obsahuje hodnoty pro neotočný sloupec. V našem případě sloupec „Value“ obsahuje hodnoty pro neotočný sloupec „Atribut“. Podívejte se na následující snímek obrazovky.

Otočený sloupec „Populace“ vypadá takto:

Přesuňte sloupec „Populace“ hned vedle „Pop. Hustota (na čtvereční mil.)“ kliknutím na záhlaví sloupce „Populace“ a přetažením, jak ukazuje následující snímek obrazovky.

Dále otevřeme dva sloupce, tj. „Populace“ a „Pop. Hustota (na čtvereční míli)“. Vyberte obě záhlaví sloupců a poté je odklopte, jak je znázorněno níže:

Po zrušení pivotování byste měli vidět následující dva sloupce vytvořené v datové sadě. Můžete vidět, že sloupec „Atribut“ nyní obsahuje informace o „Populace“ a „Pop. Hustota (na čtvereční mil.)“.

Vyberte obě záhlaví sloupců (CTRL + kliknutí) a poté přetáhněte sloupce těsně vedle sloupce „Země“, jak je znázorněno níže.

Nyní můžete vidět názvy „zemí“, jejich celkový počet obyvatel a hustotu obyvatelstva na čtvereční míli. Změňme název sloupce „Atribut“ na „Typ populace“, protože sloupec „Atribut“ zobrazuje dva typy populace:celkovou populaci a hustotu obyvatelstva na čtvereční míli. Datová sada s aktualizovaným názvem záhlaví sloupce vypadá takto:

Rozdělení sloupců

Před rozdělením sloupců nahradíme některé hodnoty ve sloupci „Typ populace“.

Hodnota „Population“ ve sloupci „Population Type“ odkazuje na celkovou populaci. Hodnotu „Populace“ nahradíme „Pop. Celkem“ tak, aby měl stejný vzor jako „Pop. Hustota (na čtvereční míli)“. Chcete-li nahradit hodnoty ve sloupcích, přejděte na „Transformovat -> Nahradit hodnoty“, jak je znázorněno na následujícím snímku obrazovky.

Po nahrazení hodnot vypadá datová sada takto.

Nyní rozdělíme sloupec „Typ populace“ na dva. Jeho prvních pět znaků bude přidáno do prvního sloupce, zatímco zbývající znaky budou přidány do druhého sloupce. Chcete-li sloupec rozdělit, přejděte na „Transformovat -> Rozdělit sloupce“. Budeme rozdělovat podle prvních pěti znaků, proto z rozbalovací nabídky vyberte možnost „Rozdělit podle počtu znaků“. Sloupec rozdělíme na prvních 5 znaků zcela vlevo. Pro informaci se podívejte na následující snímek obrazovky.

Jakmile jsou sloupce rozděleny, měli byste vidět následující dva sloupce.

Potřebujeme pouze sloupec „Population Type.2“, protože obsahuje informace o typu nebo rozsahu populace. Klikněte na sloupec „Population Type.1“ a poté vyberte „Delete“.

Nakonec můžete sloupec „Population Type.2“ přejmenovat na „Population Type“, jak je znázorněno níže.

Z následujícího obrázku můžete vidět, že pro každou zemi existují dva různé typy populačních hodnot. Hodnota „Celkem“ ve sloupci „Typ populace“ odkazuje na celkový počet obyvatel země. Skutečná hodnota pro celkovou populaci je uložena ve sloupci „Hodnota populace“. Podobně hodnota „Hustota (na čtvereční mil.)“ ukazuje, že tato hodnota populace se vztahuje k hustotě obyvatelstva.

Závěr

Stručně řečeno, článek ukazuje, jak provést pivotování a zrušení pivotování v editoru dotazů Power BI. Kromě toho pokrývá základní teorii otočných a odklápěcích sloupů ilustrovanou na jasných příkladech. Nakonec článek vysvětluje, jak je proces rozdělování sloupců implementován v editoru dotazů Power BI.


  1. Doplnění chybějících termínů podle skupin

  2. Doporučené procesory Intel pro úlohy SQL Server 2014

  3. RMAN selže s RMAN-06900 RMAN-06901 ORA-04031

  4. Převeďte jeden řádek na více řádků s méně sloupci