sql >> Databáze >  >> RDS >> Database

Spojení různých zdrojů dat ve vrstvení

Porovnání dat ze dvou různých zdrojů dat je něco, co by normálně vyžadovalo mnoho různých pohyblivých částí, zvláště pokud máte zájem vytvořit nějakou vizualizaci na těchto nových datech.

V režimu SQL v Chartiu, stejně jako ve většině editorů SQL, můžete napsat tento typ spojení a propojit tyto dvě tabulky, POKUD jsou ve stejném zdroji dat. Pomocí editoru schémat můžete diktovat, jak budou dvě takové tabulky spojeny v interaktivním režimu, tedy POKUD jsou ve stejném zdroji dat. Nemůžete to udělat se dvěma nesourodými a samostatnými zdroji dat. Zde přichází na řadu Chartio’s Layering.

Jak může SQL vytvořit spojení

V syntaxi SQL se spojení dvou tabulek děje v klauzuli FROM a příkaz je velmi jednoduše JOIN. Syntakticky to vypadá asi takto:

_SELECT p.id, p.name, p.city, p.state, s.score_
_FROM public.person_info as p_
_INNER JOIN public.score_info as s ON p.id = s.id_
  • To, co jsme zde udělali, jsou tyto dvě tabulky:

  • A doslova je spojili do jedné tabulky s výsledky, kde se tyto dvě tabulky protínají ve sloupci „id“.
  • Toto spojení lze vysvětlit pomocí této animace

  • Výsledná tabulka je kombinací těchto dvou a vypadá takto:

Jak můžete vidět na animaci a výsledné tabulce nad položkami, které vrátí INNER JOIN, zobrazí POUZE řádky, kde je ID v OBOU tabulkách se specifickými sloupci uvedenými v klauzuli SELECT. To je jádro JOINS v SQL:přinést mi data z více tabulek, kde se protíná sloupec, který existuje v obou tabulkách. Toto je nejzákladnější forma JOIN the INNER JOIN. Existují různé způsoby spojení těchto tabulek nebo různé typy spojení a ty lze vysvětlit pomocí Vennových diagramů, jako jsou ty, které jsou uvedeny níže.

Jak Chartio Layers vytvářejí spojení

V interaktivním režimu Chartio můžete spojit dva zdroje pomocí vrstev. Základy jsou zde velmi jednoduché, stačí provést několik kroků k nastavení základních dotazů k vytvoření dvou tabulek, které mají být spojeny. Způsob, jakým se vrstvy spojují, je velmi podobný tomu, jak může Excel používat funkci SVYHLEDAT. Výběrem kroku datového kanálu sloučení vrstev (v interaktivním režimu se to provede přidáním nové vrstvy kliknutím na znaménko plus „+“ pod průzkumníkem dat) sdělujete společnosti Chartio, aby vzala tabulky, které jsou výsledkem počátečních dotazů v konkrétní syntaxi konkrétních zdrojů dat a sloučit je do protínajících se řádků ve vybraných sloupcích.

Rozdíl je v tom, že v interaktivním režimu v Chartiu diktujete, že se tyto sloupce mají spojit s prvním 1, 2, 3 atd. sloupci nalevo od dvou tabulek, podobně jako VLOOKUP v Excelu. Na rozdíl od připojení v režimu SQL, kde můžete diktovat sloupec v zadané syntaxi.

V Chartiu může možnost Vrstvení spojit dva různé zdroje dat, buď ze dvou různých připojení Amazon Redshift nebo PostgreSQL, nebo dokonce připojit a porovnat Google Analytics se zdrojem Amazon Redshift nebo jiným typem zdroje dat. V tomto příkladu porovnáme zdroj Amazon Redshift v Chartiu se zdrojem Google Analytics, který používáme k monitorování relací zobrazení stránky. Pojďme tedy porovnat návštěvy s potenciálními zákazníky z tabulky potenciálních zákazníků Salesforce.

  • Krok 1:Vytvořte dotaz pro Amazon Redshift Source.
    • REDSHIFT – Vrstva Salesforce
      • Tabulka – SF Lead
      • Sloupce
        • Počet odlišných ID
        • Datum vytvoření
        • Datum vytvoření za posledních N týdnů 1

  • Krok 2:Nastavte krok spojení přidáním nové vrstvy.

  • Krok 3:Vytvořte dotaz pro zdroj Google Analytics.
    • GOOGLE ANALYTICS – Chartio Web Analytics
      • Tabulka – relace
      • Sloupce
        • # Sessions
        • Den návštěvy
        • Čas za posledních N týdnů 1

  • Krok 4:Pomocí kroků Data Pipeline manipulujte s výslednou spojenou tabulkou
    • Přidat sloupec
      • Nový typ sloupce
        • Potenci – Průběžný součet
      • Typ vzorce
        • Celkový součet
      • Použití sloupce
        • Počet odlišných ID

    • Přidat sloupec
      • Nový typ sloupce
        • Relace – celkový součet
      • Typ vzorce
        • Celkový součet
      • Použití sloupce
        • Ga:sessions

    • Skrýt sloupce
      • Počet odlišných ID
      • Ga:sessions


  1. Jak používat ALL Logical Operator v SQL Server - SQL Server / TSQL výukový program, část 126

  2. Jak uložit hodnoty NULL do polí data a času v MySQL?

  3. Co je AWS RDS

  4. Jak přidat měsíc k datu v SQLite