sql >> Databáze >  >> RDS >> Database

Výukový program SSIS pro začátečníky:Proč, co a jak?

SQL Server Integration Services (SSIS) tvoří nedílnou součást softwaru databáze Microsoft SQL Server. Díky různým funkcím je tak práce se správou dat mnohem jednodušší. V tomto tutoriálu se budeme hlouběji zabývat SSIS na koncepční úrovni v následujícím pořadí:

  • Co je integrace dat?
  • Proč SSIS?
  • Co je SSIS?
  • Funkce SSIS
  • Jak SSIS funguje?
    • Proces ETL
    • Datové sklady
  • Požadavky na SQL Server Integration Services
    • Instalace SQL Server
    • Nainstalujte SQL Server Data Tools
  • Co je balíček SSIS?

Začněme.

Co je integrace dat?

Integrace dat je proces, ve kterém jsou získávána a kombinována heterogenní data jako integrovaná forma a struktura. Například každá společnost v dnešní době musí zpracovávat velké soubory dat z různých zdrojů. Tyto údaje je třeba zpracovat, aby poskytly srozumitelné informace pro obchodní rozhodnutí. Jednoduchým řešením by tedy byla integrace dat. V podstatě integruje všechna vaše data přítomná v různých databázích a spojí je na stejné platformě.

Zde je několik způsobů, jak dosáhnout integrace dat:

Nyní, když jste pochopili integraci dat, pojďme se podívat, proč se používá SSIS. SSIS je zkratka pro SQL Server Integration Services.

Proč SSIS?

  • Data lze načítat paralelně k mnoha různým cílům
  • SSIS odstraňuje potřebu hardcore programátorů
  • Úzká integrace s ostatními produkty společnosti Microsoft
  • SSIS je levnější než většina ostatních nástrojů ETL
  • SIS poskytuje grafické uživatelské rozhraní pro snadnou transformaci dat
  • Zabudujte BI do procesu transformace dat
  • Důkladné zpracování chyb a událostí

V tomto kurzu SSIS se podívejte, co to přesně je a jak to funguje.

Co je SSIS?

SQL Server Integration Services (SSIS) je součást databázového softwaru Microsoft SQL Server, kterou lze použít k provádění široké škály úloh integrace a transformace dat.

  • Integrace dat: Kombinuje data uložená v různých zdrojích a poskytuje uživatelům jednotný pohled na tato data
  • Pracovní postup: Lze jej také použít k automatizaci údržby databází SQL Server a aktualizací vícerozměrných analytických dat

Funkce SSIS

Některé z funkcí pro použití SSIS jsou:

  • Organizované a vyhledávací transformace
  • Úzká integrace s další rodinou Microsoft SQL
  • Poskytuje bohaté prostředí Studio
  • Poskytuje mnoho funkcí integrace dat pro lepší transformace
  • Vysokorychlostní datové připojení

Můžete si projít níže uvedené video, které pokrývá všechny základy včetně konceptů datových skladů, které se používají pro extrakci, transformaci a načítání dat (ETL). Je ideální pro začátečníky i profesionály, kteří si chtějí oprášit základy MSBI.

Pokračujeme v tutoriálu SSIS a podívejme se, jak přesně to funguje.

Jak SSIS funguje?

SSIS se skládá ze tří hlavních komponent, konkrétně:

  • Provozní údaje
  • proces ETL
  • Datový sklad

Tyto úlohy transformace dat a vytváření pracovních postupů se provádějí pomocí „balíčku SSIS“, o kterém bude řeč později v tomto blogu. Pokračujeme s výukovým programem SSIS a nejprve podrobně porozumíme každé z těchto součástí:

Provozní údaje

Úložiště provozních dat (ODS) je databáze navržená pro integraci dat z více zdrojů pro další operace s daty. Toto je místo, kde je uložena většina dat používaných v aktuální operaci předtím, než jsou přenesena do datového skladu pro dlouhodobé uložení nebo archivaci.

Proces ETL

ETL je proces extrahování, transformace a načítání dat. Extrahovat, transformovat a načíst (ETL) je proces extrahování dat z různých zdrojů, transformace těchto dat tak, aby vyhovovala vašim požadavkům, a následné načtení do cílového datového skladu. ETL poskytuje JEDNODUCHÉ ŘEŠENÍ pro všechny tyto problémy.

  • Extrahovat
  • Transformovat
  • Načíst

Výpis: Extrakce je proces extrahování dat z různých homogenních nebo heterogenních zdrojů dat na základě různých bodů ověření.

Transformace: Při transformaci jsou analyzována celá data a jsou na ně aplikovány různé funkce, aby se data načetla do cílové databáze v čistém a obecném formátu.

Načíst: Načítání je proces načítání zpracovaných dat do cílového úložiště dat s využitím minimálních zdrojů.


Datové sklady

  • Datový sklad zachycuje data z různých zdrojů pro užitečnou analýzu a přístup.
  • Datawarehousing je velký soubor nashromážděných dat, který se používá pro shromažďování a správu dat z různých zdrojů za účelem zodpovězení obchodních otázek. Pomáhá tedy při rozhodování.

Požadavky na SQL Server Integration Services

Chcete-li pracovat se SSIS, musíte nainstalovat následující:

  • SQL Server
  • Datové nástroje SQL Server

Pojďme se podívat na proces instalace.

Instalace serveru SQL

Přejděte na webovou stránku:https://www.microsoft.com/en-au/sql-server/sql-server-downloads a nainstalujte SQL Server. Můžete nainstalovat nejnovější verzi nebo předchozí verzi podle svého výběru.

Existují tedy různé edice SQL Server, konkrétně:

    • Zkušební verze zdarma: Získáte 180denní bezplatnou zkušební verzi SQL Server 2017 pro Windows.
    • Verze pro vývojáře: Jedná se o plně funkční bezplatné vydání, licencované pro použití jako vývojová a testovací databáze v neprodukčním prostředí.
    • Expresní edice: Express je bezplatná edice SQL Serveru, ideální pro vývoj a produkci desktopových, webových a malých serverových aplikací.

Příště se podíváme, jak nainstalovat datové nástroje.

Datové nástroje SQL Server

Přejděte na webovou stránku:https://docs.microsoft.com/en-us/sql/ssdt/previous-releases-of-sql-server-data-tools-ssdt-and-ssdt-bi?view=sql-server -ver15 a podívejte se na různá vydání poskytovaná společností Microsoft. Podívejte se na níže uvedený snímek obrazovky s nejnovější verzí SSDT spolu s odkazem ke stažení.

V tomto tutoriálu budu instalovat verzi 15.9.1. Takže začneme.

Krok 1: Když otevřete soubor .exe, budete před instalací požádáni o restartování systému.

Krok 2: Po restartování systému je vše připraveno. Stačí kliknout na tlačítko „Další“ a postupovat podle pokynů na obrazovce.

Krok 3: Ukáže požadované nástroje a funkce, jako je databáze SQL Server, SSAS, SSRS a SSIS. Ujistěte se, že jste je všechny zaškrtli a klikněte na tlačítko „Instalovat“. Totéž naleznete na níže uvedeném snímku obrazovky.

Dále v tutoriálu SSIS probereme balíček SSIS a jak jej můžete vytvořit pomocí výše uvedených nástrojů.

Co je balíček SSIS?

Balík je základní blok, kde pokračujete a kódujete v SSIS. Nyní „kód“ neodkazuje na žádný programovací jazyk, je to vývoj, který děláte. Takže v podstatě váš vývoj probíhá uvnitř balíčku. Jak bylo uvedeno výše, SSIS je pro ETL nezbytný a balíček SSIS provede proces ETL. Jedná se tedy o objekt, který implementuje funkci Integration Services k extrahování, transformaci a načítání dat . Balíček se skládá z:

  • Připojení
  • Ovládejte prvky toku
  • Prvky toku dat

To je vše pro tento tutoriál SSIS. Doufám, že se vám to líbilo.

Tím se dostáváme na konec tohoto blogu. Doufám, že se vám tento výukový blog Power BI líbil. Toto byl první blog ze série Power BI. Po tomto tutoriálu Power BI bude následovat můj další blog, který se zaměří na řídicí panely Power BI, přečtěte si to také.

Pokud se chcete naučit SSIS a vybudovat si kariéru v oblasti vizualizace dat nebo BI, podívejte se na naši certifikaci školení MSBI který přichází s instruktorem vedeným živým školením a reálnými zkušenostmi z projektů. Toto školení vám pomůže porozumět MSBI do hloubky a pomůže vám dosáhnout ovládnutí předmětu.

Máte na nás otázku? Uveďte to prosím v sekci komentářů „Výukového programu SSIS“ a my se vám ozveme.


  1. Jak ladit ORA-01775:smyčkový řetězec synonym?

  2. Vlastní poskytování uživatelských účtů v PostgreSQL prostřednictvím neprivilegovaného anonymního přístupu

  3. phpMyBackupPro – Webový nástroj pro zálohování MySQL pro Linux

  4. Oracle (11.2.0.1) :Jak identifikovat řádek, který je aktuálně aktualizován příkazem UPDATE