Úvod
Nástroje Pentaho Data Integration a BA Server jsou dodávány s mnoha různými databázovými ovladači. Od verze 7 Community Edition však nepřicházejí s ovladači JDBC pro Oracle, SQL Server nebo MySQL (v nástrojích Data Integration). Následující kroky popisují, jak přidat ovladače MySQL JDBC do Pentaho.
Pokud tyto nástroje ještě nebyly nainstalovány, postupujte podle těchto pokynů v části Instalace serveru Pentaho BA Server a nástrojů pro integraci dat. Po instalaci nástrojů Pentaho vypněte server BA a software pro integraci dat.
Získání ovladačů MYSQL JDBC
Ovladače JDBC pro MySQL se nazývají „Connector/J“
Navštivte:https://dev.mysql.com/downloads/connector/j/
Přejděte dolů do sekce s možnostmi stahování.
Ujistěte se, že je vybráno „Platform Independent“
Pro operační systém Windows si stáhněte archiv ZIP
Přihlaste se pomocí svého účtu webu Oracle (nebo si jej vytvořte zdarma). Nebo klikněte na Jen spustit stahování odkaz.
Uložte soubor ZIP do složky:
Rozbalte (dekomprimujte) archiv ZIP:
Pokyny pro kopírování ovladačů JDBC do příslušných složek v nástrojích Pentaho jsou popsány na další stránce.
Upozorňujeme, že od listopadu 2019 nebudou nástroje Pentaho verze 8.x fungovat přímo s novějšími ovladači MySQL Connector verze 8.x. Nejjednodušším řešením je použití ovladačů konektoru MySQL 5.x. Řešením je použití ovladačů MySQL verze 8.x, ale použití obecného připojení. Nějakou diskuzi najdete na tomto odkazu. Dalším tipem je nainstalovat PDI MySql Plugin z Pentaho Marketplace v Pentaho Data Integration.
Kopírování souborů ovladače JDBC do složek Pentaho BA Server a Data Integration Lib
Vyhledejte soubor mysql-connector-java-5.1.41-bin.jar (všimněte si, že může mít mírně odlišný název v závislosti na verzi).
Zkopírujte tento soubor .jar do příslušné složky LIB v distribuci Pentaho Community Edition.
Pro Pentaho Data Integration by cílová složka měla být .\Pentaho\data-integration\lib, jak je uvedeno níže:
Pentaho BA Server ukládá své ovladače do složky .\pentaho-server\tomcat\lib. Ujistěte se, že ovladač MySQL JDBC již není nainstalován. Pokud ano, ponechte si pouze nejnovější kopii souboru .jar. Například verze 7.0 serveru Pentaho obsahuje ovladač MySQL JDBC verze mysql-connector-java-5.1.17. Tato verze však obsahuje nějaké chyby, takže nezapomeňte odstranit soubor mysql-connector-java-5.1.17.jar a nahradit jej nejnovějším souborem mysql-connector-java-5.1.41-bin.jar.
Nyní, když byly ovladače JDBC zkopírovány do příslušných složek, restartujte Pentaho BA Server (start-pentaho) a spusťte nástroje pro integraci dat (Spoon). Pokyny pro vytvoření připojení k databázi v Pentaho Data Integration Tools jsou uvedeny na další stránce.
Nastavení připojení MySQL v Pentaho Data Integration
Chcete-li vytvořit nové databázové připojení k MySQL z nástrojů Pentaho Data Integration, postupujte podle této sady kroků. V Pentaho Data Integration mnoho transformačních kroků odesílá data do databázové tabulky. Některé příklady lze nalézt v tomto tutoriálu o Pentaho Data Integration.
Než začnete, budete potřebovat přihlašovací údaje k instanci MySQL. Možná budete chtít navštívit můj výukový program o nastavení bezplatné instance MySQL na GearHost nebo tento výukový program o instalaci MySQL na Windows.
V Pentaho Data Integration vyberte jakýkoli transformační krok, který používá databázi jako výstup, jako je krok Vyhledání/Aktualizace dimenzí, Vložení/Aktualizace nebo Výstup tabulky. Klikněte na Nový tlačítko vedle názvu připojení, aby se zobrazilo dialogové okno Připojení k databázi, jak je uvedeno níže.
Zadejte název připojení a poté vyberte MySQL jako Typ připojení.
Zadejte Název hostitele serveru, na kterém běží MySQL. Pokud máte na místním počítači nebo serveru nainstalovanou MySQL, použijte jako Název hostitele localhost . Zadejte Název databáze a použijte výchozí číslo portu z 3306. Nakonec dejte databázi MySQL Uživatelské jméno a Heslo .
Klikněte na Test a ujistěte se, že připojení k databázi funguje správně.
Pokud se objeví následující chyba, ujistěte se, že soubor .jar ovladače MySQL JDBC byl zkopírován do Pentaho Data Integration lib složky (jak je uvedeno na předchozí stránce tohoto návodu). Ukončete nástroj pro integraci dat a spusťte jej znovu.
Error connecting to database [MySQLConnetion] : org.pentaho.di.core.exception.KettleDatabaseException: Error occurred while trying to connect to the database Driver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) is installed.
Upozorňujeme, že od listopadu 2019 nebudou nástroje Pentaho verze 8.x fungovat přímo s novějšími ovladači MySQL Connector verze 8.x. Nejjednodušším řešením je použití ovladačů konektoru MySQL 5.x. Řešením je použití ovladačů MySQL verze 8.x, ale použití obecného připojení. Nějakou diskuzi najdete na tomto odkazu. Dalším tipem je nainstalovat PDI MySql Plugin z Pentaho Marketplace v Pentaho Data Integration.
Ujistěte se, že jste nastavili cílové schéma v každém výstupu databáze nebo krocích vyhledávání dimenzí. V MySQL může být schéma ponecháno prázdné pro použití výchozí databáze MySQL.
Pokud jste cvičili spouštění transformace proti databázi H2 jako cíli, použili jste k tomu, aby bylo cílové schéma PUBLIC. pro MySQL stačí nechat cílové schéma prázdné, aby bylo použito výchozí.
Další stránka popisuje, jak nastavit nové připojení k databázi a zdroj dat Mondrian v Pentaho BA Server.
Nastavení zdroje dat MySQL na serveru Pentaho BA Server
Na domovské stránce uživatelské konzole Pentaho klikněte na Spravovat zdroje dat vyvolejte obrazovku Správa zdrojů dat. Prvním krokem od tohoto bodu bude vytvoření nového připojení databáze k databázi MySQL.
Kliknutím na ikonu ozubeného kola otevřete nabídku a poté klikněte na Nové připojení… položka nabídky, jak je uvedeno níže.
Zadejte název pro nové připojení k databázi. Jako Typ databáze vyberte MySQL a poté klikněte na možnost Nativní (JDBC) pod Přístup: nadpis. Vyplňte Název hostitele , Název databáze , Číslo portu , Uživatelské jméno a Heslo pro vaši databázi MySQL. Pokud je na vašem místním počítači nebo serveru nainstalována MySQL, použijte jako Název hostitele localhost .
Po dokončení klikněte na modrý Test tlačítko pro otestování připojení k databázi
Pokud se vyskytnou nějaké chyby, zkontrolujte informace o připojení (název hostitele, uživatelské jméno, heslo atd.) a poté test zopakujte.
Pokud se zobrazí chyba týkající se připojení SSL (vaše připojení může po několika minutách vypršet), přidejte parametr useSSL s hodnotou false, jak je uvedeno níže.
Po dokončení klikněte na tlačítko OK tlačítko pro uložení nového databázového připojení. Nové připojení k databázi by se nyní mělo objevit v seznamu:
Nyní, když bylo připojení vytvořeno a otestováno, lze vytvořit zdroj dat Mondrian. Tyto pokyny jsou uvedeny na další stránce.
Vytvoření nového zdroje dat v Pentaho BA Server
V Pentaho BA Server představuje zdroj dat schéma vícerozměrné databáze Mondrian, které je umístěno nad vícerozměrným úložištěm dat nebo relační databází. Zdroj dat vyžaduje připojení k podkladové databázi a nad ním zkonstruovaný datový model Mondrian. Mondrianův datový model se skládá z dimenzí a mír. Dimenze obsahují pole, která jsou naskládána v hierarchii. Je možné mít několik různých datových modelů, které jsou konstruovány nad stejným základním zdrojem dat.
Chcete-li začít s vytvářením nového zdroje dat, klikněte na modré Nový zdroj dat knoflík. Spustí se Průvodce zdrojem dat.
Vyplňte nový název pro Zdroj dat a vyberte Připojení k databázi . Jako Zdroj zvolte databázové tabulky Typ. V tomto příkladu budeme pracovat s hvězdicovým schématem, takže vybereme možnost Přehledy a analýza .
Klikněte na tlačítko Další a server Pentaho BA se dotáže na schéma základní databáze pro připojení k databázi
Na další obrazovce průvodce se zobrazí seznam tabulek, které byly nalezeny ve schématu z Database Connection.
Klikněte na jednu z Dostupných tabulek a poté kliknutím na tlačítko se šipkou doprava jej přesuňte na Vybrané tabulky strana. Tento postup opakujte pro každou z tabulek, které budou zahrnuty do zdroje dat.
Protože tento příklad používá možnost „Přehledy a analýza“, bude třeba vybrat jednu z databázových tabulek jako Tabulku faktů . Po provedení těchto změn klikněte na Další přejděte na poslední krok k definování spojení.
Poznámka:Pokud se neobjeví žádné cizí klíče, ujistěte se, že pracujete s nejnovějším ovladačem MySQL JDBC, protože opravuje několik chyb. mysql-connector-java-5.1.17 je starší verze, která se dodává s Pentaho Server 7.0. Pokud aktualizujete ovladač JDBC, nezapomeňte znovu spustit Pentaho BA Server.
U každého páru tabulek klikněte na Klíčové pole v levé tabulce a souvisejícím klíčovém poli v Pravé tabulce. Poté klikněte na Vytvořit spojení odkaz. V níže uvedeném příkladu bylo vytvořeno spojení mezi tabulkou sales_fact a tabulkou customer_dim pomocí společného klíče customer_dim_id.
Toto opakujte pro každý pár klíčů. V tomto příkladu je jedna tabulka faktů a 5 tabulek dimenzí, což vede k vytvoření 5 spojení. Pokud uděláte chybu, zvýrazněte spojení a klikněte na Smazat spojení odkaz.
Po dokončení klikněte na Dokončit tlačítko.
Klikněte na tlačítko OK pro návrat do Správa zdrojů dat obrazovka.
Nyní byl vytvořen nový zdroj dat s výchozím datovým modelem. Tento datový model však bude vyžadovat určité úpravy. Pokyny k úpravě datového modelu Mondrian jsou uvedeny na další stránce.
Upravte datový model Mondrian tak, aby definoval rozměry a míry
Zvýrazněte zdroj dat, stáhněte dolů ikonu ozubeného kola a vyberte Upravit . Otevře se Editor modelu zdroje dat . Výchozí model zkopíruje všechny sloupce ze schématu jako Rozměry a míry. Tento výchozí model však pravděpodobně nebude fungovat, protože hierarchie musí být ještě definovány.
Vymazání stávajícího datového modelu
Kliknutím na tlačítko zobrazené níže Vymazat aktuální model.
Po zobrazení výzvy k potvrzení klikněte na Ano vymazat model
Model bude nyní vymazán a v polích Míry a rozměry se zobrazí varování, protože zde není žádný obsah.
Vytvoření nového opatření
Vytvořte novou míru přetažením Fakt prodeje z Dostupné stranou na Opatření záznam v části Analýza kartu.
Odstraňte každé z ID dimenzí a ID OBJEDNÁVKY z opatření, protože to ve skutečnosti nejsou míry (jsou to cizí klíče). Klikněte na ID zákazníka dim a poté klikněte na modré X k jeho odstranění. Opakujte pro další ID dimenze.
Vytvoření dimenze ZÁKAZNÍK
Když jsou Measures na místě, lze vytvářet Dimenze. Klikněte na Dimenze a poté klikněte na Přidat dimenzi tlačítko, jak je znázorněno níže.
Pojmenujte tuto novou dimenzi ZÁKAZNÍK (Ujistěte se, že pro dimenze používáte jiné než množné číslo) a klikněte na OK tlačítko.
ZÁKAZNÍK bude vytvořena dimenze a pod ní bude hierarchie ZÁKAZNÍKA:
Otevřete Customer Dim na panelu Dostupné. Přetáhněte pole COUNTRY_NAME a pusťte je do Hierarchie ZÁKAZNÍKA Jak je ukázáno níže. Může to trvat několik pokusů, než to dostanete na správné místo.
Výsledek zobrazí NÁZEV ZEMĚ v hierarchii ZÁKAZNÍKA.
Opakujte výše uvedené kroky pro přidání STATE_PROVINCE a CITY do CUSTOMER Hierarchie. Pro každé z polí v hierarchii ZÁKAZNÍKA změňte typ Zeměpisu tak, aby odpovídal. Například COUNTRY_NAME by měl mít typ zeměpisu „Country“ a STATE_PROVINCE by měl mít typ zeměpisu „Stát“.
Vytvoření dimenze data
Klikněte na položku DIMENSIONS a poté klikněte na Přidat dimenzi knoflík. Novou dimenzi pojmenujte DATE. Klikněte na název dimenze DATUM a zaškrtněte políčko „Časová dimenze“:
Přetáhněte rok prodeje, čtvrtletí prodeje, název měsíce prodeje, den prodeje v roce a datum prodeje na DATE
Hierarchie . Pro každé pole vyberte vhodný Typ časové úrovně a Formát zdrojového sloupce .
Dokončená dimenze DATE by měla vypadat takto:
Vytvoření dimenze PRODUKT
Klikněte na Dimenze a poté klikněte na Přidat dimenzi knoflík. Novou dimenzi pojmenujte PRODUKT. Přetáhněte CATEGORY_NAME, SUB_CATEGORY_NAME a PRODUCT_NAME do Hierarchie PRODUCT .
Klikněte na tlačítko OK zavřete Editor modelu zdroje dat.
Odhlaste se z uživatelské konzole Pentaho, vypněte server Pentaho pomocí skriptu stop-pentaho a poté znovu spusťte Pentaho Server.
Nyní, když byl vytvořen datový model Mondrian, je nový zdroj dat připraven k použití k vytváření vizualizací na řídicím panelu nebo pro účely vytváření sestav.
Vytvoření jednoduchého grafu pomocí OLAP Chart Wizard
Vytvořte nový řídicí panel (nebo upravte stávající řídicí panel) a pomocí průvodce OLAP vytvořte nový graf
Níže je uveden dotaz MDX, který automaticky generuje průvodce OLAP:
select NON EMPTY({Descendants([CUSTOMER].[All CUSTOMERs] ,[CUSTOMER].[CITY])}) on ROWS, NON EMPTY({Descendants([PRODUCT].[All PRODUCTs] ,[PRODUCT].[SUB CATEGORY NAME])}) on Columns from [Customer_Sales]