Cloudera Data Platform (CDP) je nejnovější Big Data nabídka od Cloudera. Zahrnuje Apache HBase a Phoenix jako součást platformy. Tyto dvě součásti jsou poskytovány ve 3 formových faktorech:
- Pro on-prem nasazení jsou k dispozici podobným způsobem jako CDH &HDP (v rámci nabídky CDP Private Cloud)
- Pro zákazníky, kteří chtějí databázi spravovat sami v AWS &Azure, je k dispozici jako součást nabídky CDP Public Cloud DataHub (se šablonou Operational Database nebo v Custom nasazení DataHubu)
- Brzy bude k dispozici jako součást Cloudera Operational Database (COD), což je plně spravovaná nabídka, která eliminuje režii na správu provozování nasazení HBase
Zákazníci Cloudera Apache HBase obvykle provozují kritické aplikace, které si nemohou dovolit žádné prostoje. Potřebují způsob, jak migrovat na nové nasazení, buď bez výpadku výroby, nebo minimálně s malým výpadkem. S ohledem na tyto úvahy o upgradu, zejména s nadcházejícím koncem podpory pro CDH5 a HDP 2, jsme vyvinuli Cloudera OpDB Replication Plugin .
Mnoho společností také nasazuje clustery HBase založené na CDH 6, HDP 3 a EMR, ale snaží se snížit nebo odstranit provozní režii údržby clusterů HBase. Pro ně je to Cloudera OpDB Replication Plugin může jim umožnit migraci na DataHub nebo COD, aniž by došlo k výpadkům nebo výpadkům výroby.
Modul Replication Plugin podporuje replikaci z následujících zdrojových clusterů HBase:
- CDH 5.14
- CDH 6.3
- HDP 2.6.5
- HDP 3.1.5
- EMR 5,28
Replikace HBase
HBase poskytuje vyspělou, funkčně bohatou replikační schopnost již téměř deset let. Replikace je jednou z nejoblíbenějších funkcí HBase, protože poskytuje řešení pro automatickou obnovu po havárii (DR), podporuje migraci dat, podporuje rozdělení pracovní zátěže a/nebo podporuje sekundární index založený na vyhledávání prostřednictvím integrace s Apache Solr. Podrobná diskuse o tom, jak HBase Replication funguje a jak nakonfigurovat replikaci, je vysvětlena v HBase Reference Guide a byla probrána v mnoha článcích Cloudera Blog. Dnes podporuje mnoho topologií včetně:
- Fan-in
- Rozvětvení
- Cyklicky
- Obousměrný
Replikaci HBase lze konfigurovat na úrovni jmenného prostoru (tj. databáze) nebo tabulky. Přestože je ve své podstatě téměř v reálném čase, lze jej nakonfigurovat tak, aby byl nakonec konzistentní nebo konzistentní s časovou osou.
Cloudera OpDB Replication Plugin podporuje pouze cílový cluster poskytovaný CDP DataHub Clusterem nebo databází COD, nasazený buď v AWS nebo Azure.
Navázání důvěry
Dosavadní replikace HBase vyžaduje, aby všechny zúčastněné clustery měly stejné definice zabezpečení, jinými slovy, všechny clustery nesmějí mít povoleno žádné zabezpečení (konfigurace ověřování nastavena na jednoduché) nebo všechny clustery musí mít povoleno zabezpečení pomocí kerberos (konfigurace ověřování nastavena na kerberos) .
Když je použit Kerberos, musí všechny klastrové principály Kerberos patřit do stejné sféry, nebo pokud jsou v různých sférách, musí být důvěryhodné mezi sebou (běžně známé jako cross-realm autentizace).
Konfigurace důvěry mezi sférami pomocí Kerberos je problematické ve většině organizací, protože podnikové bezpečnostní politiky to obvykle zakazují. K vyřešení tohoto problému použijte plugin Cloudera OpDB Replication rozšiřuje replikaci HBase o alternativní metodu ověřování, která umožňuje replikaci napříč doménami zabezpečení. Modul replikace umožňuje replikaci
- Ve více doménách Kerberos bez nutnosti důvěry napříč sférami
- Replikace ze zabezpečených na nezabezpečené clustery a
- Replikace z nezabezpečených do zabezpečených clusterů.
K vytvoření důvěryhodnosti z CDP clusterů pro clustery, které buď nemají žádné konfigurace zabezpečení nebo jsou zabezpečeny pomocí Kerberos, implementuje modul Replication Plugin nový mechanismus ověřování pomocí sdíleného tajného klíče, který je vytvořen pomocí poskytnutého nástroje a uložen ve zdrojovém i cílovém clusteru.
Závěr
Replikace je cenným nástrojem pro implementaci řešení migrace DR a datových center (DC) pro HBase. Má to několik výhrad, jak je zde ukázáno při práci s konfiguracemi zabezpečení clusterů. S blížícím se koncem životnosti CDH 5 a HDP 2 je schopnost migrovat data z těchto starších platforem na CDP naprosto nezbytná.
Zákazníkům s nasazením HBase založeným na HDP3, CDH6 a EMR 5.28 umožňuje tento plugin těmto zákazníkům bezproblémově přijmout plně spravované řešení HBase a výrazně snížit provozní režii správy HBase.
Pokud máte zájem o nasazení Cloudera OpDB Replication Plugin ve vašem prostředí, obraťte se na svůj tým pro účty Cloudera.