sql >> Databáze >  >> NoSQL >> HBase

Provozní databáze v CDP

Poznámka redakce, srpen 2020:CDP Data Center se nyní nazývá CDP Private Cloud Base. Více se o tom můžete dozvědět zde.

Operační databáze Cloudera (OpDB) v CDP poskytuje v reálném čase, vždy dostupnou, škálovatelnou OpDB, která slouží tradičním strukturovaným datům spolu s novými nestrukturovanými daty v rámci jednotné platformy pro provoz a skladování. Cloudera dodává provozní databázi, která poskytuje tradiční strukturovaná data spolu s novými nestrukturovanými daty v rámci jednotné platformy s otevřeným zdrojovým kódem.

Provozní databáze vám pomůže:

Operacionalizujte strojové učení / umělou inteligenci, abyste způsobili revoluci v odvětvích, jako je zdravotnictví, veřejné služby atd. 

  • Poskytujte obsah v reálném čase na webu.
  • Umožněte analýzu velkých dat pro provozní i offline použití.
  • Použijte jako odolné úložiště záznamů.

OpDB v CDP je v současné době k dispozici ve dvou formách:jako plně bezpečná, částečně řízená nabídka v CDP Public Cloud – Data Hub a jako plně přizpůsobitelná nabídka v CDP Data Center – podobná té, která je již dostupná v CDH a HDP. Můžete si vybrat tvarový faktor na základě vaší strategie nasazení a potřeb OpDB. Provozní databáze používá úložiště objektů, jako je Amazon S3, jako vrstvu úložiště pro Apache HBase, kde se HFiles zapisují do úložiště objektů, ale WAL se zapisují do HDFS.

Operační databáze v CDP má následující součásti: 

  • Apache Phoenix rozhraní SQL, které běží nad Apache HBase.
  • Apache HBase je navržen pro masivní škálovatelnost, takže můžete ukládat neomezené množství dat na jediné platformě a zvládat rostoucí požadavky na poskytování dat.
  • Apache ZooKeeper poskytuje distribuovanou konfigurační službu, synchronizační službu a jmenný registr.
  • Apache Knox Gateway poskytuje perimetrické zabezpečení, takže podnik může s jistotou rozšířit přístup k novým uživatelům.
  • Apache HDFS se používá k zápisu Apache HBase WAL.
  • Pro ukládání souborů Apache HBase HFiles se používá úložiště objektů, jako je Amazon S3 a Microsoft ADLS Gen2.
  • Shared Data Experience (SDX) se používá pro zabezpečení a možnosti správy. Zásady zabezpečení a správy jsou nastaveny jednou a aplikovány na všechna data a pracovní zátěže.
  • IDBroker je rozhraní REST API vytvořené jako součást ověřovacích služeb Apache Knox. Umožňuje ověřenému a autorizovanému uživateli vyměnit sadu pověření nebo token za přístupové tokeny cloudového dodavatele.

Provozní databáze v řadě CDP 

Tento článek vám poskytl úvod o OpDB na CDP a jeho architektuře. Můžete se dozvědět více o každém aspektu OpDB a dozvědět se o nových funkcích a schopnostech OpDB v nadcházejících článcích této série. Odkazy na každý blogový příspěvek aktualizujeme, jakmile budou publikovány.

Přístupnost

OpDB společnosti Cloudera zajišťuje, že uživatelé mohou přistupovat k uloženým datům nebo je získávat. Podporuje automatické i předdefinované sharding, tři dotazovací stroje a několik nástrojů pro integraci dat. Tento článek poskytuje přehled těchto možností a dalších funkcí, které zajišťují dosažení vysoké úrovně přístupnosti.

Administrace

Cloudera OpDB poskytuje několik nástrojů a funkcí pro správu pro správu vaší pracovní zátěže OpDB. Správci mohou nasadit OpDB jako plně zabezpečenou, částečně řízenou nabídku v CDP Public Cloud – Data Hub a jako plně přizpůsobitelnou nabídku v CDP Data Center (podobná tomu, co je dostupné v CDH a HDP). Tento článek vám poskytuje přehled na vysoké úrovni o tom, jaké funkce a nástroje jsou podporovány pro správu OpDB v CDP.

Správa

Cloudera OpDB poskytuje nástroje pro správu, které vám pomohou efektivně spravovat vaše pracovní zatížení OpDB. Tento článek vám poskytuje přehled nástrojů a funkcí pro správu OpDB v CDP.

Dostupnost

OpDB společnosti Cloudera udržuje vysokou úroveň dostupnosti dat a zajišťuje, že požadovaná data budou dostupná, kdykoli a kdekoli je potřeba, i když dojde k selhání uzlu. Tento článek poskytuje přehled funkcí, které umožňují vysokou úroveň dostupnosti, jako je například vysoká dostupnost, replikace dat a ochrana proti chybám.

Integrita

OpDB společnosti Cloudera poskytuje různé možnosti integrity dat včetně integrity entity a domény, transakcí ACID a nerelační integrity. Tento článek poskytuje přehled možností integrity dat OpDB.

Podpora aplikací

Cloudera OpDB podporuje různé populární jazyky, rámce a aplikace, které můžete použít pro přístup k datům uloženým ve vaší OpDB. Tento článek poskytuje přehled podporovaných jazyků, rámců a aplikací.

NoSQL a související schopnosti

Protože OpDB společnosti Cloudera obsahuje databázi NoSQL HBase pro ukládání dat, má funkce NoSQL, jako jsou klíčové hodnoty, možnosti ve stylu tabulek a flexibilní datové typy. K dispozici je také úzká integrace napříč ekosystémem Hadoop, včetně HDFS, Spark a Kafka. Tento článek poskytuje přehled těchto funkcí.

Škálovatelnost

OpDB společnosti Cloudera je navržena pro vysokou škálovatelnost, podporuje vertikální i horizontální škálovatelnost s flexibilním typem dat a bez omezení velikosti dat. Tento článek poskytuje přehled podporovaných funkcí a nástrojů souvisejících se škálovatelností.

Zabezpečení

Cloudera OpDB poskytuje několik bezpečnostních řešení na různých úrovních, pokud jde o šifrování, autentizaci, autorizaci a audit. Tento článek poskytuje přehled těchto funkcí a nástrojů souvisejících se zabezpečením.

Další informace najdete na:Začínáme s provozní databází.


  1. Jak nainstalovat CouchDB na Debian 10

  2. Návrh schématu MongoDB:Vždy existuje schéma

  3. Změna adresáře úložiště dat MongoDB

  4. MongoDB $dateFromString