sql >> Databáze >  >> NoSQL >> HBase

Apache Phoenix pro CDH

Apache Phoenix pro CDH:Nejlepší nová funkce pro DBMS

Cloudera přijímá a bude podporovat Apache Phoenix pro CDH, zatímco jej bude průběžně integrovat do své datové platformy Cloudera.

Vydání CDH společnosti Cloudera zahrnuje Apache HBase, který poskytuje odolný NoSQL DBMS pro provozní aplikace zákazníků, kteří chtějí využít sílu velkých dat. Tyto aplikace se rozrostly v důležité a kritické aplikace, které řídí nejvyšší výnosy a ziskovost. Tyto aplikace zahrnují aplikace zaměřené na zákazníky, platformy elektronického obchodu, odhalování rizik a podvodů používané v zákulisí v bankách nebo obsluhující modely AI/ML pro aplikace a umožňující další posílení jejich školení na základě skutečných výsledků.

Pro mnoho zákazníků je však HBase příliš skličující cestou – vyžaduje, aby se učili

  • Nový datový model jako HBase je schéma široké tabulky podporující miliony sloupců, ale žádná spojení a
  • Použití rozhraní Java API místo ANSI SQL

Požádali, aby mohli používat tradičnější návrh schémat, který se podobá tomu, který poskytuje Oracle nebo MySQL, a byli ochotni udělat určité kompromisy ohledně flexibility, např.

  • Jsou ochotni použít poskytnuté datové typy namísto definování svých vlastních
  • Jsou ochotni vzdát se flexibility, aby jeden sloupec měl více typů v závislosti na řádku výměnou za jeden typ v jednom řádku

Umožnit zákazníkům snadný přechod k dalším výhodám Apache HBase (neomezené škálování, miliony řádků, vývoj schémat atd.) a zároveň poskytovat funkce podobné RDBMS (ANSI SQL, jednoduchá spojení, datové typy mimo box atd.), zavádíme podporu pro Apache Phoenix na CDH.

Pro všechny ostatní aplikace založené na Phoenixu také těží ze zákulisních optimalizací HBase, což usnadňuje dosažení lepšího výkonu HBase. Například Phoenix implementuje solení primárních klíčů – takže uživatelé HBase nemusí promýšlet tento aspekt návrhu klíče.

Kromě toho mohou aplikace založené na Phoenixu koexistovat s aplikacemi HBase – což znamená, že můžete použít jeden cluster HBase pro podporu obou. S Phoenixem mohou zákazníci nadále používat své oblíbené nástroje BI a dashboarding stejně jako v minulosti s Hive &Impala. Když používají Phoenix, mohou se také rozhodnout přímo používat Phoenix s těmito nástroji kromě možnosti používat Hive / Impala, což eliminuje krok pro nové implementace.

Z hlediska zabezpečení a správy (SDX) v CDH Phoenix používá HBase ACL pro řízení přístupu založeného na rolích pro tabulky Phoenix. Phoenix také používá integraci HBase do Cloudera Navigator pro informace o auditu.

Cloudera vydala balíček Phoenix 4.14.1 dostupný zákazníkům CDH 5.16.2 a balíček Phoenix 5.0 dostupný zákazníkům CDH 6.2+.

Stávající zákazníci HDP již mají podporu Apache Phoenix a téměř polovina uživatelů HBase používajících HDP v současné době používá Phoenix, což také svědčí o jeho popularitě v komunitě uživatelů HBase.

Stáhněte si Apache Phoenix pro CDH 

Vytvářejte kritické aplikace pomocí Apache Phoenix. Stáhněte si software zde.

Často kladené otázky o Phoenix

O) Jaké jsou pracovní zátěže, pro které by se měl Phoenix používat

Phoenix podporuje stejné případy použití jako HBase, především úlohy s nízkou latencí a vysokou souběžností. Phoenix však usnadňuje také využití podkladových dat pro účely dashboardingu a BI

O) Jaký je mechanismus autorizace u společnosti Phoenix?

Phoenix závisí na autorizaci HBase. Pro zákazníky CDH to využívá HBase ACL. Pro zákazníky HDP je to prostřednictvím integrace HBase-Ranger

O)  Jaká je škálovatelnost Phoenixu? Jaký je největší známý shluk?

Phoenix se škáluje na stovky TB dat. Největší zákazník má přes 0,5 PB dat, která spravuje Phoenix. Podrobnosti o případech použití lze nalézt v archivech PhoenixCon a v archivech videí ze dne NoSQL z počátku tohoto roku ve vlastních slovech a slidech uživatelů.

O) Podporuje Phoenix sekundární geoprostorové indexování? Jaká úroveň podpory prostorových dat?

Má omezenou podporu pro geo-prostorová data. GeoMesa však poskytuje geoprostorovou vrstvu na HBase, která může tuto potřebu podporovat a integruje se se zákaznickými aplikacemi. Phoenix, GeoMesa i JanusGraph a OpenTSDB mohou koexistovat v jediném clusteru HBase.

O) Jak vytváříte a používáte index?

Podrobnosti o indexování najdete na stránce sekundární indexování Phoenixu. Počínaje verzí Phoenix 4.8.0 nejsou pro použití místního indexování vyžadovány žádné změny konfigurace.

O)  Existuje omezení počtu sloupců, které můžete umístit do indexu?

Podobně jako v RDBMS je index v podstatě samostatná tabulka s indexem a odkazem na zdrojová data. Pokud indexujete všechny sloupce, zmaříte účel tím, že budete udržovat dvě identické tabulky. Indexy by měly být používány uvážlivě, protože existuje určitá netriviální režie při zápisu (globální indexy) nebo čtení (lokální indexy).


  1. Node.js + mongoose najít zamrzne uzel, když více než 100 výsledků

  2. Node.js, (Hi)Redis a příkaz multi

  3. jak mohu vidět, na kterých portech mongo poslouchá z mongo shell?

  4. Instalace MongoDB s Homebrew