Cloudera Data Platform (CDP) Data Center je kompletní datová platforma, která sjednocuje nejnovější open-source analytiku – Spark, Impala, Hive, HBase, Kafka, Hadoop a další – do multifunkčního analytického systému a systému pro správu dat, který obsahuje:
- Výkonnější analýza SQL
- Zpracování a správa streamu v reálném čase
- Granulární řízení přístupu založené na atributech
- Dynamické filtrování sloupců a maskování řádků
- 10násobné zvýšení škálovatelnosti souborů a objektů
Použil jsem modul Terraform (v0.12), který nasazuje CDP Data Center na Oracle Cloud Infrastructure (OCI).
Tato šablona podporuje cílení na existující VCN/podsítě pro nasazení clusteru. Chcete-li použít tuto funkci, stačí pomocí systému nabídek schémat vybrat existující cíl VCN a poté vybrat vhodné podsítě pro každý typ hostitele clusteru.
1. Stáhněte si soubor zip pro nasazení Cloudera Terraform pomocí Správce zdrojů .
2. Přihlaste se do Oracle Cloud Infrastructure (OCI)
3. Vyberte Správce zdrojů a klikněte na Zásobníky
4. Klikněte na Vytvořit sadu .
5. Na stránce Informace o zásobníku nahrajte soubor zip, který jste stáhli v kroku 1, a poté klikněte na Další .
6. Na stránce Konfigurovat proměnné zadejte obsah „klíče poskytnutého SSH“ (volitelné). Poznámka:Pokud nasadíte Cloudera Manager do soukromé podsítě, budete potřebovat VPN nebo SSH tunel prostřednictvím Edge Node pro přístup ke správě clusteru. Když vytváříte VPC, musíte zadat rozsah adres IPv4 pro VPC ve formě bloku Classless Inter-Domain Routing (CIDR), například 10.0.0.0/16. Klikněte na Další .
7. Ověřte svou konfiguraci a klikněte na Vytvořit.
9. Z Akce Terraform vyberte v nabídce Plán
10. Klikněte na Plánovat
11. Počkejte několik okamžiků na dokončení této úlohy.
12. Terraform byl úspěšně inicializován.
13. Úloha dokončena úspěšně
14. Diagram znázorňující, co se obvykle nasazuje pomocí této šablony. Zdroje jsou automaticky distribuovány mezi „chybové domény“ v „dostupné doméně“, aby byla zajištěna odolnost proti chybám.
Odkazy
Přečtěte si o nasazení Hadoop na Oracle Cloud Infrastructure. Dostupné na https://docs.oracle.com/en/solutions/learn-deploy-hadoop-oci/index.html#GUID-6BC025FF-829B-4BBD-9C80-69044F61F35B
Snadné nasazení Hadoop na infrastrukturu Oracle Cloud pomocí Správce zdrojů. Dostupné na https://blogs.oracle.com/cloud-infrastructure/deploy-hadoop-easily-on-oracle-cloud-infrastructure-using-resource-manager
Cloudera na Oracle Cloud Infrastructure (šablona nasazení Terraform). Dostupné na https://github.com/oracle-quickstart/oci-cloudera
Přehled Správce zdrojů. Dostupné na https://docs.cloud.oracle.com/en-us/iaas/Content/ResourceManager/Concepts/resourcemanager.htm
Datové centrum CDP. Dostupné na https://docs.cloudera.com/cdp/latest/overview/topics/cdpdc-overview.html