sql >> Databáze >  >> NoSQL >> HBase

Jak na to:Přidejte Cloudera Search do svého clusteru pomocí Cloudera Manager

Cloudera Manager 4.7 přidal podporu pro správu Cloudera Search 1.0. Uživatelé Cloudera Manager tak mohou snadno nasadit všechny komponenty Cloudera Search (včetně Apache Solr) a spravovat všechny související služby, stejně jako všechny ostatní služby zahrnuté v CDH (distribuce Apache Hadoop a souvisejících projektů Cloudera).

V tomto návodu se naučíte kroky spojené s přidáním Cloudera Search do clusteru Cloudera Enterprise (CDH + Cloudera Manager).

Instalace balíku SOLR

V našem příkladu cluster používá balíček CDH 4.4 a běží na něm služby Apache ZooKeeper, HDFS a Apache HBase. (Balíčky jsou opravdu užitečným způsobem, jak nasadit nový software a provádět bezbolestné upgrady prostřednictvím Cloudera Manager.)

Pokud byste si chtěli stáhnout balík SOLR přímo z Cloudera, můžete použít výchozí nastavení pro „Adresy URL vzdáleného úložiště balíků“ (v části Parcely části na kartě Správa), jak je uvedeno níže:

Nastavení adresy URL úložiště balíků

Pokud chcete použít místní úložiště (tedy nejprve stáhnout balíček z Cloudera a poté nainstalovat z místní kopie), můžete postupovat podle pokynů zde. Další kroky jsou „Stáhnout“, „Distribuovat“ a „Aktivovat“ zásilku ze stránky Balíčky na kartě Hostitelé.

Rozmístění zásilky SOLR

Jakmile je balíček aktivován, máte všechny součásti Cloudera Search (Solr, Lily HBase Indexer a Apache Flume's Morphlines Sink) připraveny k použití spolu s CDH.

Dalším krokem je přidání služby Apache Solr do vašeho clusteru. V nabídce „Akce“ vašeho clusteru na kartě Služby vyberte „Přidat službu“, čímž se dostanete do „Průvodce přidáním služby“ v Cloudera Manager. Jakmile budete postupovat podle kroků v průvodci a zvolíte, kde se mají servery Solr spouštět, dostanete se na stránku pracovního postupu, která inicializuje službu Solr a spustí všechny servery Solr.

Zprovoznění a spuštění služby Solr

To je vše – služba Solr je nyní připravena k použití! Postupujte podle pokynů v Uživatelské příručce Cloudera Search vytvářet kolekce a přidávat do nich dokumenty pro indexování. Snímek obrazovky níže ukazuje, jak vytvořit kolekci pomocí výchozího schématu Solr.

Vytvoření první kolekce

Přidání Lily HBase Indexer

Cloudera Manager 4.7 také poskytuje podporu pro Lily HBase Indexer, který je součástí balíčku SOLR. Lily HBase Indexer Service je flexibilní, škálovatelný, odolný vůči chybám, transakční systém téměř v reálném čase pro zpracování nepřetržitého proudu aktualizací buněk HBase do indexů živého vyhledávání. Chcete-li ji použít, přidejte službu „Keystore Indexer“ prostřednictvím „Průvodce přidáním služby“.

Než však budete moci použít Lily HBase Indexer, musíte se ujistit, že replikace a indexování jsou povoleny ve službě HBase v klastru. Tyto vlastnosti můžete změnit na konfigurační stránce služby HBase v části „Záloha“.

Nastavení vlastností HBase pro Lily HBase Indexer

Všimněte si také, že Cloudera Manager obsahuje výchozí soubor Cloudera Morphlines, který může použít Lily HBase Indexer. Chcete-li upravit tento soubor tak, aby používal vaše vlastní funkce, měli byste přejít do služby Keystore Indexer a upravit konfiguraci Morphlines, jak je uvedeno níže:

Úprava morflinek Cloudera pro Lily HBase Indexer

Jakmile jsou tyto změny provedeny, můžete začít používat Lily HBase Indexer k indexování jakýchkoli dat přicházejících do HBase podle pokynů v Uživatelské příručce Lily HBase Indexer . Tento blogový příspěvek také poskytuje skvělý příklad toho, jak indexovat e-maily pomocí HBase a Cloudera Search.

Závěr

Nyní víte, jak snadné je nasazení, konfigurace a správa služby Cloudera Search do vašeho CDH clusteru pomocí Cloudera Manager. Počínaje Cloudera Enterprise 5 (ve verzi beta v době psaní tohoto článku) se Cloudera Search a indexátor Lily HBase nainstalují a spustí ve výchozím nastavení – tento proces je ještě jednodušší.

Vikram Srivastava je softwarový inženýr ve společnosti Cloudera.


  1. Jak nainstalovat Apache CouchDB na CentOS 8

  2. Jak změním databázi redis?

  3. Použití operátoru $slice k získání posledního prvku pole

  4. MongoDB $ and Agregation Pipeline Operator