sql >> Databáze >  >> NoSQL >> MongoDB

jak ukládat zpracovaná data z hdfs pomocí mapReduce v mongoDB jako výstup

V podstatě to, co potřebujete, je změnit "třídu výstupního formátu" a máte několik způsobů:

  1. Použijte konektor MongoDB pro Hadoop :http://docs.mongodb.org/ecosystem/tools /hadoop/?_ga=1.111209414.370990604.1441913822
  2. Implementujte svůj vlastní OutputFormat :https://hadoop. apache.org/docs/r2.7.0/api/org/apache/hadoop/mapred/OutputFormat.html (Místo toho použijte FileOutputFormat).
  3. Provádět mongodb dotazy uvnitř reduktoru místo toho psát v kontextu MapREduce (Není to hezké, můžete skončit s prázdnými výstupními soubory v HDFS v závislosti na OutputFormat zadaném v ovladači)

Podle mého názoru je možnost 1 nejlepší možností, ale nepoužil jsem konektor MongoDB, abych řekl, zda je dostatečně stabilní a funkční. Možnost 2 vyžaduje, abyste skutečně rozuměli tomu, jak funguje hadoop v podsvětí, abyste se vyhnuli konci se spoustou otevřených spojení a problémů s transakcemi a opakováním úloh hadoop.




  1. Jak mám navrhnout svůj DB &API server pro tahovou multiplayerovou deskovou hru pro iPhone? (přemýšlím o nodejs, mongo, gauči atd.)

  2. V mongodb znáte index prvku pole shodný s operátorem $in?

  3. takže vaše HBase je rozbitá

  4. Mongoose vrátí hodnotu nedefinovaná pro existující pole