Výkon MongoDB na agregační dotazy

Cílem je zlepšit výkon agregačních dotazů pomocí MapReduce na sdílené databázi, která je distribuována na více počítačích.

Provedl jsem několik srovnání výkonu Mongo's Mapreduce s příkazem group-by-select v Oracle na stejném počítači. Zjistil jsem, že Mongo byl přibližně 25krát pomalejší. To znamená, že musím data rozdělit alespoň na 25 počítačů, abych s Mongo dosáhl stejného výkonu, jaký poskytuje Oracle na jednom počítači. Použil jsem kolekci/tabulku s přibližně 14 miliony dokumentů/řádků.

Export dat z mongo přes mongoexport.exe a použití exportovaných dat jako externí tabulky v Oracle a provedení group-by v Oracle bylo mnohem rychlejší než použití vlastního MapReduce Mongo.