MongoDB ukládá data ve zcela jiném formátu, nazývaném BSON, který zabere více místa na disku. Nejen, že hodnoty musí být uloženy pro každé pole, ale také bude muset znovu uložit názvy sloupců v každém dokumentu (řádku). Pokud máte velké názvy sloupců, může to určitě zvýšit velikost v MongoDB na 8 až 10krát větší než váš soubor CSV. Pokud je to možné, můžete se podívat na zkrácení názvů polí, pokud je to pro vás příliš.
MongoDB také předběžně přiděluje datové soubory pro vás. Například ve chvíli, kdy začne přidávat data do taq.2
, vytvoří taq.3
, a podobně, když začne zapisovat do taq.4
vytvoří tag.5
. Takže ve vašem případě, řekněme, že váš 230 MB soubor by vytvořil 1,9 GB dat, MongoDB již přidělil 2,0G taq.5
. Toto chování lze vypnout zadáním --noprealloc
na příkazovém řádku při spouštění mongod
.