sql >> Databáze >  >> NoSQL >> MongoDB

Získávání vnořených dat z MongoDB do datového rámce Pandas

Tuto funkci používám k získání vnořených řádků JSON do datového rámce. Používá praktický pandas json.normalize funkce:

import pandas as pd
from bson import json_util, ObjectId
from pandas.io.json import json_normalize
import json

def mongo_to_dataframe(mongo_data):

        sanitized = json.loads(json_util.dumps(mongo_data))
        normalized = json_normalize(sanitized)
        df = pd.DataFrame(normalized)

        return df

Stačí předat svá mongo data voláním funkce s nimi jako argument.

sanitized = json.loads(json_util.dumps(mongo_data)) načte řádky JSON jako běžný JSON

normalized = json_normalize(sanitized) zruší vnoření dat

df = pd.DataFrame(normalized) jednoduše z něj udělá datový rámec




  1. Importujte data csv jako pole v mongodb pomocí mongoimport

  2. Efektivní stránkování v MongoDB pomocí mgo

  3. Najděte všechny duplicitní dokumenty v kolekci MongoDB podle klíčového pole

  4. Vylepšete agregační strukturu MongoDB