sql >> Databáze >  >> NoSQL >> MongoDB

Vkládání nových polí (sloupců) do mongoDB s pandami

Metoda, kterou potřebujete, je update_one() s upsert=True ve smyčce; nemůžete použít insert_many() ze dvou důvodů; za prvé vaše ne vždy vkládání; někdy aktualizujete; za druhé update_many() (a insert_many() ) pracovat pouze s jedním filtrem; ve vašem případě je každý filtr jiný, protože každá aktualizace se týká jiného času.

Toto je obecné řešení, které bude kombinovat datové rámce (df_a , df_b v tomto případě - můžete jich mít tolik, kolik chcete) způsobem, který potřebujete. Používá iterrows Chcete-li získat každý řádek datového rámce, vyfiltruje datum a nastaví hodnoty na hodnoty v datovém rámci. $set operátor přepíše hodnoty, pokud již existují, a nastaví je, pokud nejsou nastaveny. upsert=True provede vložení, pokud se datum neshoduje.

for df in [df_a, df_b]:
    for _, row in df.iterrows():
        db.mycollection.update_one({'date': row.get('date')}, {'$set': row.to_dict()}, upsert=True)

Plně zpracovaný příklad:

from pymongo import MongoClient
from pprint import pprint
import datetime
import pandas as pd

# Sample data setup

db = MongoClient()['mydatabase']

data_a = [[datetime.datetime(2017, 5, 19, 21, 20), 96, 8, 98],
          [datetime.datetime(2017, 5, 19, 21, 21), 95, 8, 97],
          [datetime.datetime(2017, 5, 19, 21, 22), 95, 8, 97]]

df_a = pd.DataFrame(data_a, columns=['date', 'std_500_1000window', 'std_50_100window', 'std_50_2000window'])

data_b = [[datetime.datetime(2017, 5, 19, 21, 20), 98, 9, 10],
          [datetime.datetime(2017, 5, 19, 21, 21), 98, 9, 10],
          [datetime.datetime(2017, 5, 19, 21, 22), 98, 9, 10]]

df_b = pd.DataFrame(data_b, columns=['date', 'std_50_3000window', 'std_50_300window', 'std_50_500window'])

# Perform the upserts

for df in [df_a, df_b]:
    for _, row in df.iterrows():
        db.mycollection.update_one({'date': row.get('date')}, {'$set': row.to_dict()}, upsert=True)

# Print the results

for record in db.mycollection.find():
    pprint(record)

Výsledek:

{'_id': ObjectId('5f0ae909df5531ac655ce528'),
 'date': datetime.datetime(2017, 5, 19, 21, 20),
 'std_500_1000window': 96,
 'std_50_100window': 8,
 'std_50_2000window': 98,
 'std_50_3000window': 98,
 'std_50_300window': 9,
 'std_50_500window': 10}
{'_id': ObjectId('5f0ae909df5531ac655ce52a'),
 'date': datetime.datetime(2017, 5, 19, 21, 21),
 'std_500_1000window': 95,
 'std_50_100window': 8,
 'std_50_2000window': 97,
 'std_50_3000window': 98,
 'std_50_300window': 9,
 'std_50_500window': 10}
{'_id': ObjectId('5f0ae909df5531ac655ce52c'),
 'date': datetime.datetime(2017, 5, 19, 21, 22),
 'std_500_1000window': 95,
 'std_50_100window': 8,
 'std_50_2000window': 97,
 'std_50_3000window': 98,
 'std_50_300window': 9,
 'std_50_500window': 10}



  1. V MongoDB.Bson.dll došlo k výjimce System.FormatException – XXX není platný 24místný hexadecimální řetězec

  2. Jak mohu chránit svou cestu /sidekiq heslem (tj. vyžadovat ověření pro nástroj Sidekiq::Web)?

  3. Mongo:vyhledejte vnořený dokument bez tečkové notace

  4. Existují nějaké nástroje pro odhad velikosti indexu v MongoDB?