sql >> Databáze >  >> NoSQL >> MongoDB

Jak seskupit podle různých polí

To byl těžký!

Nejprve prosté řešení:

db.test.aggregate([
 { "$match": { "user": "Hans" } },
 // duplicate each document: one for "age", the other for "childs"
 { $project: { age: "$age", childs: "$childs",
               data: {$literal: ["age", "childs"]}}},
 { $unwind: "$data" },
 // pivot data to something like { data: "age", value: "40" }
 { $project: { data: "$data",
               value: {$cond: [{$eq: ["$data", "age"]},
                               "$age", 
                               "$childs"]} }},
 // Group by data type, and count
 { $group: { _id: {data: "$data", value: "$value" }, 
             count: { $sum: 1 }, 
             value: {$first: "$value"} }},
 // aggregate values in an array for each independant (type,value) pair
 { $group: { _id: "$_id.data", values: { $push: { count: "$count", value: "$value" }} }} ,
 // project value to the correctly name field
 { $project: { result: {$cond: [{$eq: ["$_id", "age"]},
                               {age: "$values" }, 
                               {childs: "$values"}]} }},
 // group all data in the result array, and remove unneeded `_id` field 
 { $group: { _id: null, result: { $push: "$result" }}},
 { $project: { _id: 0, result: 1}}
])

Výroba:

{
    "result" : [
        {
            "age" : [
                {
                    "count" : 3,
                    "value" : "40"
                },
                {
                    "count" : 1,
                    "value" : "50"
                }
            ]
        },
        {
            "childs" : [
                {
                    "count" : 1,
                    "value" : "1"
                },
                {
                    "count" : 3,
                    "value" : "2"
                }
            ]
        }
    ]
}

A nyní několik vysvětlení:

Jedním z hlavních problémů je, že každý příchozí dokument musí být součástí dvou různé částky. Vyřešil jsem to přidáním doslovného pole ["age", "childs"] do vašich dokumentů a poté je rozvinout podle tohoto pole. Tímto způsobem bude každý dokument prezentován dvakrát v pozdější fázi.

Jakmile to udělám, pro usnadnění zpracování změním reprezentaci dat na něco mnohem lépe ovladatelného, ​​jako je { data: "age", value: "40" }

Následující kroky provedou agregaci dat jako takovou. Až do třetího $project krok, který namapuje pole hodnot na odpovídající age nebo childs pole.

Poslední dva kroky jednoduše zabalí dva dokumenty do jednoho a odstraní nepotřebné _id pole.

Pff!




  1. Transformujte data MongoDB při hledání

  2. Rozdělit data kolem vyhledávacího dotazu během agregace

  3. 5 způsobů, jak získat měsíc z data v MongoDB

  4. MongoDB - odstranění nenumerických znaků v poli