To byl těžký!
Nejprve prosté řešení:
db.test.aggregate([
{ "$match": { "user": "Hans" } },
// duplicate each document: one for "age", the other for "childs"
{ $project: { age: "$age", childs: "$childs",
data: {$literal: ["age", "childs"]}}},
{ $unwind: "$data" },
// pivot data to something like { data: "age", value: "40" }
{ $project: { data: "$data",
value: {$cond: [{$eq: ["$data", "age"]},
"$age",
"$childs"]} }},
// Group by data type, and count
{ $group: { _id: {data: "$data", value: "$value" },
count: { $sum: 1 },
value: {$first: "$value"} }},
// aggregate values in an array for each independant (type,value) pair
{ $group: { _id: "$_id.data", values: { $push: { count: "$count", value: "$value" }} }} ,
// project value to the correctly name field
{ $project: { result: {$cond: [{$eq: ["$_id", "age"]},
{age: "$values" },
{childs: "$values"}]} }},
// group all data in the result array, and remove unneeded `_id` field
{ $group: { _id: null, result: { $push: "$result" }}},
{ $project: { _id: 0, result: 1}}
])
Výroba:
{
"result" : [
{
"age" : [
{
"count" : 3,
"value" : "40"
},
{
"count" : 1,
"value" : "50"
}
]
},
{
"childs" : [
{
"count" : 1,
"value" : "1"
},
{
"count" : 3,
"value" : "2"
}
]
}
]
}
A nyní několik vysvětlení:
Jedním z hlavních problémů je, že každý příchozí dokument musí být součástí dvou různé částky. Vyřešil jsem to přidáním doslovného pole ["age", "childs"]
do vašich dokumentů a poté je rozvinout podle tohoto pole. Tímto způsobem bude každý dokument prezentován dvakrát v pozdější fázi.
Jakmile to udělám, pro usnadnění zpracování změním reprezentaci dat na něco mnohem lépe ovladatelného, jako je { data: "age", value: "40" }
Následující kroky provedou agregaci dat jako takovou. Až do třetího $project
krok, který namapuje pole hodnot na odpovídající age
nebo childs
pole.
Poslední dva kroky jednoduše zabalí dva dokumenty do jednoho a odstraní nepotřebné _id
pole.
Pff!