To je skvělý začátek!
Určitě bych to všechno srovnal (tj. denormalizovat ) a připravte si produktové dokumenty, které vypadají jako níže uvedený. Tímto způsobem se zbavíte vztahu N:M mezi produkty a příznaky jednoduchým vytvořením flags
pole pro každý produkt. Bude tedy snazší dotazovat se na tyto příznaky.
{
"id": "00c8234d71c4e94f725cd432ebc04",
"title": "Alpha",
"price": 589.0,
"flags": ["Sellout", "Top Product"]
}
{
"id": "018357657529fef056cf396626812",
"title": "Beta",
"price": 355.0,
"flags": ["Discount"]
}
{
"id": "01a2c32ceeff0fc6b7dd4fc4302ab",
"title": "Gamma",
"price": 0.0,
"flags": ["Discount"]
}
Typ mapování produktu by vypadal takto:
PUT products
{
"mappings": {
"product": {
"properties": {
"id": {
"type": "string",
"index": "not_analyzed"
},
"title": {
"type": "string"
},
"price": {
"type": "double",
"null_value": 0.0
},
"flags": {
"type": "string",
"index": "not_analyzed"
}
}
}
}
}
Protože máte logstash jdbc
již jste zadali, jediné, co vám chybí, je správný SQL dotaz pro načtení produktů a souvisejících příznaků.
SELECT p.Id as id, p.Title as title, p.Price as price, GROUP_CONCAT(f.Title) as flags
FROM Products p
JOIN flagsProducts fp ON fp.ProductId = p.Id
JOIN Flags f ON fp.FlagId = f.id
GROUP BY p.Id
Což by vám přineslo řádky jako tyto:
+-------------------------------+-------+-------+---------------------+
| id | title | price | flags |
+-------------------------------+-------+-------+---------------------+
| 00c8234d71c4e94f725cd432ebc04 | Alpha | 589 | Sellout,Top product |
| 018357657529fef056cf396626812 | Beta | 355 | Discount |
| 01a2c32ceeff0fc6b7dd4fc4302ab | Gamma | 0 | Discount |
+-------------------------------+-------+-------+---------------------+
Pomocí filtrů Logstash pak můžete rozdělit flags
do pole a můžete jít.