sql >> Databáze >  >> RDS >> Mysql

Implementace twitteru a facebooku jako hashtagů

Začátkem s MongoDB by bylo analyzovat každou zprávu na hashtagy, které uživatel použil, a vložit je do dílčího pole dokumentu. Příklad aktualizace stavu:

Tato zpráva by v MongoDB vypadala takto:

{
    author: "Peter",
    date: ISODate("2014-04-29 12:28:34"),
    text: "Hello friends, I visited the #tradeshow in #washington and drank a delicious #coffee",
    hashtags: [
        "tradeshow",
        "washington",
        "coffee"
    ]
}

Když pak vytvoříte index na db.collection.hashtags můžete rychle vyhledat všechny zprávy, které obsahují jeden z těchto hashtagů. Pravděpodobně budete chtít seřadit a omezit výsledky podle data, aby uživatel viděl jako první nejnovější výsledky. Když z něj uděláte složený index, který obsahuje také datum, můžete to také urychlit.

Jak implementovat „trendy“ témata je poměrně složitá otázka. Je to také velmi subjektivní v závislosti na tom, co byste považovali za "trendy". Přesné algoritmy, které Twitter nebo Facebook používají k určení, která témata jsou nebo nejsou trendy, nejsou veřejné. Podle různých analytiků sociálních médií je také často mění, takže můžeme předpokládat, že jsou nyní poměrně složité.

To znamená, že vám nemůžeme pomoci přijít s algoritmem sami. Ale když už máte na mysli algoritmus pro výpočet "trendy" hashtagu, mohli bychom vám pomoci najít dobrou implementaci.




  1. ScaleGrid PostgreSQL na cloudové infrastruktuře VMware

  2. PG::ConnectionBad:fe_sendauth:nebylo zadáno heslo

  3. Vložení MySQL pomocí smyčky While

  4. PostgreSQL streamovací replikace – hluboký ponor