Předpokládám, že máte hodně bodů a potřebujete rychlé výsledky – jinak můžete použít téměř cokoliv.
Zdá se mi to jako práce se zmenšením mapy
Část mapy by byla smyčkou „pro každý nenavštívený bod“ a měla by vydávat datový konstrukt obsahující sousedy, kandidátské shluky a cokoli jiného. V případě, že je bod klasifikován jako hluk, neměl by vydávat nic.
Rozšíření clusteru by mělo jít do redukce a případně dokončit část - také výběr jazyka by byl javascript a vše by se dělo uvnitř mongo