HyperLogLog
se používá pro počítání jedinečných položek. Dokáže spočítat velké množství položek s malou pamětí. Vrácená mohutnost však NENÍ přesná, ale přibližná se standard error
.
0,81 % je standard error
, NE falešně pozitivní. Například můžete zavolat PFCOUNT HLL
abyste získali přibližný počet jedinečných položek, které jste vložili do HyperLogLog
. Vrácené číslo by mělo být v rozsahu [10000 * (1 - 0.81%), 10000 * (1 + 0.81%)]
.
PFADD
vrátí 1, pokud se po provedení příkazu změní odhadovaná mohutnost. V opačném případě vrátí 0. Nemá to nic společného s false positive
.
Zdá se, že to, co potřebujete, je Bloomův filtr, který vám může sdělit, zda položka již v sadě dat existuje, s falešně pozitivním výsledkem. Můžete implementovat Bloom Filter
s Redis, samozřejmě. A na to by měl existovat nějaký open source projekt.