redis HLL příliš mnoho falešných poplachů

HyperLogLog se používá pro počítání jedinečných položek. Dokáže spočítat velké množství položek s malou pamětí. Vrácená mohutnost však NENÍ přesná, ale přibližná se standard error .

0,81 % je standard error , NE falešně pozitivní. Například můžete zavolat PFCOUNT HLL abyste získali přibližný počet jedinečných položek, které jste vložili do HyperLogLog . Vrácené číslo by mělo být v rozsahu [10000 * (1 - 0.81%), 10000 * (1 + 0.81%)] .

PFADD vrátí 1, pokud se po provedení příkazu změní odhadovaná mohutnost. V opačném případě vrátí 0. Nemá to nic společného s false positive .

Zdá se, že to, co potřebujete, je Bloomův filtr, který vám může sdělit, zda položka již v sadě dat existuje, s falešně pozitivním výsledkem. Můžete implementovat Bloom Filter s Redis, samozřejmě. A na to by měl existovat nějaký open source projekt.