正在跑 1000W 数据,但是感觉意义不大,应该还是没有吧。。
是不是有什么地方经过了特殊处理?
代码如下,如果缩进不被吃掉就能拿来测测
#!/usr/bin/env python3 import redis redis_cli = redis.from_url('redis://localhost:6379/0') count = 0 for i in range(0, 1000000): if not redis_cli.pfadd('test', 'aaa%dbbb' % i): count += 1 print(count) count = 0 for i in range(0, 1000000): if redis_cli.pfadd('test', 'aaa%dbbb' % i): count += 1 print(count) 第一个 print 结果 940536 ,大概 94%左右的 True Positive ,也就是 6%左右的 False Positive
第二个显示 0 ,也就是都是 True Negative ,没有 False Negative
按理说 HyperLogLog 的 False Positive 和 False Negative 差不多?
可能是我对算法理解有问题,请指点一下。
