在内存有限时计算不同的元素

机器算法验证 置信区间 估计
2022-04-05 03:20:18

我应该如何估计随机打乱列表中唯一元素的数量?我的内存比存储所有唯一元素所需的内存小得多。置信区间和/或此类程序的参考有效的东西会很棒

1个回答

研究员 CVer @rrenaud 引用这篇论文作为唯一值估计数量的关键参考。他还建议检查 Good Turing 频率估计器,该估计器用于估计出现n次的元素的比例,包括n = 1 的情况(即唯一值)。

这是@rrenaud 对类似问题的回答的链接

玩得开心!