假设我有一定数量的数据, 由. 现在,我取第一个数字每个数量的,我想研究第一个数字的经验分布之间的关系在哪里是出现的归一化频率作为第一个数字,本福德定律
现在,我已经阅读了这篇论文,主题是比较第一位数字的经验频率与本福德定律。但是,他们没有提到他们提到的方法是否可以用于能够以一定的信心实时拒绝本福德定律,其中数据以一定的频率到达(例如,每秒 50 个数据)。
我认为这些方法可以通过以下方式与本福德定律进行实时比较:给定一个(小)时间间隔(比如 3 秒),我们计算第一位数字的经验频率然后我们计算同时置信区间和-我之前提到的参考文献中显示的统计值(我们必须确保至少有 60 个数据的样本量,以便统计的分布应该相对接近渐近分布,所以计算-值应该是可靠的)。
我的问题是,这是一个有效的程序吗?是否有意义?如果没有,是否有一些可靠的方法可以实时比较经验第一位数字分布与本福德定律?
我看到的一个潜在问题是,第一位数字的基本分布可能会在给定的时间窗口内发生变化(甚至可能不止一次)。这就是为什么我认为使用相对较小的时间窗口是一个好主意,以便获得合适的样本量,同时降低第一位数字的潜在分布可能发生变化的可能性。