假设一个随机生成的包含 80+ 百万个 1 和 0 的数据文件。
从这个文件中,我们想要创建一个随机十进制整数列表。
这是进行此转换的计划。
- 将 8000 万位数字分成 4 个二进制数字组。
- 将每个 4 位二进制转换为十进制。
- 丢弃所有大于 9 的十进制值。
这应该会产生一串从 0-9 的随机整数
这就是问题所在。组成对应于值 10 到 15 的 4 个二进制数字的 6 个分组的 24 个二进制数字包含 17 个 1 和只有 7 个零。这种不平衡会影响偶数与奇数的分布,还是会以任何方式损害最终十进制数字串的随机性?
更新:从发布的答案来看,上面列举的方法似乎是合理的。我同意这个结论。但是,我仍然不明白为什么从二进制字符串中删除比零多两倍的数字不会使结果偏向于更少的奇数。我寻求解释。
