关于人类随机性熵的研究?

信息安全 随机的
2021-09-05 01:50:57

人们经常使用的支持密码管理器的论点是:

人工生成的密码比随机生成的密码熵少!

有没有研究支持这一点?我们可以量化它吗?

例如,如果我写了 2048 个 1 和 0。你期望一个普通人有多少熵?

2个回答

这是我在 30 分钟内可以在 Google Scholar 上找到的内容。

大量关于人类运动和步行步态熵的论文。许多关于测量密码熵的论文(用于显示强度计)。一些论文谈论人类可以记住的熵量。

这篇论文非常接近,可能包含一些部分答案:

如果我正确阅读表 1,那么他们发现当允许输入 8 - 10 个字符的密码时,人们倾向于从大约 2 40 个密码空间中选择密码。我猜这有点像熵的量度。

以下是我发现的其他与您的问题精神相近的论文:


因此,在我的 Google-Fu 的 30 分钟内,我要说的是,已经对数据库泄漏中发现的密码的平均熵进行了大量研究(提示:它真的很低)。

但至于“人脑能做的最好的事情是什么?” 它看起来像:不,这项研究尚未完成。

正如评论中提到的,我认为一个人写一个这样的字符串,没有太多连续的 0 或 1。我让我周围的几个人写了一个长字符串,没有人连续输入 5 个 1 或 0。因此,我尝试进行计算以找到您问题的上限。

2048 位长二进制字符串不包含 5 个连续 1 或 0 的概率:4.30023800644 * 10^(-57)

在所有字符串中不包含 5 个连续 1 或 0 的字符串的近似数量:4.30023800644 * 10^(-57) * 2^2048 = 2^(1860.754515) ~ 2^1861

基于此,我可以说人类的上限是 1861 位长的随机字符串。如果您添加其他条件,我们可以更精确地计算。