信息安全 - 关于人类随机性熵的研究？ - 吾爱随笔录

信息安全随机的熵

2021-09-05 01:50:57

人们经常使用的支持密码管理器的论点是：

人工生成的密码比随机生成的密码熵少！

有没有研究支持这一点？我们可以量化它吗？

例如，如果我写了 2048 个 1 和 0。你期望一个普通人有多少熵？

2个回答

这是我在 30 分钟内可以在 Google Scholar 上找到的内容。

大量关于人类运动和步行步态熵的论文。许多关于测量密码熵的论文（用于显示强度计）。一些论文谈论人类可以记住的熵量。

这篇论文非常接近，可能包含一些部分答案：

如果我正确阅读表 1，那么他们发现当允许输入 8 - 10 个字符的密码时，人们倾向于从大约 2 ^{40 个}密码空间中选择密码。我猜这有点像熵的量度。

以下是我发现的其他与您的问题精神相近的论文：

因此，在我的 Google-Fu 的 30 分钟内，我要说的是，已经对数据库泄漏中发现的密码的平均熵进行了大量研究（提示：它真的很低）。

但至于“人脑能做的最好的事情是什么？” 它看起来像：不，这项研究尚未完成。

正如评论中提到的，我认为一个人写一个这样的字符串，没有太多连续的 0 或 1。我让我周围的几个人写了一个长字符串，没有人连续输入 5 个 1 或 0。因此，我尝试进行计算以找到您问题的上限。

2048 位长二进制字符串不包含 5 个连续 1 或 0 的概率：4.30023800644 * 10^(-57)

在所有字符串中不包含 5 个连续 1 或 0 的字符串的近似数量：4.30023800644 * 10^(-57) * 2^2048 = 2^(1860.754515) ~ 2^1861

基于此，我可以说人类的上限是 1861 位长的随机字符串。如果您添加其他条件，我们可以更精确地计算。

其它你可能感兴趣的问题