在过去五年中,印度系统地推进了生物特征识别计划,目前已有超过 8 亿用户注册。为了确保对如此庞大的人群进行匹配的准确性,生物识别标准委员会建议在物理上可能的情况下收集所有 10 个指纹,大概是为了设置更大的识别阈值(例如 3 个或更多手指的 80% 置信度)。
印度唯一身份验证机构进行的 PoC 发现,用于身份验证的合适技术是验证“两个单独的手指最多 3 次尝试”(详情请点击此处)。这提供了 99% 的准确度,委员会认为这是合理的,因为身份验证是 1:1 而不是 1:N(类比是在登录期间只检查密码是否有单个用户名)。虽然这个过程也有大量的隐私和安全问题,但这些问题都得到了很好的研究。
但是,注册新用户的过程应该执行重复数据删除,因此是 1:N(如果指纹匹配,则不应注册用户)。假设只有“最好的两个手指被匹配”,假设在注册期间没有执行重复数据删除是否可行,因为超过一定数量的用户冲突可能是不可避免的?我看到的上一份报告显示,当 2.9 亿人注册时,有 34,015 次重复(~ 0.01%)
这样的系统真的可行且可扩展吗?生日悖论似乎表明大多数用户应该有“分身”(即使假设 0.01% 的冲突超过 8 亿用户)。在这样的系统中,是否有任何技术可用于可靠和自动识别“真实重复”而不是“虚假重复”?随着用户的增加,生物识别系统会变得越来越差吗?
EDIT/TL;DR生物特征认证系统是否具有负面的网络效应,随着用户数量的增加,它们会变得越来越差(不太准确/精确)?如果没有,为什么不呢?