过去,我在工作中完成了一项“匿名”调查,结果发现我的雇主能够从该调查中获得大量非匿名信息。地点、经理姓名等。调查中没有提供这些信息。这使我相信网站能够以某种方式识别某种形式的用户信息。
网页是否可以读取用户或其他系统相关信息?有问题的网站有 aspx 和 js 元素。
我想不出他们可以识别用户的任何其他方式。该链接似乎不是唯一的。浏览器是IE,环境是Citrix上的Win7。
过去,我在工作中完成了一项“匿名”调查,结果发现我的雇主能够从该调查中获得大量非匿名信息。地点、经理姓名等。调查中没有提供这些信息。这使我相信网站能够以某种方式识别某种形式的用户信息。
网页是否可以读取用户或其他系统相关信息?有问题的网站有 aspx 和 js 元素。
我想不出他们可以识别用户的任何其他方式。该链接似乎不是唯一的。浏览器是IE,环境是Citrix上的Win7。
如果该站点是基于 ASPX 文件的,那么它很可能是一个 ASP.NET 应用程序 - 很可能托管在 IIS 上。
IIS 有一个非常简单的复选框来启用 Windows 集成身份验证。
默认情况下,Windows 7 上的 IE 会将您的凭据发送到本地 Intranet 中的任何 Web 服务器。(这不是您的密码,不用担心,但它是基于 Windows 的身份验证 - Kerberos 或 NTLM)。
将您的 Windows 域帐户与您的调查答案关联起来非常简单......
这是难以置信的简单,而且是一个非常古老的技巧。
为每个部门创建不同的调查,即使调查有相同的问题。
然后,您只需要混合结果即可!
仅此一项就足以进行大量信息收集,无需任何特殊技巧。
巴西的银行在纸质调查上做了类似的事情——每个经理都要把调查的副本分发给他的下属。然而,每个经理的副本都用不同颜色的纸打印——所以回答黄色副本的每个人都来自 RH,回答蓝色副本的每个人都来自财务部,回答粉红色副本的每个人都来自销售,依此类推。即使您没有询问员工部门、姓名或注册号,您也知道他在哪里以及他在哪个部门工作。
该网站将记录您的 IP 地址。公司的网络会分配您的 IP 地址。把两者联系起来...
调查中的去识别化是统计中的一个大问题,因为人们通常认为匿名数据在汇总时并不存在。
即使您有一种完全安全的匿名输入数据的方式,并且有人无法访问谁输入了什么的日志,调查中的回答通常也足以识别您的身份。
考虑这个示例调查:
- 你的性别是什么?男/女
- 你的年龄段是多少?
- < 25
- 25 - <35
- 35 - <45
- > 45
- 你的工作区域是什么?
- 人力资源
- 管理
- IT支持
- 销售量
- 在 1-10 的范围内,您有多喜欢在这里工作?____
单独每个问题都毫无用处,但使用前 3 个问题,即使在大公司,您也可以很容易地弄清楚每个人对组织的看法。
考虑一下:Bob(男,37 岁的 HR)和 Jane(女,37 岁的 HR),仅使用我们上面的字段,我们已经可以清楚地去识别他们的回答。
此外,由于 HR已经可以访问性别、年龄和工作领域的列表,他们可以交叉引用这两个数据集以直接获取每个人的分数。冲突的可能性总是存在的,但随着身份类问题的数量增加,冲突的可能性会急剧下降。