是否可以通过查找流量中的关系来识别 VPN 用户?

信息安全 隐私 虚拟专用网
2021-08-16 22:43:27

如果我使用 VPN 服务来保护我的身份,我的流量可以用来识别我的所有流量吗?

例如,如果我正在访问两个服务:

  1. 一些服务A,我没有留下任何识别信息。
  2. 我的个人电子邮件帐户。

有人可以找到 (1) 和 (2) 之间的关系,这样他就可以知道两者都由同一个人访问。

我天真地认为这是不可能的,而且最多有人能够告诉我正在使用 VPN 提供商来访问我的电子邮件,而不知道 (1)。

但也许我的计算机、浏览器或其他东西会在数据中留下某种签名,从而使某人能够找到关系?

4个回答

这取决于您是否担心被定罪或处理可能的原因(在美国)。

假设您在家。您启动 VPN 并连接到您的异地 VPN 提供商。如果我正在监视传出流量(来自您家),我知道您刚刚连接到某个 IP 地址,并且该 IP 地址是 VPN 提供商。数据包有效载荷内的所有内容都已加密。

然后,您决定在家时检查您的电子邮件。我碰巧正在监视来自 VPN 提供商(未加密)的传出流量。我使用 snort 记录所有内容,然后针对输出运行 Wireshark。我看到与您的电子邮件地址的连接和一封电子邮件。如果它是网络邮件,它可能受 SSL 保护。如果是普通电子邮件,则可能是纯文本。如果它不是纯文本,我可以尝试在接收器处拦截它。该电子邮件没有法律意义(即您没有使用它来计划非法活动)。但是,我注意到您混淆了他们的使用,那里和他们。我还会注意到一些你喜欢使用的成语。

在监控传出流量的过程中,我看到您的帐户写了几封电子邮件。我注意到拼写错误的模式和更多的修辞格。我会在一两个月内收集这些。

然后我将我注意到的项目放入 Wireshark。我添加了几件众所周知的事情。每次出现拼写错误,或者在从您使用的 VPN 服务发出的任何数据包的内容中发现使用惯用语(您使用的)时,我都会查看它。

再过一两个月,我有很多数据点。有些是你去过的网站,有些不是。我要做的第一件事是消除在您不在线时退出 VPN 服务提供商的所有数据点(即,我没有在家中看到您在线,请记住我是从监视该连接开始的)。

然后我查看剩余流量,看看我是否有任何聚类点。很多反复出现的主题。相同的主题。我将其与您未加密的流量和电子邮件进行比较。

我没有应用足够的过滤器来将您与噪音隔离开来(人们使用与您相同的习语/拼写错误),但我会为可能的原因提供一个很好的案例。如果我有足够的参考点,它就像一个指纹。

本质上,我将贝叶斯分析应用于工作语料库,以说明我相信一个样本是我的嫌疑人构建的集合成员的可能性。我要比较的作品集来自嫌疑人公开承认他们负责的任何作品。这种分析是众所周知的(还有一个完整的统计 StackExchange 站点)。

我让你回答,此时我会想出什么?

好吧,这对于数据挖掘来说是很有可能的,我参与了一个与 MIT Reality 挖掘项目相关的项目。

在现实挖掘项目中,人们试图在人们的行为中寻找关系。一旦您有了用户重复或典型行为的基线,您就可以确定地识别他,而无需查看设备属于谁或他正在使用什么号码。

我们能够,仅通过查看一些因素(我不能具体透露哪些因素,但我们至少使用了现实挖掘项目中存在的因素),95% 的确定人 X 可能是 John Doe .

现在,这个原则可以应用于任何类型的信息,您可以在其中分析人们的行为。这意味着当您从 VPN 连接时,我们也可以应用它。

数据挖掘的使用比您想象的要多。

您还可以说有关使用某个浏览器的内容。现在还有一个项目 ( https://panopticlick.eff.org/ ) 对浏览器所披露的内容进行了分析。这也是一个相当独特的人。(插件、用户代理数据……)如今,行为分析是一项大生意,而且可能是最可怕的事情:)

当然。有人可以通过多种方式在您的两个帐户之间建立这种联系。

一种简单的方法:他们向您发送一封带有链接或内联图像的 HTML 电子邮件,该电子邮件托管在同一域托管服务 A 上。当您单击链接或加载内联图像时,您的浏览器会连接到域 A。如果您访问过服务 A 最近,您的浏览器可能仍有一个会话 cookie 用于您与服务 A 的会话。所以现在服务 A 了解您的电子邮件地址和您在服务 A 上的帐户之间的连接。阅读“网络错误”了解更多信息。

防止这些类型的身份联系具有挑战性。根据所需的匿名级别,最简单的方法可能如下:当您想使用服务 A 时,启动到运行 Tor 的 LiveCD 并访问服务 A。运行 Tor 时,仅使用服务 A,不使用其他服务。在启动到您的正常操作系统时,永远不要访问服务 A。这使您的“秘密生活”和“公共生活”分开。

如果您真的没有使用第一种方法留下任何尾随标记,他们可能找不到这两个帐户之间的联系。

但是,该网站可能知道您在代理背后。这也是非常主观的,很大程度上取决于 VPN 配置,以及 VPN 的 IP 是否已经被发现和标记。这可以通过一些代理检测列表轻松确定,例如https://www.fraudlabs.com/demoip2proxy.aspx等。检查一些以获得准确的结果,因为不同的提供商有不同的数据列表。

此外,尽量不要使用电子邮件进行交流,因为使用电子邮件标题可以轻松追溯。