Google recaptcha v2 是如何被多次绕过的?

信息安全 谷歌 验证码
2021-08-19 05:41:09

多个关于 reᴄᴀᴘᴛᴄʜᴀ v2 绕过的报告。大多数时候,解释是谷歌或 IBM 提供的神经网络服务。

但有一点我无法理解:对于大多数 CAPTCHA(包括 reCAPTCHA v1),手动破译的文本会在 ʜᴛᴛᴘ 标头内直接发送到服务器。但是使用 reCAPTCHA v2,发送到服务器的 response/ʜᴛᴛᴘ 标头如下所示:

g-recaptcha-response:03AJpayVEtSKNOXg7TJwMkmxzLA_HrnWMKm6p0ox6W6hhMcw3Bzxab8ariLgg8Q8wXpUcF8HLkhAd1ixXgNvBDde5ggVXidl3NuHSQcnP4QqJkVvWZ2s4_CQ1lHTw6oNEqXyiBuS3CkiHBhoB5akijJ6ld115K_OWZo6mfB4xz_-I2P36fVqT9VzEUz26wrauN9QZuC6lh80mf-fkxqCPmNYSOcMrHxR33Flby05gzo5cD1B-2FucaoFP11p2svvZrWC_vAjz5bGOzW0DufM2kkdtLIlhzl9GBzm_chyirSJItHGdz0bMuxDYZkRKY8c4gXUmzT09VEgivi032zZnNXtrVA04gXF5yE0tAtnGTwi31hMdzumPoc6GdLdIbvfbXgdyndocCLIph-j9T8ePf3JO8Jfcf6BNcmUKT2SrhZjIAPUOZV2Mg7Qua_s4zNHYx1-NE8zoe9SG-VxuPbx2sjR32ce4oapa6VA

即使有音频到文本样本。无论声称使用哪种方法,我仍然无法理解g-recaptcha-responseHTTP 标头和人工创建的数据之间的联系。

重新g-recaptcha-response创建一次性令牌似乎是所有绕过方法的要求。那么,例如,由于人们对它进行了逆向工程,一次性令牌和破译的音频文本之间的联系是什么?
我唯一了解的是所有关于令牌生成的客户端(没有服务器端请求)。

1个回答

当你可以让它为你工作时,为什么要对代码进行逆向工程?

与呈现的网页交互就足够了。例如,您可以开发一个浏览器扩展程序,等待网页呈现,下载挑战(在本例中是音频),破解它(在本例中,它被稍微混淆并发送回谷歌自己的语音识别引擎),在答案字段中插入解决方案,最后模拟鼠标单击,启动 Google 的 JavaScript 以计算最终令牌。

资料来源:Bleeping Computer

ps Google 的 ReCAPTCHA 对隐私不是很友好,我建议使用其他的。