我的网络服务器已经运行了不到 25 小时,并且已经爬取了各种默认页面,仅举一个例子/administrator/index.php
。
我知道这很常见,对我来说并不是真正的问题,因为我以一种体面的方式保护了服务器。
对于以下想法,假设我不关心由此产生的流量。
如果我要创建一些请求最多的文件,通常代表管理员界面或常见网站的其他攻击媒介,该怎么办?
该文件(例如/administrator/index.php
)可能如下所示:
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>/administrator/index.php</title>
</head>
<body>
content ^1
</body>
</html>
但是对于实际的正文内容,我只是用随机字符串撞了几个 GB。
例如dd if=/dev/urandom bs=10M count=400 | base64 > /tmp/content
,然后将上面的 HTML 标记包裹在文件周围。
典型的爬虫会在这样的事件中做什么?