我正在寻找从网络服务器日志中提取有趣的信息,我想知道我应该过滤掉哪些 HTTP 状态代码?
例如,200 次点击可以被认为是“常规行为”,而来自某个 IP 的大量 404 次点击可能意味着某人不合格(自动扫描)。
那么,我主要在日志中看到哪些:
304 - Not Modified
404 - Not found
302 - Found
206 - Partial content
301 - Moved permanently
500 - Internal Server Error
403 - Forbidden
501 - Not implemented
406 - Not acceptable
416 - Requested Range Not Satisfiable
other?
我应该过滤掉,哪些通常会提供有见地的信息?哪些已知被坏人用来收集信息?可能最“有趣”的一个是 404,但如果其他人过去处理过这个问题,我想得到更多的意见。谢谢..