我正在从 Christopher Manning 的书中自学信息检索(PDF 链接: http: //nlp.stanford.edu/IR-book/pdf/01bool.pdf)。我尝试了练习 1.13:
“尝试在几个主要的网络搜索引擎上使用布尔搜索功能。例如,选择一个词,例如 burglar,然后提交查询 (i) burglar, (ii) burglar AND burglar, and (iii) burglar OR burglar . 看看估计的结果和热门点击数。它们在布尔逻辑方面是否有意义?通常它们对于主要搜索引擎没有意义。你能理解发生了什么吗?
根据我对布尔逻辑的了解,结果的数量应该是这样的:
防盗 AND 防盗 <= 防盗 OR 防盗 = 防盗
但事实并非如此。事实上,在谷歌上,它是:
防盗 > 防盗 OR 防盗 > 防盗和防盗
那么,幕后究竟发生了什么?任何指针?
注意:这不是一个家庭作业问题,即使它来自教科书的练习。