我有来自自动完成表单的日志,我想利用它来增加它返回的结果的智能。
我有一个项目,围绕用户从约 15,000 个独特字符的数据库中选择歌剧字符展开。我的困难是每个字符在数据库中仅作为一个名称出现,但公众也可能以任意数量的其他通俗名称知道它。
我很幸运能够收到少量的流量,目前有大约 20,000 行我的用户输入的字符串日志以及他们最终选择的歌剧角色。
如果用户在他们的第一个字符串中没有找到他们正在搜索的字符,他们通常会尝试使用另一个名称来搜索该字符。当他们成功时,这些数据将角色的俗名与角色本身相关联。我希望利用这些数据来使我的自动完成表单与这些俗名相匹配。
不幸的是,除了有用的相关性之外,还有许多(也许更多)随机相关性。通常当用户的尝试没有返回他们正在寻找的结果时,他们不会尝试使用另一个名称的字符,而是简单地尝试(并定位)一个完全不同的字符。
我已经阅读了许多关于使用搜索日志来改进自然语言搜索查询的学术论文,但是这些方法似乎都没有在这种狭隘的情况下有太多的应用。
是否有对此应用有用的已知方法?
我的项目可以在http://fachme.com查看