我正在为我的问题寻找一种机器学习算法。
我有一组句子,例如,
["The cat in the hat disabled", "A cat is a fine pet ponies.", "Dogs and cats make good pets.","I haven't got a hat."]
和搜索词,如,
["cat","hat"]
我想将我的句子列表和搜索词转换为向量空间,并在我的句子列表和搜索词列表之间找到匹配分数。
我期望的输出类型是,
[("The cat in the hat disabled",0.9), ("A cat is a fine pet ponies.",0.5), "(Dogs and cats make good pets.",0.6),("I haven't got a hat.",0.49)]
请为我的任务建议一种机器学习算法,如果可能,请分享参考链接。
如果您有任何疑问或需要更多信息,请告诉我。我目前正在为此https://github.com/josephwilk/semanticpy使用语义
我收到许多搜索词的键错误。它不对句子列表执行词干提取和词形还原,而仅对搜索词列表执行。
请帮助解决这个问题。