Levenshtein 算法和一些比率和比例可以处理这个用例。
基于预定义的语句序列,例如“我有一只狗”、“我拥有一辆汽车”等等,我必须确定另一个输入语句(例如“我有一只猫”)是否相同或如何输入语句很可能等于预定义语句的百分比。
例如:
预定义语句:“我有一条狗”、“我有一辆汽车”、“你认为你很聪明”
输入语句和结果:
我有一只狗 - 100%(因为它完全匹配),我有一只猫 - ~75%(因为除了动物之外几乎一样,想想 - ~10%(因为它只是第三条语句),瓶子 - 0%(因为它根本没有匹配)
要求是使用 TensorFlow 而不是 Java,这是我所知道的语言,所以任何关于入门的帮助都会有所帮助。
我的计划是使用预定义的语句作为 train_data,并在预测期间仅输出准确度,但我不知道该使用什么模型。请指导我的架构,我将尝试实现它。