标题不是最好的,但由于我不知道我实际上在搜索什么,所以我只是使用了一些广泛的东西。我正在寻找一种算法、一类算法或至少可以用于进一步研究的关键字。
本质上,我正在寻找一个类似于散列的函数,它接受输入并将其归结为更紧凑的表示。我希望类似的输入彼此接近,并且我希望输入的某些部分的权重高于/低于其他部分。只要我有部分排序,我不在乎距离有多远,这样我就可以将相似的条目组合在一起。
例如,假设我有输入字符串:
A = alittlebeer
B = alittlebear
C = blittlebear
并假设我定义了我的体重,以便我对前 3 个字符的权重比其他字符高得多。那么我希望