假设我们有一组相同长度的标签,我们需要找到它们之间的距离。
在二进制标签的情况下,可以使用汉明距离。例如,如果和,则。l1= 01101l2= 00111d(l1,l2) = 2
在我的例子中,标签是由字母形成的,所以字母的长度是,每个标签的长度是。A = { a , b , c , d, e }|A|=5n=4
就我而言,序数比例适用于字母中的字母:A
a<b<c<d<e.
标签示例:deed
, aaaa
, aaad
, aaae
, dada
, cccd
.
编辑。三个标签的卷边距离aaaa
,给出但我正在寻找一个可以区分和并返回的度量因为。aaad
aaae
d(aaaa,aaad)=d(aaaa,aaae)
ded(aaaa,aaad)<d(aaaa,aaae)
d<e
编辑 2。
为了创建标签,我们使用阈值个元素应用下一个函数:
最后,我们使用连接运算符,例如。T∈RiX=(x1,x2,…,xn)f(xi)=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪a,b,c,d,e,xi≤−T,−T<xi≤0,xi=0,0<xi≤T,xi>T.
&a&a&a&a=aaaa
问题。我可以使用什么指标来计算标签之间的距离?