我正在研究一种算法,该算法从多个传感器流中获取最新数据点的向量,并将欧几里德距离与先前的向量进行比较。问题是不同的数据流来自完全不同的传感器,因此采用简单的欧几里德距离会大大过分强调某些值。显然,我需要一些方法来规范化数据。但是,由于该算法被设计为实时运行,因此我不能在规范化中使用有关任何数据流的任何信息作为一个整体。到目前为止,我一直在跟踪每个传感器在启动阶段看到的最大值(前 500 个数据向量),然后将来自该传感器的所有未来数据除以该值。这工作得非常好,但感觉非常不雅。
我没有太多运气为此找到一个预先存在的算法,但也许我只是没有在正确的地方寻找。有人知道吗?或者有什么想法?我看到一个建议使用运行平均值(可能由 Wellford 算法计算),但如果我这样做,那么相同值的多个读数不会显示为相同,这似乎是一个很大的问题,除非我我错过了一些东西。任何想法表示赞赏!谢谢!