我正在尝试对来自特殊眼镜的一些数据进行一些分析,这些数据跟踪一些事情,包括瞳孔大小和凝视速度。我想计算两个不同人的两副眼镜之间的相关性。目前我无法使用df.correlate(),因为时间戳不相同,因此数据看起来像这样:
index | ts | r_person | l_person
-----------------------
0 | 23 | 3.0 | NAN
1 | 25 | NAN | 3.2
2 | 28 | 3.1 | NAN
3 | 32 | 3.0 | NAN
我想知道是否还有任何方法可以直接计算相关性。
目前我正在考虑用上下数据点的平均值填充 NAN 值。例如第 2 行列r_person将变为.
这将不像看起来那么微不足道,因为即使在开始时它并不总是一个数据点 R 一个数据点 L 并且在清理数据之后它变得不那么重要了。换句话说,正如您在示例中看到的那样,多个 NAN 值可能会出现在同一列中。我仍然可以通过分散平均值来解决这个问题。如果它们足够接近,我的第二种技术将尝试将这些值合并在一起。请记住,数据是在 50hz 下收集的。
我的问题是,是否有人有更快或更好的方法来对齐数据而不会丢失或更改太多?