我正在使用由许多受试者佩戴的多个传感器收集的大量加速度计数据。不幸的是,这里似乎没有人知道这些设备的技术规格,而且我认为它们从未被重新校准过。我没有关于这些设备的大量信息。我正在写我的硕士论文,加速度计是从另一所大学借来的,总的来说情况有点不透明。那么,在设备上进行预处理?没有线索。
我所知道的是它们是具有 20Hz 采样率的三轴加速度计;数字和大概是MEMS。我对非语言行为和手势感兴趣,根据我的消息来源,它们应该主要产生 0.3-3.5Hz 范围内的活动。
规范化数据似乎非常必要,但我不确定该使用什么。很大一部分数据接近其余值(原始值约为 1000,来自重力),但也有一些极端值,例如在某些日志中高达 8000,在其他日志中甚至为 29000。见下图。我认为这使得除以 max 或 stdev 来规范化是一个坏主意。
在这种情况下,通常的方法是什么?除以中位数?百分数值?还有什么?
作为一个附带问题,我也不确定是否应该剪裁极端值..
感谢您的任何建议!
编辑:这是一个大约 16 分钟的数据图(20000 个样本),让您了解数据通常是如何分布的。