我正在寻找佩戴带有加速度计(以及可能的其他传感器,例如陀螺仪或磁力计)的设备的人的公共数据集。像这样的最大可用数据集有哪些?
这对机器学习有明显的应用:一个好的数据集将有助于从传感器数据中开发用于活动识别和事件检测的良好模型,就像 ImageNet / COCO / YFCC100m 数据集在视觉领域所产生的效果一样。可悲的是,我认为这个领域非常大的数据集都是私有的。
就我的目的而言,我不在乎人们在做什么。完全随机的活动样本是可以的(但更广泛的样本比特定样本更好)。我也不关心设备在哪里(手腕、口袋等),或者它是智能手机还是其他设备(手表、活动记录仪、IMU 等)。最后,我不在乎数据是否被标记/注释。
然而,我确实想要尽可能大的尺寸:尽可能多的不同人,以及尽可能多的总录制时间。
到目前为止我发现的...
一些数据集:https ://arxiv.org/pdf/1707.03502.pdf和http://mobilize.stanford.edu/data-sources/
一些特定的数据集:
UK Biobank拥有 10 万人 x 24 小时的录音。我相信这些是活动记录仪(1 分钟分辨率)而不是原始加速度计数据(有人可以确认吗?)。它也没有开放。
NHANES 2003 7k 人 x 每人 7 天。绝对是活动记录仪,没有原始加速度计数据。
LTMM 71 人 x 每人 72 小时
PAMAP2 9 人 x 每人约 1 小时
健康10 人 x 每人约 15 分钟