最大的公共可穿戴加速度计数据集是什么?

数据挖掘 数据集 时间序列
2021-10-14 18:40:00

我正在寻找佩戴带有加速度计(以及可能的其他传感器,例如陀螺仪或磁力计)的设备的人的公共数据集。像这样的最大可用数据集有哪些?

这对机器学习有明显的应用:一个好的数据集将有助于从传感器数据中开发用于活动识别和事件检测的良好模型,就像 ImageNet / COCO / YFCC100m 数据集在视觉领域所产生的效果一样。可悲的是,我认为这个领域非常大的数据集都是私有的。

就我的目的而言,我不在乎人们在做什么。完全随机的活动样本是可以的(但更广泛的样本比特定样本更好)。我也不关心设备在哪里(手腕、口袋等),或者它是智能手机还是其他设备(手表、活动记录仪、IMU 等)。最后,我不在乎数据是否被标记/注释。

然而,我确实想要尽可能大的尺寸:尽可能多的不同人,以及尽可能多的总录制时间。

到目前为止我发现的...

一些数据集:https ://arxiv.org/pdf/1707.03502.pdf和http://mobilize.stanford.edu/data-sources/

一些特定的数据集:

  • UK Biobank拥有 10 万人 x 24 小时的录音。我相信这些是活动记录仪(1 分钟分辨率)而不是原始加速度计数据(有人可以确认吗?)。它也没有开放。

  • NHANES 2003 7k 人 x 每人 7 天。绝对是活动记录仪,没有原始加速度计数据。

  • LTMM 71 人 x 每人 72 小时

  • PAMAP2 9 人 x 每人约 1 小时

  • 健康10 人 x 每人约 15 分钟

  • UCI-智能手机

1个回答

您可以检查这些额外的:

HAR: http: //archive.ics.uci.edu/ml/datasets/Human+Activity+Recognition+Using+Smartphones 它是通过连接智能手机收集的,它有加速度计和陀螺仪数据。它有 30 名参与者进行 6 种不同的活动。加速度为 50 Hz,他们使用的是 3D 加速度计。

USCHAD:https ://dl.acm.org/citation.cfm?doid=2370216.2370438看看这篇论文。在这里您也可以找到数据。

它有14个科目(7男7女),有12种不同的活动。此外,它还有加速度计和陀螺仪,并且它有一个由站在附近的观察者标记的地面实况标签。它们以 100Hz 采样。他们再次使用 3D 加速度计。

我强烈建议通过定义分割时间序列数据的时间窗口来进行特征工程。定义几秒钟的小窗口后,每个窗口可以有一个活动。然后您可以轻松提取一些与时间相关的特征,例如均值、相关性、加速度、方向等。此外,可以在这些小窗口上应用快速傅里叶变换,因此您可以提取许多频域特征,例如能量、相干性等。