我在哪里可以找到免费的时空数据集供下载?

数据挖掘 数据集 开源的 游离碱
2021-10-10 13:14:30

我在哪里可以找到免费的时空数据集以供下载,以便我可以在 R 中使用它?

4个回答

如果您有 R 和spacetime包,那么您只需要data(package="spacetime")与包捆绑的时空数据集列表:

Data sets in package ‘spacetime’:

DE_NUTS1 (air)          Air quality data, rural background PM10 in
                        Germany, daily averages 1998-2009
fires                   Northern Los Angeles County Fires
rural (air)             Air quality data, rural background PM10 in
                        Germany, daily averages 1998-2009

然后例如:

> data(fires)
> str(fires)
'data.frame':   313 obs. of  3 variables:
 $ Time: int  5863 5870 6017 6018 6034 6060 6176 6364 6366 6372 ...
 $ X   : num  63.9 64.3 64.1 64 64.4 ...
 $ Y   : num  19.4 20.1 19.7 19.8 20.3 ...

首先想到的是来自跑步或骑自行车应用程序的个人锻炼数据。

否则,有一个围绕纽约市出租车行程数据的数据集。快速谷歌搜索给我带来了这个:http ://www.andresmh.com/nyctaxitrips/ 。变量包括接送时间和地点。

另一个数据集来自芝加哥的自行车共享服务。可以在这里找到:https ://www.divvybikes.com/datachallenge 。

您可以从 UCSD 的 HeadIT 数据库中获取一些记录在案的、公开可用的 EEG 数据。 http://headit-beta.ucsd.edu/studies

数据本身似乎在 Biosemi 数据格式 (.bdf) 文件中,如下所述:http: //www.biosemi.com/faq/file_format.htm

Biosemi 在其网站上提供了几种访问和导入 .bdf 文件的开源方法的链接,包括用于导入 Matlab 以及 Python (BioSig) 和 C/C++ 库的几个函数: http://www.biosemi。 com/download.htm

正如预警一样,EEG 数据可能有点难以处理,因为它固有的低信噪比。

另一种思路是将 OpenStreetMap 项目地图数据结合起来,例如使用相应的 nice R 包(http://www.r-bloggers.com/the-openstreetmap-package-opens-up),与人口普查数据(人口普查数据,例如美国数据:http ://www.census.gov/data/data-tools.html ,以及其他类别的人口普查数据:http: //national.census.okfn.org)来分析人口的时间模式地缘社会趋势。HTH。