我正在研究一个每天有多个交通速度测量值的数据集。我的数据来自芝加哥市,大约每分钟采集一次,持续大约六个月。我只想将这些数据合并到几天内,所以这就是我所做的:
traffic <- read.csv("path.csv",header=TRUE)
traffic2 <- aggregate(SPEED~DATE, data=traffic, FUN=MEAN)
这是完美的,因为它获取了我所有的数据并按日期平均。例如,我的原始数据如下所示:
DATE SPEED
12/31/2012 22
12/31/2012 25
12/31/2012 23
...
决赛看起来像这样:
DATE SPEED
10/1/2012 22
10/2/2012 23
10/3/2012 22
...
唯一的问题是我的数据应该从 2012 年 9 月 1 日开始。我绘制了这些数据,结果数据从 10/1/2012-12/31/2012 到 9/1/2012-9/30/2012。
这里到底发生了什么?