谷歌趋势返回每周数据,所以我必须找到一种方法将它们与我的每日/每月数据合并。
到目前为止,我所做的是将每个系列分解为每日数据,例如:
从:
2013-03-03 - 2013-03-09 37
到:
2013-03-03 37 2013-03-04 37 2013-03-05 37 2013-03-06 37 2013-03-07 37 2013-03-08 37 2013-03-09 37
但这给我的问题增加了很多复杂性。我试图根据过去 6 个月的值或每月数据中的 6 个值来预测谷歌搜索。每日数据意味着对 180 个过去值的工作。(我有 10 年的数据,所以每月数据 120 点/每周数据 500+/每日数据 3500+)
另一种方法是在每周/每月数据中“合并”每日数据。但是这个过程会产生一些问题。一些数据可以被平均,因为它们的总和代表了一些东西。以降雨为例,给定一周的降雨量将是组成这些周的每一天的降雨量的总和。
就我而言,我正在处理价格、财务利率和其他事情。对于价格,在我的领域中通常会考虑交易量,因此每周数据将是加权平均值。对于财务费率,它有点复杂,因为涉及到一些公式来根据每日费率建立每周费率。对于其他事情,我不知道潜在的属性。我认为这些属性对于避免无意义的指标很重要(例如,平均财务利率是无意义的)。
所以三个问题:
对于已知和未知的属性,我应该如何从每日数据变为每周/每月数据?
我觉得像我所做的那样将每周/每月数据分解为每日数据有些错误,因为我引入了在现实生活中没有意义的数量。所以几乎相同的问题:
对于已知和未知的属性,我应该如何从每周/每月数据转到每日数据?
最后但同样重要的是:当给定两个具有不同时间步长的时间序列时,哪个更好:使用最低或最大时间步长?我认为这是数据数量和模型复杂性之间的折衷方案,但我看不出有任何强有力的论据可以在这些选项之间进行选择。
编辑:如果您知道一个工具(在 R Python 甚至 Excel 中)可以轻松完成,我们将不胜感激。