我开始学习机器学习,如果随机测量 X 增加,我想知道如何建模随机测量Y将在 n 分钟内增加。
X 和 Y 有不同的单位(英镑和美元),所以我使用收益(百分比变化)来使它们成为相同的单位。
我的数据看起来像这样
Time, X, Y
00:00, 1%, 0%
00:01, 0%, 1%
00:02, 2%, 0%
00:03, 0%, 2%
仅通过观察这些数据,您就可以看到 Y 在 X 增加后一秒后增加,但不确定如何建模的最佳方法!
我开始学习机器学习,如果随机测量 X 增加,我想知道如何建模随机测量Y将在 n 分钟内增加。
X 和 Y 有不同的单位(英镑和美元),所以我使用收益(百分比变化)来使它们成为相同的单位。
我的数据看起来像这样
Time, X, Y
00:00, 1%, 0%
00:01, 0%, 1%
00:02, 2%, 0%
00:03, 0%, 2%
仅通过观察这些数据,您就可以看到 Y 在 X 增加后一秒后增加,但不确定如何建模的最佳方法!
您需要寻找滞后效应 - 最简单的方法是尝试多个滞后时间窗口并查看它们与目标的相关性。如果您认为存在明显的滞后影响,那么在某些时候相关强度应该会增加。
尝试添加一个“previousX”字段。这肯定会有所帮助。我知道这样做的唯一方法是遍历整个数据集。如果有人知道如何使用 numpy/pandas 方法更快地做到这一点,请分享。