一年多来,我一直试图解决这个问题,但没有太大进展。这是我正在做的一个研究项目的一部分,但我将用我编造的一个故事示例来说明它,因为问题的实际领域有点令人困惑(眼动追踪)。
你是一架飞机,追踪一艘穿越海洋的敌舰,所以你收集了这艘船的一系列 (x,y,time) 坐标。你知道一艘隐藏的潜艇会和船一起旅行以保护它,但是虽然它们的位置之间存在关联,但潜艇经常会从船上徘徊,所以虽然它经常靠近它,但它也可能在它的另一边世界偶尔。您想预测潜艇的路径,但不幸的是它对您隐藏。
但在 4 月的某个月,您注意到潜艇忘记隐藏自己,因此在 1,000 次航行中,您拥有潜艇和船舶的一系列坐标。使用这些数据,您想建立一个模型,仅根据船的运动来预测隐藏潜艇的路径。幼稚的基线会说“潜艇位置猜测=”船的当前位置”,但从 4 月份潜艇可见的数据中,您注意到潜艇有领先于船舶的趋势,所以“潜艇位置“guess = ship's position in 1 minute”是一个更好的估计。此外,4月份的数据显示,当船在水中停留较长时间时,潜艇很可能在远处巡逻沿海水域。还有其他模式当然。
给定 4 月份的数据作为训练数据,你将如何构建这个模型来预测潜艇的路径?我目前的解决方案是一个临时线性回归,其中因素是“行程时间”、“船舶的 x 坐标”、“船舶闲置 1 天”等,然后让 R 计算权重并进行交叉验证. 但我真的很想有一种方法可以从 4 月的数据中自动生成这些因素。此外,使用序列或时间的模型会很好,因为线性回归没有,我认为它是相关的。
感谢您阅读所有这些,我很乐意澄清任何事情。