我正在尝试提出一个数据结构来预测湖中的水能见度。我有一些测量样本,但想将其他特征纳入方程式。
例如,我想获取事件过去 7 天的天气数据,例如雨量和温度。我从 BigQuery 获得了这些数据,似乎工作正常。但有时它找不到过去 7 天的所有数据。我将如何处理这种情况?什么是构建我的功能的好方法?我想是这样的:
dayofyear,temp,water_temp,temp-1,rain-1,dayofyear-1,temp-2,rain-2,dayofyear-2,....,temp-7,rain-7,dayofyear-7,visibility
虽然最后一个是我喜欢在某个时候预测的领域。