我的问题最初来自阅读这篇文章 Use of circular predictors in linear regression。
现在,我正在尝试使用 https://archive.ics.uci.edu/ml/datasets/bike+sharing+dataset 中的“自行车共享数据集”构建线性回归,该数据集基本上试图对不同变量的自行车租赁计数进行回归
我有疑问的预测变量之一是使用租赁发生时间的“小时”,其值从 0 到 23。原始帖子建议使用正弦函数转换循环数据(一天中的时间)以保持循环特性。
我试图将相同的方法应用于我的情况来转换 Hour 变量。但是,使用sin(π hour/180)转换 0~23会让 00:00 和 12:00 变为 0。但我认为人们在午夜 (00:00) 和下午 (12: 00)
在这种情况下,最好只使用 23 个虚拟变量来计算小时,还是我误解了循环回归的概念?