(我为自己是新手而道歉,但我是一名研究人员,正在向自己介绍数据挖掘——任何帮助或见解将不胜感激。此外,这在技术上不是家庭作业问题,但我已将其标记为以区分这是一个非专业人士的广泛问题)。
我无法为我的(相当简单的)示例找到正确的方法。
假设我有几个月的某个网站登录时间的数据。数据已被选择和清理,以便我每次登录都有一个 Date_Time 列表。
现在,假设我想根据这些过去的趋势,按天按小时预测接下来两周的登录。
我想我会按天对数据进行聚类(事先假设周一和周五会有不同的趋势)并进行一些回归分析来预测接下来的两个(比如说)周一。
同样,我可以按小时进行聚类并进行回归分析以推断登录趋势。
任何人都知道告诉您如何在 Python 中执行此操作的资源?我想保持这个例子相当简单,但我愿意接受更多关于如何更有效地建模这种行为的想法。