寻找正确的数据挖掘方法

机器算法验证 时间序列 自习 数据挖掘 预测模型 Python
2022-04-15 14:17:23

(我为自己是新手而道歉,但我是一名研究人员,正在向自己介绍数据挖掘——任何帮助或见解将不胜感激。此外,这在技术上不是家庭作业问题,但我已将其标记为以区分这是一个非专业人士的广泛问题)。

我无法为我的(相当简单的)示例找到正确的方法。

假设我有几个月的某个网站登录时间的数据。数据已被选择和清理,以便我每次登录都有一个 Date_Time 列表。

现在,假设我想根据这些过去的趋势,按天按小时预测接下来两周的登录。

我想我会按天对数据进行聚类(事先假设周一和周五会有不同的趋势)并进行一些回归分析来预测接下来的两个(比如说)周一。

同样,我可以按小时进行聚类并进行回归分析以推断登录趋势。

任何人都知道告诉您如何在 Python 中执行此操作的资源?我想保持这个例子相当简单,但我愿意接受更多关于如何更有效地建模这种行为的想法。

1个回答

我同意评论员的观点,这是一个简单的时间序列问题。如果您不关心季节性变化,我不确定您希望从简单的日数和小时数中得到什么。

ARIMA 就是您想要的。如果你真的需要一些专门用于机器学习的东西,只需尝试基本的贝叶斯建模。它将包含您先前的数据,它是大多数 ML 范例的基础......