我的数据框包含 7000 行,其中包含以下库登录详细信息:登录时间、库 ID(用户 ID)、登录日期、罚款/未。
该数据用于本地图书馆,我想创建一个模型来预测人们对图书馆的访问。比方说,有会员libraryid=1015明天去图书馆的机会。在过去的 2-3 年里,图书馆有很多常客。
我尝试了以下方法:
clf = RandomForestClassifier(n_estimators=30)
clf.fit(df_train[features], df_train['a'])
由于涉及日期,因此无法获得所需的结果。
login_time id login_date 罚款 0 2016-02-29 23:28:58 1015 2016-02-29 1 1 2016-03-01 00:19:27 4890 2016-03-01 1 2 2016-03-01 04:40:17 1020 2016-03-01 0 3 2016-03-01 04:41:05 9134 2016-03-01 1 4 2016-03-01 05:00:27 7798 2016-03-01 1 5 2016-03-01 05:01:21 1325 2016-03-01 1 6 2016-03-01 05:02:22 5017 2016-03-01 1 7 2016-03-01 05:05:47 2730 2016-03-01 1 8 2016-03-01 05:09:57 8125 2016-03-01 1 9 2016-03-01 05:10:47 8604 2016-03-01 1 10 2016-03-01 05:16:26 9033 2016-03-01 1 11 2016-03-01 05:17:23 7096 2016-03-01 1 12 2016-03-01 05:18:02 1022 2016-03-01 1 13 2016-03-01 05:19:33 1015 2016-03-01 1 14 2016-03-01 05:19:48 3087 2016-03-01 1 15 2016-03-01 05:21:40 5641 2016-03-01 0 16 2016-03-01 05:28:25 5548 2016-03-01 1 17 2016-03-01 05:31:54 8970 2016-03-01 0 18 2016-03-01 05:58:52 7781 2016-03-01 1 19 2016-03-01 06:09:12 5859 2016-03-01 1 20 2016-03-01 06:13:28 1017 2016-03-01 1 21 2016-03-01 06:14:35 8138 2016-03-01 1 22 2016-03-01 06:15:41 1018 2016-03-01 1 23 2016-03-01 06:17:40 9355 2016-03-01 1 24 2016-03-01 06:18:10 10583 2016-03-01 1 25 2016-03-01 06:20:44 2394 2016-03-01 0 26 2016-03-01 06:29:17 10168 2016-03-01 1 27 2016-03-01 06:31:11 4235 2016-03-01 0
我使用了 ARIMA 模型,模型运行时间太长,请提供其他解决方案。