我是 ML 的新手,并试图找到一些实际用途,我遇到了保存一堆用户的连接和断开连接(二进制变量)的机会,如下所示:
“用户 A 在 10:02:33 连接
用户 A 在 10:05:02 断开连接"
我想知道如何确定用户何时再次连接,分析他过去的连接、断开连接和在线时间。
我的顾虑如下:
- 这可能吗?
- 最好的方法是什么?
- 我需要每个用户多少样本?
- 构建数据的最佳方式是什么,除了用户标识符、操作(连接/断开连接)和操作发生的时间之外,还有哪些有用的信息?
一个额外的问题:是否可以实时添加更多数据来改进算法预测?如何?