首先 - 我对这一切都很陌生。
我正在尝试创建一个模型来预测基于前几年的 ios 12 的发布。我有一个格式如下的excel:
ios version | release name | date
每个版本包含大约 5 个测试版 + 普通版本。我已经像这样设置了导入:
第一步选择具有 [date] 参数的所有行 - 那些进入kNN或Linear Regression,其他所有内容(1 行带有 ios 12 发布日期)进入预测,然后进入表格。
酷,现在根据建模我得到不同的结果(如预期的那样)。它是 2015-09-17 (kNN) 或 2018-09-10 (LR)。我使用了测试和分数,它给了我:
如果我没看错 - 线性回归更准确(R2 列),这意味着 iOS 12 将于 2018 年 9 月 10 日发布(废话!不是 2015 年)。
但如果我查看到目前为止的发布日期,这可能是错误的,因为没有其他版本这么快发生:
所以我也做了一个练习,我调整了日期,所以它们都在 2018 年(这样一年就不那么重要了,考虑到这些特征,我会更关心每年的关系) - 这里是预测的结果:
现在...我欢迎所有评论。 我是否使用了错误的模型?kNN & LR 以外的东西?我应该使用偏移量吗?我是否完全错误地使用了该工具?