为什么术语分类和预测被用作同义词,尤其是在深度学习方面?例如,CNN 预测手写数字。
对我来说,预测是在告诉序列中的下一步,而分类是在(有限的)数据上放置标签。
为什么术语分类和预测被用作同义词,尤其是在深度学习方面?例如,CNN 预测手写数字。
对我来说,预测是在告诉序列中的下一步,而分类是在(有限的)数据上放置标签。
许多人混淆和误用了分类和预测(或分类和预测)这两个术语。这是因为在许多情况下,分类技术被用于预测目的,这会给其他人造成部分混淆,然后他们不恰当地使用“预测”(或“预测”)一词。
您对分类和预测定义的理解大部分是正确的,您绝对正确,有很多人使用同义词,有时是正确的,但我相信大多是错误的。有很多关于这两者的好文章,我在这个答案的末尾添加了一些链接和摘录。这些文章没有涵盖的是,许多预测(即预测)研究人员和从业者将使用常规分类器来预测时间序列或数据序列的未来状态。更高级的研究人员和从业者将使用时间循环模型来学习时间模式。这些仍然被称为分类器,但用于预测。
关于时间序列分类器、常规分类器和时间循环型分类器的这种使用的论文比回归模型的使用要多!
这增加了数据科学和机器学习社区在使用术语“分类”和“预测”方面的困惑。
Galit Shmueli 在他的论文《解释还是预测?
还有一个相反的问题,人们会将回归模型与分类混淆。请参阅下面的第一篇文章。
摘抄: 由于不进行概率思考,机器学习倡导者经常使用分类器而不是使用风险预测模型。情况变得很严重:许多机器学习专家实际上将逻辑回归标记为一种分类方法(事实并非如此)。重要的是要考虑分类的真正含义。分类实际上是一种决定。最佳决策需要充分利用可用数据、进行预测并应用损失/效用/成本函数来做出决策,例如最小化预期损失或最大化预期效用。不同的最终用户具有不同的实用功能。在风险评估中,这导致他们有不同的行动风险阈值。
抽象的。统计建模是通过因果解释、预测和描述来开发和检验理论的有力工具。在许多学科中,几乎完全使用统计建模来进行因果解释,并假设具有高解释能力的模型天生就具有高预测能力。解释和预测之间的混为一谈很常见,但为了科学知识的进步,必须理解这种区别。虽然这一区别已在科学哲学中得到认可,但统计文献缺乏对解释性目标与预测性目标建模过程中出现的许多差异的彻底讨论。本文的目的是澄清解释性和预测性建模之间的区别,讨论其来源,
如果进行决策树分析,结果是什么?分类?预测?
Gregory Piatetsky-Shapiro 回答:决策树是一种分类模型,应用于现有数据。如果将其应用于类别未知的新数据,您还将获得该类别的预测。
假设新数据来自与您用于构建决策树的数据相似的分布。在许多情况下,这是一个正确的假设,这就是您可以使用决策树来构建预测模型的原因。
什么时候分类和预测不一样?
Gregory Piatetsky-Shapiro 回答:这是一个定义问题。如果您尝试对现有数据进行分类,例如根据已知的医疗数据和治疗结果对患者进行分组,我将其称为分类。如果您使用分类模型来预测新患者的治疗结果,那将是一个预测。
gabrielac 补充说 在“数据挖掘概念和技术”一书中,Han 和 Kamber 的观点是预测类标签就是分类,预测值(例如使用回归技术)就是预测。
其他人更喜欢使用“估计”来预测连续值。
它们不是字面上的同义词,书籍从不交换这些术语,因为它们代表两个不同的过程。它们是什么,虽然是两个相似的过程。
分类可以被认为是使用特定函数来生成一个或多个离散值的“过程” ,通常使用交叉熵函数。
另一方面,预测可以被认为是一个“过程”,它再次使用特定函数来生成连续值,通常使用具有 MSE 损失函数的线性或多重依赖模型。
TL:博士;分类用于离散值因变量,预测用于连续值因变量。两者都是相似的过程,具有用于学习和估计谓词的不同功能。您可以将分类视为一种特定的预测形式。
希望它有所帮助!如果我犯了任何错误,请告诉我。