我理解分类....离散的响应或类别,例如动物是狗或猫。
作者说……“回归技术预测连续变化,例如温度、电力需求或股票市场价格的变化。”
我无法理解他的意思。
谢谢。
我理解分类....离散的响应或类别,例如动物是狗或猫。
作者说……“回归技术预测连续变化,例如温度、电力需求或股票市场价格的变化。”
我无法理解他的意思。
谢谢。
为了便于说明,让我们假设您正在尝试预测汽车油箱中的汽油量。
这个问题的分类问题陈述是你的车里是否有汽油(是或否)。
这个问题的回归语句将预测您汽车中的汽油水平(完全充满或完全空的任何地方)并且可以取任何值。
分类模型的输出可以是n 个选项之一,其中n是类的数量(和/或与每个类关联的概率)。
回归模型的输出是(可能有界的)连续值。
通过示例了解差异将非常容易。
分类:- 当您被要求预测患者是否会从疾病 X 中存活时,给出过去因相同疾病 X 存活或死亡的患者的所有必要数据,并给出预测相同的数据当前数据集。
回归:- 当您被要求找到汽车的售价时,给出了过去销售的汽车的所需信息,以及测试集(汽车)的价格和类似特征。
换句话说,我们也可以说,如果我们想找出一个离散的答案,那么这将是一个分类问题,如果我们想找出连续的(基于范围的)预测,那么这将是一个回归问题
回归和分类都与预测有关,其中回归预测来自连续集合的值,而分类预测“属于”类。
两者都是监督学习的例子。
例如:房子的价格取决于“大小”(平方英尺或任何单位)并说房子的“位置”,可以是一些“数值”(可以是连续的):这与回归有关。
类似地,价格预测可以用词来表示,即“非常昂贵”、“昂贵”、“负担得起”、“便宜”和“非常便宜”:这与分类有关。
每个类可能对应于某个范围的值
分类任务:
根据一些预测变量预测(猜测、估计)一个类(名义变量),这些预测变量可以是任何类型。示例:根据用户在视频流媒体平台上观看的视频,预测该用户是男性还是女性。
回归任务:
根据一些预测变量预测(猜测、估计)一个连续值(一个数值变量),这些预测变量可以是任何类型。示例:根据用户在视频流媒体平台上观看的视频,预测用户的年龄。
现在,有一个灰色区域:有一些算法可以预测概率,它是一个介于 0 和 1 之间的连续值。根据上述定义,您可以将它们视为回归算法(想想逻辑回归)。同时,这个概率是指类,所以可以用来分类(只要给概率设置一个阈值:概率<0.5的都归一类,> 0.5的归另一类)。你如何“分类”这些算法是一个哲学问题,没有什么实际意义。