术语预测器和特征之间有什么区别

数据挖掘 机器学习 定义
2022-03-01 11:37:32

对于术语'predictor',我找到了以下定义:

预测变量:用于确定或预测目标变量的一个或多个变量。

而维基百科包含以下“特征”一词的定义:

特征是被观察现象的单个可测量属性或特征。

机器学习中的“预测器”“特征”有什么区别?

3个回答

特征和预测器在今天的机器学习中可以互换使用,尽管我必须承认,特征似乎比预测器更多地被使用。该定义是您已经提到的维基百科上的定义。术语预测器来自统计,这里有一个定义:

自变量,有时称为实验变量或预测变量,是在实验中被操纵以观察对因变量(有时称为结果变量)的影响的变量。

和我最喜欢的定义: 预测变量解释响应的变化。

简而言之:X 列:特征、预测变量、自变量、实验变量。y 列:目标、因变量、结果、结果变量。

预测器是第一级输入变量,而特征可能是第一级或第二级。在这里,第一级意味着预测器作为预测响应或输出的输入变量。第二级意味着特征作为预测变量或输入变量的非线性变换,使用一些基础或特征映射来捕获继承的特殊结构。

一个特征可能是一个预测器,但它不一定是。Y=f(X), 在哪里Y是预测结果,特征是所有可用变量X. 所以特征本质上是输入变量。假设您有一个案例,您有 10 个特征。可能只有一半具有任何预测价值。丢弃其他特征不会改变预测的质量Y.