假设一致是什么意思?

数据挖掘 机器学习 数据集
2022-03-05 15:15:20

我正在学习概念学习,我专注于假设一致性的概念。

考虑假设h,我已经明白了,它与一个训练集是一致的D 当且当 h(x)=c(x)在哪里c(x)是概念,必须对每个样本进行验证xD.

例如,考虑以下训练集:

在此处输入图像描述

和以下假设:

h1=<?,?,?,Strong,?,?>

我认为这与 D不一致,因为例如3D我们有h(x)!=c(x).

不明白为什么这种假设不一致。

事实上,考虑以下假设:

h=<Sunny,Warm,?,Strong,?,?>

_D因为对于每个示例D我们有h(x)=c(x).

但是为什么第一个假设h1不一致,而第二个,h, 是一致的?

有人可以向我解释一下吗?

1个回答

我对此不是特别熟悉,但从提供的示例中我们可以推断出:

  • 假设是对特征的部分赋值。也就是说,通过“应用假设”,我们获得了特征满足假设的实例子集。
  • EnjoySport如果目标变量(在示例中显然称为“概念”)对于通过应用它获得的子集中的任何实例具有相同的值,则假设与数据一致。

第一种情况:h1=<?,?,?,Strong,?,?>. 数据中的所有 4 个实例都满足h1,所以子集满足h1是整个数据。然而EnjoySport,这个子集的概念可以有两个值,所以h1不一致。

第二种情况:h2=<Sunny,Warm,?,Strong,?,?>. 这个假设比h1: 满足的实例子集h2{1,2,4}. 这个概念对于这个子集中的每个实例EnjoySport总是有价值的,所以Yesh2与数据一致。

直观地说,如果知道假设指定的值可以 100% 确定目标变量的值,则假设与数据一致。