做什么X= x | 是= yX=x|Y=y实际上是指本身?

机器算法验证 可能性 符号
2022-03-31 20:05:34

我知道:

P(X=x|Y=y)=P(X=x,Y=y)P(Y=y)

但我想了解什么X=x|Y=y本身的意思,例如(X=x,Y=y)方法X=xY=y. X=x|Y=y意思是?X=x什么时候Y=y?

一个使它更容易的例子(将这些作为观察):

X={1,6,7,8}

Y={0,1,19,5}

(X=x|Y=y)=?

3个回答

|概率论中的符号代表“给定”。您最常看到它用于条件概率 P(Y|X), 的概率X给定Y. 虽然这是对符号的轻微滥用,但您可能会看到类似

Y|XN(μ,σ)

为了Y有条件地X服从正态分布。您还会看到它显示分布的一些属性,例如条件期望 E[Y|X], 或方差 Var(Y|X), ETC。

请注意,类似X|Y单独的意义不大。那会是什么?“以另一个随机变量为条件的随机变量”?调节是关于您在查看变量时所采取的观点,而不是变量的属性。只需对分布进行简单的数学操作,您就可以将条件概率“转换”为联合或边际概率,或反转它(贝叶斯定理)。

示例:假设您有一群男人和女人,并且知道他们的惯用手(左/右)。如下表所示

menwomentotalleft handed9413right handed434487total5248100

假设您从该组中随机选择一个人,那么它是13%他们是左撇子的概率。但是如果你知道这个人是女人,那么概率是4/489%.

为了表达后一种情况,一个事件的概率,给定另一个事件或条件,使用竖线符号|.

P(X|Y)=probability of event X given/conditional on event Y

所以它是关于两个事件XY正在发生。但是,这不同于P(X,Y), 两者的概率XY正在发生。

鉴于一个人是女性,左撇子的概率不等于4%某人是左撇子的女性的概率。


表达方式X|Y发生在概率算子内P(). 但是您不应该将所有内容作为单个事件来阅读。

  • 所以这不是你必须解释它的方式:P()是点上事件的概率。所以P(X|Y)是事件的概率X|Y。”X|Y不是事件(正如亨利在评论中指出的那样)。竖条|向概率算子添加附加参数并引用条件。

这很快就会变得很哲学化。但是,Judea Pearl 的书 Causal Inference for Statistics第 1.3.3 节提供了一个很好的直觉,操作员|意味着在常客解释中对数据进行过滤一个直观的例子是两个有界限的变量P(X>a|Y<b),因此条件化意味着过滤数据,即删除条件条件的部分数据Y<b首先不成立。

关于如果X|Y是不是一个事件。它不是普通形式的事件,但生成的过滤操作会导致事件。那么哲学部分,贝叶斯解释甚至条件概率可以孤立存在。