之间的解释有区别吗是| X=米( X) + εY|X=m(X)+ϵ对比是=米( X) + εY=m(X)+ϵ?

机器算法验证 随机变量 符号 调理
2022-03-17 12:24:11

我明白那个E(Y|X)E(Y)是不同的,但不同的来源,当Y是其他随机变量的函数,例如X, 利用Y|XY来描述这种关系。我不确定这是否是一个符号的东西,但会做类似的事情Y|X=m(X)+ϵY=m(X)+ϵ(在建模的背景下Y具有一些功能X加上随机噪声)有不同的解释?假设X,Y,ϵ是随机变量。

2个回答

实际上没有这样的对象Y|X--- 每当出现这种符号时,它都是对符号的滥用,它用作指定以另一个随机变量为条件的随机变量的条件分布的简写。 因此,声明Y|X=m(X)+ϵ实际上没有任何意义;条件符号|X仅在规定随机变量分布的情况下使用,而不是在规定其与其他随机变量的函数关系时使用。在回归模型中,你总是会说Y=m(X)+ϵ, 不是Y|X=m(X)+ϵ.

当您指的是任何一个的分布Y或者ϵ,您可以参考边际分布或条件给定X. 在回归分析的背景下,分析是根据解释变量进行的X,因此通常会引用以此为条件的分布。符号Y|X用作指定条件分布的简写。例如,声明:

Y|XN(m(X),σϵ2),

实际上是条件分布的简写:

p(Y=y|X=x)=N(y|m(x),σϵ2).


严格来说,是可以创建新对象的Y|X这是范围的映射X到一组不同概率空间上的随机变量,每个变量都以规定的值为条件X. 在大多数情况下,我们不想为此烦恼,因为该符号只是用作规定条件分布的简写。

在我看来,使用等式依赖于X明确的。我唯一见过的符号y|X是当分布y正在讨论。您经常在贝叶斯模型中看到这一点,例如

y|μ,σN(μ,σ)

这个符号告诉我有一个先验σ并且分布y取决于什么σ是从数据生成过程中得出的。

无论如何,我认为两者之间没有太大区别y=y|X=.