西塔是什么意思?

机器算法验证 术语
2022-02-09 14:00:17

我是统计新手,发现了这个

在统计学中,小写希腊字母“theta”是一些一般概率分布的参数(向量)的常用名称。一个常见的问题是找到 theta 的值。请注意,以这种方式命名参数没有任何意义。我们不妨称它为其他任何东西。事实上,很多分布都有参数,这些参数通常被赋予其他名称。例如,通常使用分别命名正态分布 μ(读作:'mu')和偏差 σ('sigma')的均值和偏差。

但是我仍然不知道这在简单的英语中是什么意思?

3个回答

这不是惯例,但经常θ代表分布的参数集。

这就是简单的英语,让我们用例子来代替。

示例 1。您想研究老式图钉(具有大圆形底部的图钉)的投掷。您假设它下降的概率是您调用的未知值θ. 你可以调用一个随机变量X然后说X=1当图钉落下时X=0当它下降时指向上方。你会写模型

P(X=1)=θP(X=0)=1θ,

你会有兴趣估计θ(这里,图钉落下的概率)。

例 2.你想研究放射性原子的分解。根据文献,您知道放射性量呈指数下降,因此您决定使用指数分布对分解时间进行建模。如果t是解体的时间,模型是

f(t)=θeθt.

这里f(t)是概率密度,表示原子在时间间隔内解体的概率(t,t+dt)f(t)dt. 同样,您将有兴趣估算θ(这里是分解率)。

示例 3.您想研究称重仪器的精度。根据文献,您知道测量是高斯的,因此您决定将标准 1 kg 物体的重量建模为

f(x)=1σ2πexp{(xμ2σ)2}.

这里x是尺度给出的度量,f(x)是概率密度,参数是μσ, 所以θ=(μ,σ). 参数μ是目标体重(如果μ1), 和σ是每次称量物体时测量的标准偏差。同样,您将有兴趣估算θ(这里是尺度的偏差和不精确)。

什么θ指的是取决于您使用的模型。例如,在普通最小二乘回归中,您将因变量(通常称为 Y)建模为一个或多个自变量(通常称为 X)的线性组合,得到类似

Yi=b0+b1x1+b2x2+...+bpxp

其中 p 是自变量的数量。这里要估计的参数是βsθ是所有的名字βs. θ更通用的可以适用于我们想要估计的任何参数。

用简单的英语:

统计分布是一个数学函数f它告诉你随机变量的不同值的概率是多少 X有分布f, IEf(x)输出概率x. 不同的这样的功能,但现在让我们考虑一下f作为某种“一般”功能。

然而,对于f要具有通用性,即可以应用于不同数据(具有相似属性)的数据,它需要改变其形状的参数以适应不同的数据。这种参数的一个简单示例是μ正态分布中,它告诉这个分布的中心(平均值)在哪里,因此它可以描述具有不同平均值的随机变量。正态分布还有一个参数σ和其他分布也至少有一个这样的参数。参数经常被调用θ, 其中为正态分布θ是两者的简写μσ(即是两个值的向量)。

为什么是θ重要的?统计分布用于近似数据的经验分布。假设您有一组人的年龄数据集,平均他们是 50 岁,并且您想使用正态分布来近似他们的年龄分布。如果正态分布不允许不同的值μ(例如,这个参数有一个固定值,比如说μ=0),那么对于这些​​数据将毫无用处。然而,由于μ不是固定的,正态分布可以使用不同的值μ, 和μ=50作为其中之一。这是一个简单的例子,但还有更复杂的情况,其中的值θ参数不是很清楚,因此您必须使用统计工具进行估算(找到最合适的)θ价值观。

所以你可以说统计是关于找到最好的θ给定数据的值(贝叶斯会说:给定数据和先验)。