我是统计新手,发现了这个。
在统计学中,小写希腊字母“theta”是一些一般概率分布的参数(向量)的常用名称。一个常见的问题是找到 theta 的值。请注意,以这种方式命名参数没有任何意义。我们不妨称它为其他任何东西。事实上,很多分布都有参数,这些参数通常被赋予其他名称。例如,通常使用分别命名正态分布 μ(读作:'mu')和偏差 σ('sigma')的均值和偏差。
但是我仍然不知道这在简单的英语中是什么意思?
我是统计新手,发现了这个。
在统计学中,小写希腊字母“theta”是一些一般概率分布的参数(向量)的常用名称。一个常见的问题是找到 theta 的值。请注意,以这种方式命名参数没有任何意义。我们不妨称它为其他任何东西。事实上,很多分布都有参数,这些参数通常被赋予其他名称。例如,通常使用分别命名正态分布 μ(读作:'mu')和偏差 σ('sigma')的均值和偏差。
但是我仍然不知道这在简单的英语中是什么意思?
这不是惯例,但经常代表分布的参数集。
这就是简单的英语,让我们用例子来代替。
示例 1。您想研究老式图钉(具有大圆形底部的图钉)的投掷。您假设它下降的概率是您调用的未知值. 你可以调用一个随机变量然后说当图钉落下时当它下降时指向上方。你会写模型
你会有兴趣估计(这里,图钉落下的概率)。
例 2.你想研究放射性原子的分解。根据文献,您知道放射性量呈指数下降,因此您决定使用指数分布对分解时间进行建模。如果是解体的时间,模型是
这里是概率密度,表示原子在时间间隔内解体的概率是. 同样,您将有兴趣估算(这里是分解率)。
示例 3.您想研究称重仪器的精度。根据文献,您知道测量是高斯的,因此您决定将标准 1 kg 物体的重量建模为
这里是尺度给出的度量,是概率密度,参数是和, 所以. 参数是目标体重(如果), 和是每次称量物体时测量的标准偏差。同样,您将有兴趣估算(这里是尺度的偏差和不精确)。
什么指的是取决于您使用的模型。例如,在普通最小二乘回归中,您将因变量(通常称为 Y)建模为一个或多个自变量(通常称为 X)的线性组合,得到类似
其中 p 是自变量的数量。这里要估计的参数是和是所有的名字. 但更通用的可以适用于我们想要估计的任何参数。
用简单的英语:
统计分布是一个数学函数它告诉你随机变量的不同值的概率是多少 有分布, IE输出概率. 有不同的这样的功能,但现在让我们考虑一下作为某种“一般”功能。
然而,对于要具有通用性,即可以应用于不同数据(具有相似属性)的数据,它需要改变其形状的参数以适应不同的数据。这种参数的一个简单示例是在正态分布中,它告诉这个分布的中心(平均值)在哪里,因此它可以描述具有不同平均值的随机变量。正态分布还有一个参数和其他分布也至少有一个这样的参数。参数经常被调用, 其中为正态分布是两者的简写和(即是两个值的向量)。
为什么是重要的?统计分布用于近似数据的经验分布。假设您有一组人的年龄数据集,平均他们是 50 岁,并且您想使用正态分布来近似他们的年龄分布。如果正态分布不允许不同的值(例如,这个参数有一个固定值,比如说),那么对于这些数据将毫无用处。然而,由于不是固定的,正态分布可以使用不同的值, 和作为其中之一。这是一个简单的例子,但还有更复杂的情况,其中的值参数不是很清楚,因此您必须使用统计工具进行估算(找到最合适的)价值观。
所以你可以说统计是关于找到最好的给定数据的值(贝叶斯会说:给定数据和先验)。