机器算法验证 - 西塔是什么意思？ - 吾爱随笔录

西塔是什么意思？

机器算法验证术语

2022-02-09 14:00:17

我是统计新手，发现了这个。

在统计学中，小写希腊字母“theta”是一些一般概率分布的参数（向量）的常用名称。一个常见的问题是找到 theta 的值。请注意，以这种方式命名参数没有任何意义。我们不妨称它为其他任何东西。事实上，很多分布都有参数，这些参数通常被赋予其他名称。例如，通常使用分别命名正态分布 μ（读作：'mu'）和偏差 σ（'sigma'）的均值和偏差。

但是我仍然不知道这在简单的英语中是什么意思？

3个回答

这不是惯例，但经常 $\theta$ 代表分布的参数集。

这就是简单的英语，让我们用例子来代替。

示例 1。您想研究老式图钉（具有大圆形底部的图钉）的投掷。您假设它下降的概率是您调用的未知值 $\theta$ . 你可以调用一个随机变量 $X$ 然后说 $X=1$ 当图钉落下时 $X=0$ 当它下降时指向上方。你会写模型

P (X = 1) = θ P (X = 0) = 1 - θ,

$P(X = 1) = \theta \\ P(X = 0) = 1-\theta,$

你会有兴趣估计 $\theta$ （这里，图钉落下的概率）。

例 2.你想研究放射性原子的分解。根据文献，您知道放射性量呈指数下降，因此您决定使用指数分布对分解时间进行建模。如果 $t$ 是解体的时间，模型是

f (t) = θ e^{- θ t} .

$f(t) = \theta e^{-\theta t}.$

这里 $f(t)$ 是概率密度，表示原子在时间间隔内解体的概率 $(t, t+dt)$ 是 $f(t)dt$ . 同样，您将有兴趣估算 $\theta$ （这里是分解率）。

示例 3.您想研究称重仪器的精度。根据文献，您知道测量是高斯的，因此您决定将标准 1 kg 物体的重量建模为

f (x) = \frac{1}{σ \sqrt{2 π}} \exp {- {(\frac{x - μ}{2 σ})}^{2}} .

$f(x) = \frac{1}{\sigma \sqrt{2\pi}} \exp \left\{ -\left( \frac{x-\mu}{2\sigma} \right)^2\right\}.$

这里 $x$ 是尺度给出的度量， $f(x)$ 是概率密度，参数是 $\mu$ 和 $\sigma$ ，所以 $\theta = (\mu, \sigma)$ . 参数 $\mu$ 是目标体重（如果 $\mu \neq 1$ ），和 $\sigma$ 是每次称量物体时测量的标准偏差。同样，您将有兴趣估算 $\theta$ （这里是尺度的偏差和不精确）。

什么 $\theta$ 指的是取决于您使用的模型。例如，在普通最小二乘回归中，您将因变量（通常称为 Y）建模为一个或多个自变量（通常称为 X）的线性组合，得到类似

$Y_i = b_0 + b_1x_1 + b_2x_2 + ... + b_px_p$

其中 p 是自变量的数量。这里要估计的参数是 $\beta s$ 和 $\theta$ 是所有的名字 $\beta s$ . 但 $\theta$ 更通用的可以适用于我们想要估计的任何参数。

用简单的英语：

统计分布是一个数学函数 $f$ 它告诉你随机变量的不同值的概率是多少 $X$ 有分布 $f$ ， IE $f(x)$ 输出概率 $x$ . 有不同的这样的功能，但现在让我们考虑一下 $f$ 作为某种“一般”功能。

然而，对于 $f$ 要具有通用性，即可以应用于不同数据（具有相似属性）的数据，它需要改变其形状的参数以适应不同的数据。这种参数的一个简单示例是 $\mu$ 在正态分布中，它告诉这个分布的中心（平均值）在哪里，因此它可以描述具有不同平均值的随机变量。正态分布还有一个参数 $\sigma$ 和其他分布也至少有一个这样的参数。参数经常被调用 $\theta$ , 其中为正态分布 $\theta$ 是两者的简写 $\mu$ 和 $\sigma$ （即是两个值的向量）。

为什么是 $\theta$ 重要的？统计分布用于近似数据的经验分布。假设您有一组人的年龄数据集，平均他们是 50 岁，并且您想使用正态分布来近似他们的年龄分布。如果正态分布不允许不同的值 $\mu$ （例如，这个参数有一个固定值，比如说 $\mu=0$ )，那么对于这些数据将毫无用处。然而，由于 $\mu$ 不是固定的，正态分布可以使用不同的值 $\mu$ ，和 $\mu=50$ 作为其中之一。这是一个简单的例子，但还有更复杂的情况，其中的值 $\theta$ 参数不是很清楚，因此您必须使用统计工具进行估算（找到最合适的） $\theta$ 价值观。

所以你可以说统计是关于找到最好的 $\theta$ 给定数据的值（贝叶斯会说：给定数据和先验）。

其它你可能感兴趣的问题

上一篇在神经网络进行图像识别的背景下，“排列不变”是什么意思？下一篇这个与独立性有关的量有名字吗？