我可以在线性模型中对标准偏差进行建模吗?

机器算法验证 方差 广义线性模型
2022-03-30 11:05:37

是否可以将标准偏差或方差放入线性模型中,作为要解释的数据?我有一个预测器,我认为它会线性地增加测量的标准偏差,而正是这种可变性是令人感兴趣的。

对于每个条件,我计算了标准偏差,这样我就有了一个我想建模的标准偏差向量。然后我将其输入线性模型

std_k( y_ik ) =  X_ij * beta_j + error_ij

其中 X 类似于

[ 1  -2 
  1  -1
  1   0
  1   1
  1   2 ]

我意识到标准偏差不是正态分布的,所以这不太正确。我可以转换变量以使误差项呈正态分布吗?或者我可以使用带有链接功能的“广义”线性模型吗?

(我实际上想将其输入到混合模型中,因为有几个受试者进行了实验。每个受试者都有不同的基线变异性,我想按条件查看受试者之间的变异性。我还需要比较受试者组. 混合模型似乎适合此目的)

2个回答

是的,你可以这样做。如果您认为种群是正常的,那么带有对数链接和伽马系列的 SD 的 GLM 是一种方法。

人们在一堆预测变量上回归 log SD 也并不少见。这是近似值,但所有模型都是。您可以在其中看到此操作的一个文本是 Box,Hunter 和 Hunter,Statistics For Experimenters(第 2 版),在第 12 章的直升机实验中。

这里的日志直观上是正确的,因为像 SD 之类的尺度参数是乘法效应,并且记录它们会使下摆相加——适用于线性模型。

听起来您本质上是在提出两阶段最小二乘法,其中第一阶段将每个集群减少到其关于集群特定平均值的标准偏差。这似乎很好,但请注意,您实际上可以在观察级别上建模,即让每个观察的方差是协变量的线性函数。请注意,我不知道有任何现成的软件可以做到这一点。

回到两阶段方法,如果集群i=1,...,N是正态分布的,例如ZiN(μi,ρi2)那么样本方差将是尺度卡方分布的Ni1自由程度。Si2表示聚类中的样本方差i, 然后

Si2ρi2Ni1×χ2(Ni1).

更详细地说,我们有

ESi2=ρi2,VarSi2=2ρi4Ni1.

伽马 GLM 假设VarY=ϕ(EY)2,所以这实际上可能是伽马回归的一个案例,带有身份链接!(这对我来说是第一次,我想。)如果Ni差异很大,那么您需要精确的权重1/(Ni1).