考虑逻辑回归,其中是因变量观测值,是自变量。
然而,我们并没有观察到本身。相反,我们观察到一些参数向量\boldsymbol{\mu}_i并且我们知道分布F st F(X_i|\boldsymbol{\mu}_i)。
本身没有被观察到的情况下,我们如何执行逻辑回归?对于一个一般分布,一种方法可能是为每个采样来自的许多值,并将它们全部放入回归模型中作为观察值。
是一个正态分布,我们能更有效地做事吗?
考虑逻辑回归,其中是因变量观测值,是自变量。
然而,我们并没有观察到本身。相反,我们观察到一些参数向量\boldsymbol{\mu}_i并且我们知道分布F st F(X_i|\boldsymbol{\mu}_i)。
本身没有被观察到的情况下,我们如何执行逻辑回归?对于一个一般分布,一种方法可能是为每个采样来自的许多值,并将它们全部放入回归模型中作为观察值。
是一个正态分布,我们能更有效地做事吗?
我认为您也可以采用最大似然方法,考虑到是您将可能性边缘化的潜在变量。
假设你通常的逻辑回归的可能性,如果你观察值,是其中是参数的向量(通常,)。
那么只观察和的可能性是
不幸的是,这些期望可能难以处理(也许对于简单的正态分布来说不是,但对我来说并不明显......),因此您可以通过 Monte Carlo 来估计它们。例如,采样并取的经验平均值。我不认为这相当于根据模拟数据并将它们放入模型中,但是看到链接会很高兴......
另一种方法是使用EM 算法(其中是潜在变量)来最大化这种可能性,这肯定会提高计算效率。
我希望这会有所帮助...
概括问题中提出的引导方法,其中回归不尝试估计,而是确定分布如何导致逻辑回归参数的分布,可以使用边际最大似然估计,这是随机效应线性中常见的一种技术楷模。被最大化的可能性是
可能性但是现有的文献可能会给出一些启发——以及估计这个(或者更确切地说是
实际上,这本书总体上可能是一本很好的参考书,因为它在具有随机效应的逻辑回归背景下检查了这个积分,可能直接适用于提出的问题。