假设和每个都是从某些分布中抽取的独立同分布,其中独立于. 这是严格积极的。你观察所有,但不是; 而是你观察. 我有兴趣估计从这个信息。显然是估算器
是无偏的,并且可以根据手头的信息进行计算。
我如何计算这个估计器的标准误差?对于子情况只取值 0 和 1,我天真地尝试过
基本上忽略了变化,但发现这对于小于 250 左右的样本量表现不佳。(这可能取决于.) 似乎我没有足够的信息来计算“更好”的标准错误。
假设和每个都是从某些分布中抽取的独立同分布,其中独立于. 这是严格积极的。你观察所有,但不是; 而是你观察. 我有兴趣估计从这个信息。显然是估算器
我如何计算这个估计器的标准误差?对于子情况只取值 0 和 1,我天真地尝试过
我最近遇到了同样的问题。以下是我发现的:
与具有相同权重的简单随机样本不同,加权平均值的标准误差没有被广泛接受的定义。这些天来,直接进行引导并获得均值的经验分布,并基于该估计来估计标准误差。
如果想用一个公式来做这个估计怎么办?
主要参考文献是Donald F. Gatz 和 Luther Smith 的这篇论文,其中将 3 个基于公式的估计器与 bootstrap 结果进行了比较。自举结果的最佳近似来自 Cochran (1977):
以下是来自此 R listserve 线程的相应 R 代码。
weighted.var.se <- function(x, w, na.rm=FALSE)
# Computes the variance of a weighted mean following Cochran 1977 definition
{
if (na.rm) { w <- w[i <- !is.na(x)]; x <- x[i] }
n = length(w)
xWbar = weighted.mean(x,w,na.rm=na.rm)
wbar = mean(w)
out = n/((n-1)*sum(w)^2)*(sum((w*x-wbar*xWbar)^2)-2*xWbar*sum((w-wbar)*(w*x-wbar*xWbar))+xWbar^2*sum((w-wbar)^2))
return(out)
}
希望这可以帮助!
给定的估计方差是