样本修剪(截断)均值的抽样分布

机器算法验证 分布 采样 推理 修剪平均
2022-03-23 09:43:50

如果背景分布是正态分布,则 iid 样本的样本均值服从正态分布是基本概率论。但是修剪的意思是什么?对于大小为 iid 的样本,其分布是否有任何结果n? (对于正常或一般人口分布。)

我知道渐近(即n) 结果可用,但我现在对有限样本感兴趣(即固定n) 抽样分布。

我的实际目标是提出不对称修剪的采样分布(也就是说,当只有最小或最大的观察被丢弃时),但我被困在通常(对称)修剪的第一步......

背景:我的目标是提出一个非常非常简单的发表偏倚模型。你采取的背景分布N(0,σ2)(药物无效)。你取一个大小的样本n(与相同数量的参与者进行的试验),他们的平均值(荟萃分析)也是正常的,均值为零。但是 - 现在是重要的部分 - 你放弃了最低限度的观察:最糟糕的试验没有公布。在这种情况下,您的荟萃分析的分布是什么?这只是不对称修剪的平均值。

到目前为止我所做的:通过模拟很容易做到。说:

    library( lattice )
    library( reshape )

    x <- matrix( rnorm( 100000, 0, 1 ), nc = 10 )
    densityplot( ~value, groups = X2, data = melt( sapply( 10:1, 
            function( i ) { 
    apply( x, 1, function( y ) { mean( head( sort( y, 
         decreasing = TRUE ), i ) ) } ) } ) ),
    plot.points = FALSE,
    panel = function( ... ) {
    panel.densityplot( ... )
    panel.abline( v = 0 )
    } )

但是有什么分析解决方案吗?这个问题似乎并不奇怪,但是,我找不到任何东西。我唯一的想法是将结果用于订单统计的分布(将它们求和,考虑到它们的非独立性),但这似乎非常复杂,也许有更简单的方法......

1个回答

对于预期的最小值,没有已知的分析公式n正常变量时n>5.

同时,问题背景中的修剪均值有期望-1/(n-1)乘以该最小值的期望值。因此,对于预期的修剪平均值,没有分析公式已知n>5. 这表明该修剪后的均值的分布也没有很好的分析公式。

这在 1949 年关于“序数统计的一些低矩”的论文中有所记载,HJ Godwin 在该论文中总结道:“作者没有成功地获得具有更多变量的类似结果——那时初等函数可能不再足够。” 如果您搜索顺序统计文献(也许指导 HA David 的教科书或 HN Nagaraja 的后续版本),我想您还会看到从那时起没有人报告任何新的最小值或最大值的精确公式。