我有两个严重偏斜的样本,并且正在尝试使用自举来使用 t-statistic 比较它们的平均值。
正确的程序是什么?
我正在使用的过程
当我知道这不是正态分布时,我担心在最后一步使用原始/观察数据的标准误差是否合适。
这是我的步骤:
- Bootstrap - 随机抽样替换(N = 1000)
- 计算每个引导程序的 t 统计量以创建 t 分布:
- 通过获取来估计 t 置信区间和t 分布的百分位数
通过以下方式获取置信区间:
在哪里- 查看置信区间的落点以确定均值是否存在显着差异(即非零)
我还查看了 Wilcoxon 秩和,但由于分布非常严重(例如第 75 == 第 95 个百分位),它没有给出非常合理的结果。出于这个原因,我想进一步探索自举 t 检验。
所以我的问题是:
- 这是一个合适的方法吗?
- 当我知道观察数据严重偏斜时,是否适合使用观察数据的 SE?
可能的重复:首选哪种方法,自举测试或基于非参数等级的测试?