我和的正态分布后数据点。然后我将样本分成两组和,和()。中的所有值都大于中的任何值的概率是多少?
兴趣源于这样一个事实,即如果我分析一个由大量变量组成的庞大数据集,那么其中一些变量(如果我假设它们是独立的)可能具有重要意义的可能性是多少。
添加
感谢您的精彩回答和评论。我想,我错误地陈述了我的问题。我确切地知道如何将我的样本分成两组和。所以,划分不是随机的。
关于关于第一段和第二段之间联系的评论:如果我有一个大数据集,我想估计有多少变量可以随机表现“显着”(例如,如果我对每个变量应用单变量秩检验)。我从上述正态分布中采样每个变量。采样完成后,我总是以相同的方式将样本划分为和。最后,我可能会得到一个对应于个采样过程的表格,我将其分为组。一件事,我对小和几乎相等和。