首先说明:我不是统计学家。我在大学学习数学(但选择退出每一堂统计课),现在发现自己从事的工作是统计数据。
我的问题有点哲学性,我敢肯定我的大脑因为对错误的事情想得太用力而扭曲了,但我正在为随机变量的概念而苦苦挣扎。
假设一个打字员平均每分钟近似正态分布。我认为这是很标准的。
所以我们可以说我们希望打字员每分钟好的,如果我们用另一个人代替打字员呢?我们是否期望第二个人以每分钟当然不是,因为我们只有第一人称的样本,而没有第二人的样本,对吧?第二个打字员的平均值可能完全不同。这是有道理的,但是如果我把原来的打字员放回去,把一只手绑在他背后怎么办。显然期望值是不同的,因为打字员显然不能快速打字。但是在什么条件下,我们可以期望打字员的平均值为? 似乎打字员状态的任何扰动都会改变概率。但是我们从来没有真正定义过打字员的状态,期望值是从样本中计算出来的。很明显,每次打字员打字时,他或她的状态都会略有不同,即可能头痛、可能手指疼痛、可能做白日梦,但我们仍然计算样本中的那些。所以在我看来,从技术上讲,如果我们可以接受状态的一些小变化,那么为什么我们不能接受状态的大变化呢?或者分界线在哪里?即如果我更换打字员,我同样有权说每分钟的预期字数仍然是。
我想有人解释为什么上面是错误的。也许这是一个显而易见的答案。