我认为你应该首先问他们,他们认为对一个人说他或她能够区分可口可乐和百事可乐的真正含义是什么。这样的人能做什么别人做不到的事?
他们中的大多数人不会有任何这样的定义,如果被问到,他们也无法做出这样的定义。然而,这句话的含义是统计给我们的,这就是你可以通过“统计品味”课程带来的东西。
统计的要点之一是对这个问题给出一个准确的答案:“说某人能够区分可口可乐和百事可乐是什么意思”
答案是:在盲测中,他或她比猜谜机更能对杯子进行分类。猜谜机无法区分,它只是一直在猜测。猜谜机对我们来说是一项有用的发明,因为我们知道它没有这个能力。猜测机的结果很有用,因为它们显示了我们应该从缺乏我们测试的能力的人身上得到什么。
要测试一个人是否能够区分可口可乐和百事可乐,必须将他或她在盲测中对杯子的分类与猜测机所做的分类进行比较。只有当她/他比猜谜机更好时,她/他才能分辨出其中的差别。
那么,您如何确定一个结果是否优于另一个结果?如果它们几乎相同怎么办?
如果两个人对少量杯子进行分类,如果结果几乎相同,说一个比另一个好是不公平的。或许今天的胜者只是碰巧运气好,如果明天再重赛,结果就会逆转?
如果我们要得到一个值得信赖的结果,它不能基于少数分类,因为机会可以决定结果。请记住,您不必完美才能拥有能力,您只需比猜谜机更好。事实上,如果分类的数量太少,即使是一个总是能正确识别可口可乐的人,也无法证明他/她比猜谜机更好。例如,如果只有一个杯子要分类,即使是猜谜机也有 50% 的机会分类完全正确。这不好,因为这意味着在 50% 的试验中,我们会错误地得出结论,即一个好的可口可乐标识符并不比猜测机好。很不公平。
待分类的杯子越多,猜谜机被揭穿的机会就越多,好可口可乐标识的炫耀机会也就越多。
10 杯可能是一个不错的起点。一个人必须有多少正确答案才能证明他或她比机器更好?
问他们会猜到什么。
然后让他们使用机器并找出它有多好,即让所有学生产生一系列十个猜测,例如。在智能手机上使用骰子或随机发生器。为了教学,你应该准备一系列的十个正确答案,用来评估猜测。
在黑板上记录所有结果。在黑板上打印排序结果。解释说,在统计学家承认他或她有能力区分可口可乐和百事可乐之前,人类必须优于这些结果的 95%。画一条线,将 95% 的最差结果与前 5% 的结果分开。
然后,让几个学生尝试对 10 个杯子进行分类。到现在为止,学生应该知道他们需要多少正确才能证明他们能分辨出不同。
不过,这一切在 10 分钟内并不是真正可行的。