我认为您应该首先询问他们,他们认为对一个人说他或她能够分辨可口可乐和百事可乐之间的区别到底意味着什么。这样的人能做别人不能做的事情?
它们中的大多数将没有任何这样的定义,并且如果提出要求将无法产生一个定义。但是,该词组的含义是统计信息给我们的含义,也就是您可以从“统计学趣味”课中获得的内容。
统计学的要点之一是给出以下问题的确切答案:“说某人能够分辨可口可乐和百事可乐的区别是什么意思”
答案是:在盲法测试中,他或她胜过将杯子分类的猜测机。猜测机无法分辨出差异,它只是一直在猜测。该猜测的机器是我们的一个有用的发明,因为我们知道,它并没有具备的能力。猜测机的结果很有用,因为它们显示了我们对缺乏我们测试能力的人的期望。
为了测试一个人是否能够分辨出可口可乐和百事可乐之间的区别,必须在盲法测试中将他或她的杯子分类与猜测机可以进行的分类进行比较。只有当他/他比猜测机更好时,他/他才能够分辨出差异。
那么,您如何确定一个结果是否优于另一个结果?如果它们几乎相同怎么办?
如果两个人对少量杯子进行分类,那么如果结果几乎相同,那么说一个杯子比另一个杯子好就不是很公平。也许今天的获胜者恰好是幸运的,如果明天再次参加比赛,结果会倒转吗?
如果我们要得到一个值得信赖的结果,那么它就不能基于极少数的分类,因为这样机会可以决定结果。记住,您不必具备完美的能力,而必须比猜测机更好。实际上,如果分类的数量太少,即使始终正确识别可口可乐的人也无法证明他/她比猜测机更好。例如,如果只有一个杯子可以分类,那么即使是猜谜机也将有50%的机会对完全正确的杯子进行分类。这不好,因为这意味着在50%的试验中,我们会错误地得出结论,好的可口可乐识别器并不比猜测机好。非常不公平
要分类的杯子越多,猜测机无法显示的机会就越多,好的可口可乐标识符展示的机会就越多。
10杯可能是个不错的起点。一个人然后必须显示多少个正确答案才能证明他或她比机器更好?
问他们他们会怎么猜。
然后让他们使用机器,找出机器的性能,例如,让所有学生产生一系列的十个猜测。在智能手机上使用骰子或随机生成器。要进行教学,您应该准备一系列的十个正确答案,以对这些猜测进行评估。
将所有结果记录在板上。在板上打印排序的结果。解释说,在统计学家承认他或她有能力分辨可口可乐和百事可乐之间的差异之前,人类必须要优于结果的95%。画出一条线,将95%的最差结果与5%的最差结果区分开。
然后,让几个学生尝试对10个杯子进行分类。到现在为止,学生应该知道他们需要证明自己能够分辨出区别的多少权利。
但是,所有这一切在10分钟之内并不是真正可行的。