我不知道是否只有我一个人,但我对总体统计数据非常怀疑。我可以在骰子游戏,扑克游戏等中理解它。非常小,简单,主要是独立的重复游戏就可以了。例如,落在其边缘的硬币足够小,可以接受正面或反面着陆的概率约为50%。
玩$ 10的扑克游戏,争取95%的胜利。但是,如果您一生的积蓄和更多金额取决于您是否赢得胜利?知道您在那种情况下有95%的时间会获胜将如何对我有所帮助?期望值并没有太大帮助。
其他例子包括危及生命的手术。根据现有数据,如何知道生存率为51%与99%的生存率有什么关系?在这两种情况下,我认为医生告诉我的内容对我来说都没有关系,我会坚持下去。如果实际数据是75%,他还可以告诉我(除非遵守道德和法律),否则生存的机率是99.99999%,所以我会感觉更好。换句话说,除了二项式之外,现有数据无关紧要。即使那样,如果我最终死了,生存率也不会有99.99999%的问题。
还有,地震的可能性。平均每隔x(x> 100)年发生一次强地震无关紧要。我不知道地震是否会在我的一生中发生。那么,为什么它甚至是有用的信息呢?
举一个不那么严重的例子,例如,我所去过的地方中,我爱过的地方中有100%位于美洲,对我去过欧洲的地方中的100%无动于衷,而对我所去过的地方中的100%却讨厌去过亚洲。现在,这绝不意味着我不会在下一次旅行中在亚洲找到自己喜欢的地方,也不会在欧洲讨厌或对美国无动于衷,只是因为统计数据无法捕获我所有的信息,即使我去过所有大陆的x%以上,我也可能永远无法捕捉到我需要的所有信息。只是因为在我尚未去过的那些大陆的1-x%中存在未知数。(请随意用其他百分比替换100%)。
我知道没有办法暴力破解所有内容,并且在许多情况下您都必须依靠统计信息,但是我们如何才能相信统计信息在我们的一发不可收拾的情况下会有所帮助,尤其是当统计信息基本上不推断为异常事件时?
有什么见解可以克服我对统计的怀疑吗?