为什么我们不使用有效数字?


18

知道为什么我们在统计中不使用有效数字吗?我们沿用的是估计值,因此关于精度的规则不适用;)?


1
读者可能还会发现以下线索:要放入表的重要数字
gung-恢复莫妮卡

我发现了这个有用的信息:davegiles.blogspot.com/2011/12/…–
约翰

stats.stackexchange.com/questions/113314上显示了一个重要的数字真正重要的例子,其中OP获得了明显不同的回归结果,可追溯到将数据输入回归过程的精度差异。
ub

Answers:


19

在某些领域(我在《化学》中了解到)使用有效数字来表示数字中有意义的精确度。这也是统计中的重要主题,因此实际上我们会不断报告此问题-我们只是以不同的形式报告它。具体来说,我们报告置信区间,它表示估计的精确度(例如平均值)。

一旦你已经列出了一个估计的95%CI,如,您可以列出尽可能多的数字为你的意思,你可能会喜欢,如0.50129519823975923,并没有问题。实际上,统计学家Andrew Gelman建议您至少列出四个(2009,p。4)(0.12,1.12)0.50129519823975923


(最后一部分是面颊的舌头,对不起我的无礼;-)。
gung-恢复莫妮卡

2
+1。大量数字似乎会产生不正确的回答:请参阅在另一个SE网站上对类似问题的答复的最后几行。
ub

@gung您如何决定用两个小数表示CI的端点?
user765195

@ user765195,我把这些数字补齐了。实际上不指任何东西。
gung-恢复莫妮卡

@gung我想问的是CI端点的精度是多少?例如,当您计算二项式比例的Wilson CI时,有效的位数是多少?
user765195

12

限制许多估计,p值等中报告的位数的原因之一是基于感知。报告类似p = 0.04872429的结果意味着结果的精确度使他们被认为更准确

从本质上讲,在报告统计结果时使用大量数字会导致过多的尝试以一种不当的权威掩盖您的发现。


1

我认为这确实取决于所需的置信度,有意义的位数较少适用于95%,而不是CERN在许多结果中使用的99.999%或更高。


为了进一步阐明,维基百科有关准确度和精确度的文章将很好地诠释原始海报。
罗伯·琼斯

这是一个好主意,但是即使在某些计算中𝛂 = .05时,四舍五入也会对结果产生很大的影响。
timothy.s.lau

1

您是在谈论将数据四舍五入为有效数字,还是四舍五入最终答案?如果对数据进行四舍五入,则可能会陷入丢弃统计计算需要使用的噪声的情况。


我的意思是,即使在教科书中,最终答案和中间计算结果通常都是四舍五入的。
timothy.s.lau
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.