放在表格中的有效数字有多少?


13

是否有建立合理的规则来公布重要数字?

以下是一些具体的示例/问题:

  • 有什么方法可以将有效数字的数量与变异系数相关联?例如,如果估计值为12.3,CV为50%,是否意味着以“ .3”表示的信息接近零?

  • 如果置信区间的数量级范围内,它们是否仍应具有相同数量的有效数字,例如:

    12.3(1.2,123.4)和12(1.2,120)

  • 误差估计中的有效位数应等于或小于平均值的有效位数吗?


如果可以,请不要使用表格:) IMO几乎总是比表格更容易阅读图形(显然,如果您没有很多数字,则是例外)。不幸的是,期刊及其审稿人并不总是同意...
JMS

3
@JMS好点了,但是表格可用于汇总统计单元的详细特征(按感兴趣的因素进行交叉分类,例如临床诊断或其他),具有不同类型(连续,名义和有序)的变量,以及得出的其他结果从统计模型本身(混淆矩阵,回归系数等)中得出的结果并不适合于数字(或者如果您想到的是Gelman的将法定系数显示为点图的方法,则可能并不总是如此)。我们都需要;问题是,我们何时真正需要一个图而不是一个表。
chl

@chi Fair。我几乎总是说:)。诸如大型n路表之类的东西不可能(完全)以图形方式再现。这取决于我要说的论坛。表格肯定会带来好处,但是您的读者实际上吸收了所有这些额外的信息吗?如果有太多参数无法容纳在图表中,我认为表格通常至少很难读取。但是,我确实认为,除了重复性以外,应该可以获取完整的结果(在线,附录等)。在那种情况下,我也想要数据和代码!徘徊的旧约,很抱歉..
JMS

另外,我认为回归系数和混淆(相关,协方差等)矩阵通常更适合图形显示,前者为点图或类似图形,后者为热图或图形。
JMS

@JMS我同意您的观点,但是在这种情况下有数字限制,在其他情况下有数字收费。同样,在这种情况下,如果读者瞥了一眼桌子并专注于所呈现的人物,那么他们将不会浪费时间来试图找出一个深奥的人物。但是我完全支持可重现性,在我努力做到这一点的同时,我可以(如果可以解决的话)将表格的可视化效果添加到所附加的代码中。
David LeBauer 2011年

Answers:


19

我怀疑是否存在通用规则,因此我不会做出任何弥补。我可以分享这些想法及其背后的原因:

  • 当汇总反映数据本身时(最大值,最小值,订单统计信息等),请使用与记录数据相同的有效数字。这在整个文档中提供了关于数据精度的一致表示。

  • 当汇总的精度高于数据时,以反映该额外精度的方式写入值。例如,值的平均值具有乘以单个值的精度:粗略地,对于,包括一个额外的有效数字,对于,包括两个额外的有效数字,。 (显然,这是在对数10范围内四舍五入的。)n 3Ñ3030<Ñ300n3n3030<n300

    -请注意,简历在这方面没有提供有用的信息。

    -一些估计可以非常精确地获得。它们不必四舍五入即可匹配其他内容。例如,1,000,000整数的平均值可能是10.977,标准误为0.00301。我决定将均值写到小数点后三位(和4-5个Sig图)是基于SE的数量级,这表明最后一位数字是部分可靠的。将SE写入三个sig图(五个小数位)的决定更加随意:两个sig图可以工作;一个可能不会;四个信号图也将起作用,并且与平均值为4-5的信号图一致;超过四个信号无花果将是过大的杀伤力。(一个人可以根据数据的第四矩来估计SE本身的标准误差,并用它来确定适当的舍入量,但是我们大多数人不会遇到这种麻烦...)

  • 当您进行大量舍入时,请向读者发送信号报告在讨论统计检验本身时要特别注意。原因是人们可能会使用您的工作来检查他们自己的计算。有时即使是很小的差异也可能会显示错误。您不想造成麻烦,因为您将123舍入为120,然后其他人检查了工作,获得123,并怀疑其中一个人犯了错误。

  • 要保持一致。如果您一次将某个值列出为123,然后将该值引用为120,则可能会失去一些读者。

  • 不要荒谬。(例如,当数据只有两个信号图时,当我遇到报告会给15个信号图提供统计结果的报告时,我会自动怀疑自己的能力不足。)


2
我的+1非常大,因为它确实是很多不错的建议。同样,我想向学生表明,从调查(或票数)中收集的数据以%的形式包含很多小数位数而不考虑样本量(这会影响标准误差)确实没有意义。
chl

0

我建议12(1.2,123.4)。忽略.3几乎是没有意义的,但是当许多人看到(1.2,120)时,他们会认为120中的最后一个“ 0”是有效的。


如果您同意在统计信息中显示感兴趣的统计信息,为什么建议省略小数(即,如果对于12来说没有意义,为什么对123.4有意义)?
chl

@chl:这没有多大意义,但是省略它可能会误导您。如果我输入123.4,像您这样的人将看到多余的数字,而忽略它们,不会造成任何伤害。如果我输入120,许多读者会认为这对3位数字是准确的-不好。
AVB

仍然不清楚为什么您建议使用123.4而不是123(为什么在示例中省略.3但不包括.4?)
David LeBauer 2011年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.