在统计中,我应该假设表示还是自然对数?


18

我正在研究统计信息,经常碰到包含的公式,log如果我将其解释为标准含义(log即以10 为底),或者在统计学log 中通常假定该符号为自然对数,我总是会感到困惑ln

我特别以“ 良好转弯频率估计 ”为例进行研究,但我的问题更多是笼统的问题。


2
“在许多应用中,似然函数的自然对数称为对数似然,使用起来更方便。” en.wikipedia.org/wiki/Likelihood_function#Log-likelihood 在统计中,我们经常使用似然函数,通常ln考虑的是。但是,两者是相关的:log(x) = ln(x) / ln(10) = ln(x) / 2.303,并且ln似然函数在与log10似然函数相同的点到达极值。
John_West '16

5
在一些特定的应用领域,在中提到,基地10意,但作为Aksakal指示,否则它在数学使用的惯例-即一种朴素的日志是指自然对数。loglog
Glen_b-恢复莫妮卡

2
正如@John_West所说,在缩放比例因子上,l o g ax 是相同的。因此,它们只有在另一个单位中进行测量时才是相同的。ln(x)loga(x)

1
@Aksakal; 您所说的是该单元很重要(请参阅我的评论),我对此表示同意。我还写了来明确指出基础。对于统计中的(某些)应用(例如最大似然),此比例因子是不相关的。添加比例因子后,最大值不会更改。在OP的参考(好图灵...),他们要绘制Ø g ^ ñ [R )Ø g ^ ž [R )Ô g ^ [R logalog(Nr)log(Zr)log(r)。这意味着单位在图的两个轴上都发生变化,因此绘制的“曲线”不变。

1
除非您写论文,否则即使使用对数似然法,标度(对数底)通常也很重要。例如,对数似然比检验统计数据使用,您必须从其他基准进行调整才能使用临界值。如果您正在编写软件,则在使用纸张等中的对数似然函数时,弄清基数很重要。在很多情况下,基数很重要而无所谓。ln
阿克萨卡尔邦

Answers:


20

可以安全地假定在统计信息中没有显式的base ,因为在统计信息中很少使用base 10日志。但是,其他张贴者指出,log 10或其他基准在应用统计的其他某些领域(例如信息论)中可能很常见。因此,当您阅读其他领域的论文时,有时会感到困惑。log=lnlog10

维基百科的熵页面是混淆使用的一个很好的例子。在同一页面中,它们表示基数2,e和任何基数。您可以通过上下文确定含义是什么,但这需要阅读文本。这不是呈现材料的好方法。将其与对数页面进行比较,该页面的底数在每个公式或ln中均清晰显示。我个人认为这是可行的方法:使用对数符号时始终显示基准。这也符合ISO标准,因为该标准并未使用@Henry指出的带有日志符号的未指定基准的用法。logelnloglog

最后,ISO 31-11标准对以2和10为底的对数规定了lg符号。这两天很少使用。我记得我们在高中时使用了lg,但这是在另一个世纪的另一个世纪。自从用于统计上下文以来,我从未见过它。在LaTeX中甚至没有lb的标签。lblglglb


1
以2为底的对数在某些领域也很常见。未经修饰的对数很少以10为底,但并不总是以e为底。
核王

有用,但我认为“很少”太强了。在一些实质性的领域中,人们可能只知道或最熟悉以10为底的对数。请注意,许多图表显示使用10有人喜欢自然对数发现没有任何困难这种秤解码权力对数刻度,但假设是基地10
尼克·考克斯

@ NickCox,OP专门将“统计”声明为一个字段,我不认为统计中经常使用以10为底的对数。
Aksakal

ISO 31-11好像指定日志Ë,并留下一个朴实的日志未定义lnlogelog
亨利

1
@NickCox,我使语言更加柔和,您提出了一个道理
Aksakal

14

这取决于。

在某些情况下,例如将值转换为分贝,以10为底的对数在方程式中非常少见。但是,对数刻度图通常以10为底,尽管从轴上的标签进行验证很容易。

在数学上下文中,未经修饰的很可能是自然对数(即log eln)。另一方面,计算机科学经常使用以2为底的对数(log 2),但并非总是如此。好消息是,您可以轻松地在两个碱基之间进行转换,而使用“错误”的碱基只会使您的答案减少一个常数。loglogelnlog2

在Gale的1995年的“无泪好转”中,文本中的对数实际上是 (在第5页上这样说),但是附录中的R / S +代码使用该函数,实际上是log eln。就像@Henry在下面指出的那样,这没有实际区别。log10loglogeln

如果我不得不猜测,这里有一些启发式方法:

  • 如果还存在2,或10的幂,则原木很可能具有相应的底数。e

  • 如果它是由积分引起的(或更普遍地涉及微积分),那么它很可能是自然对数。1/x

  • 如果它是由于重复地将某物分成两半而产生的(例如在二进制搜索中),则可能是。更一般而言,可以将某物除以n大约log n次。log2nlogn

  • 信息理论计算通常使用,尤其是在现代工作中。但是,您可以检查单位,以确保:日志2natln,和禁令日志10log2bitslog2natslnbanslog10

  • 寻找函数下降或上升到,(初始值的37%和63%)表明自然对数。1e or 11e


5
+1。一个小技巧是,如果在附近找到指数,则自然对数的可能性更大,反之则为10或2的幂。如果仍不清楚使用哪个底数,请尝试重现作者的示例计算。exp()
Nick Cox

2
由于在大风的纸张的图6和7页的图显示对数标度原单位,并且计算针对的对数-对数关系的斜率,即在表达式日志ñ - [R = 一个+ b 日志r 对应于N r = A r b,在这种情况下没有任何实际区别blog(Nr)=a+blog(r)Nr=Arb
亨利

2
base10

3

要回答您的问题:不,您不能假设对数使用通用的固定表示法。

最近在SE.Math中讨论了一个类似的问题:三种对数之间有什么区别?从数学的角度来看。通常,有不同的符号取决于习惯(日志10 seems of use in medical research) or language (for instance in German, Russian, French). Unfortunately, the same notation sometimes ends up representing different definitions. Quoting from the above SE.Math link:

Notation lnx (almost) unambiguously denotes the natural logarithm logex (latin: logarithmus naturalis), or logarithm in base e. The notation logx should be the adopted notation for the natural logarithm, and it is so in mathematics. However, it often represents the "most natural" depending on the field: I learned it as the base-10 logarithm (log10) at school, and it is often used this way in engineering (for instance in the definition of decibels)

Quite often, if you are not concerned with the meaning of physical units (like decibels @Matt Krause), nor interested in specific rates of change (in biostatistics, the log-ratio for fold-change often denotes the base-2 logarithm log2), it is likely that the natural logarithm (loge) is used.

For instance, in power or Box-Cox transforms (for variance stabilization), the natural logarithm appears as a limit when the exponent tends to 0.

Going back to your initial motivation, the Good-Turing Frequency Estimation, it is interesting to read The Population Frequencies of Species and the Estimation of Population Parameters, I. J. Good, Biometrika, 1953. Here, he used logarithmms in different contexts: variable transformation for variance stabilisation (mentioning Bartlett and Anscombe), sum of harmonic series, entropy. We see that he generally uses log as the natural logarithm, and once in a while in the paper specifies loge or log10, when the context requires it. For variance stabilization, or basic entropy estimation, a factor on the logarithm does not change much the result, as the outcome allows a linear change.


0

赤池信息准则中,基础是Ëln大号^ 最大可能性 大号^ 正在与参数数量进行加法比较 ķ

一种一世C=2ķ-ln大号

因此,如果在AIC中对数使用其他任何底数,似乎最终可能得出错误的结论并选择错误的模型。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.