如何衡量/争论趋势线与幂律的拟合优度?


21

我有一些我要拟合趋势线的数据。我相信数据遵循幂定律,因此已在对数-对数轴上绘制数据以寻找直线。这导致了一条(几乎)直线,因此在Excel中我为幂定律添加了一条趋势线。作为一名统计新手,我的问题是,从“ 看起来线条合适”到“数值属性证明该图适合幂定律” ,现在对我来说最好的方法是什么? X

在Excel中,我可以得到一个r平方值,尽管由于我对统计信息的了解有限,我什至不知道在我的特定情况下这是否真的合适。我在下面提供了一张图片,显示了我在Excel中使用的数据的图。我对R有一点经验,因此,如果我的分析受到我的工具的限制,我愿意就如何使用R进行改进提出建议。

替代文字


Answers:


24

参见亚伦·克劳塞特的页面:

其中包含用于拟合幂律的代码(Matlab,R,Python,C ++)的链接,以及Clauset和Shalizi的论文,您应该首先阅读。

您可能想先阅读Clauset和Shalizi的博客文章:

最后一个链接的摘要可能是:

  • 许多分布为您提供对数对数图上的直线。

  • 滥用线性回归会使婴儿高斯哭泣。
    用最小二乘法拟合一条线到您的对数-对数图是一个坏主意。

  • 使用最大似然估计缩放指数。
  • 使用拟合优度来估计缩放区域的起始位置。
  • 使用拟合优度测试来检查拟合优度。
  • 使用Vuong的测试来检查替代方法,并准备失望。

1
我第二。有许多事例看起来像幂律,但经过更严格的检查后发现事实并非如此……不,图表上的高R ^ 2不够。
PeterR 2010年

“所以您认为...”是很好的参考。第1-6点(共7点)直接解决了这里提出的问题。
Whuber

但是幂律分布与在两个独立变量之间拟合幂律关系并不相同。我以为问题是关于后者的,尽管我不确定。
一站式

χ2

2
@JM:并非如此,卡方对装仓敏感,尾部波动会使情况复杂化。我认为即使使用KS,他们也重新考虑了极值的统计量,并且还讨论了其他测试。@onestop:我以另一种方式假设,并且在重新阅读时,您可能是正确的。我真的不知道..
ARS

3

如果您对双变量幂律函数(与单变量幂律分布相对)感兴趣,那么

沃顿等。“ 用于异度测量的双变量线拟合方法。” 生物学。Rev.81,259-201(2006)

是极好的参考。在这种情况下,回归是正确的做法,尽管根据您希望回归结果的含义可以进行一些更正(OLS与RMA等)。


亚伦-该链接已死,您可以发布一个新链接吗?
keflavich 2011年

谢谢你 大多数信息是针对单变量分布的,往往会掩盖
songololo
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.