在科学论文中报告曲线拟合结果


11

(我希望这个问题适合该网站;否则,请接受我的歉意)。

我进行了一定的模拟,得到了一个时间序列y(t),t = 0,1,...20。尝试了一些函数之后,我发现:

y(t) =~ 1 / (A t + B)

其中A和B是我使用线性回归计算的系数,R ^ 2> 0.99。

在科学论文中报告此类结果的标准方法是什么?特别:

答:我没有理论上的解释,为什么输出看起来像这样(我知道它应该在减少,并且它是从下面限制的,但没有更多)。这只是一个成功的猜测。我应该描述我尝试过的所有其他不成功的猜测吗?

B.每当我运行模拟时,我得到的A和B值都会略有不同。我应该只是报告一次随机运行,还是应该多次运行模拟并对结果求平均值?如果是这样,多少次就足够了?


您想传达什么?每个模拟代表什么?
比尔·巴特

这是土地所有权的模拟。有N个公民和N个地块。最初,每个土地都被分配给一个随机的公民。然后,每年,每块土地都以一定概率p出售,如果确实出售,则随机选择买家。50年后,我执行了“ Jubilee”程序,将一些土地归还给原始所有者(如果这些所有者当前没有土地)。我计算每个禧年(t)之后无土地的公民人数(y)。当然,y(t)不会增加。我想表明它是可预测的速率下降,并且它收敛于0
埃雷尔西格尔-Halevi

一种

2
Xñnñ=0ññ

Bill:您的意思是说我应该多次计算A和B,然后报告均值和标准差?我认为更好的方法是对所有模拟中的所有样本进行一次线性回归。但是我应该运行多少次模拟?
Erel Segal-Halevi

Answers:


5

您正在尝试使功率定律适合您的配电。很有意思。这些都说明了在所有的时间图论社交网络转换的其他地方。

这里这里都有一些关于如何拟合数据的教程。

另外,关于问题A,一个人购买土地的概率如何取决于他们已经拥有多少土地?您也许可以使用Barbasi模型来解释为什么幂定律合理地适合您的数据。

更新:我用过它,并且效果很好:https : //pypi.python.org/pypi/powerlaw


+1所有链接!我也想到了幂定律,但是由于B常数(y =(A t + B)^-1),它的简单形式(y = A t ^ k)不需要我找到的形式。有更一般的形式吗?
Erel Segal-Halevi

如果您对描述曲线的形状感兴趣,则应在拟合幂定律之前进行因子分解和移位。您拥有B的事实与曲线的形状无关。
dranxo 2012年

抱歉,我不明白您的意思,“那么您应该分解并转移”是什么意思?
Erel Segal-Halevi

设置x = t + B / A。然后(At + B)^ {-1} =(A * x)^ {-1},这是链接中的形式。
dranxo 2012年

1
tuvalu.santafe.edu/~aaronc/courses/7000/csci7000-001_2011_L3.pdf
dranxo 2012年

7

关于您的问题的几点思考:

  • 如何您报告的模型拟合将在很大程度上取决于你的听众,你的领域。例如,在我的领域中,很少报告像R ^ 2这样的模型拟合统计量-既不令人印象深刻也不特别有用。取而代之的是,往往会描述一些有关如何得出模型的标准,然后再报告模型结果-我们都假定您实际上正确地拟合了模型。
  • “我碰巧遇到过这种情况”是一个不好的解释。真的很糟糕。尽管喜欢偶然天才的故事,例如青霉素或奎宁的发现,但“盲目运气”并不是一个可靠的科学过程。例如,您已经表明该表单可以很好地拟合数据,但尚未显示出它适合拟合数据。仅R ^ 2不足以用来评估模型对数据的拟合程度。参见Anscombe的四重奏
  • 正如@rcompton所提到的,看起来您似乎在不知道幂定律的情况下尝试拟合幂定律分布,但是即使您确实设法很好地拟合了幂定律,也最好找到找到认为幂定律的理由。 。随时间推移绘制Y,到CrossValidated(或对统计更熟悉的大学/系),系统地遍历可能大致给您带来外观的分布,可能就足够了。除了幂律分布以外,还有其他一些可能会给您带来更合适的选择。

+1的见解。“系统地浏览可能会给您大致外观的发行版。” -在哪里可以找到这些?
Erel Segal-Halevi

@ErelSegalHalevi您可能从CrossValidated开始,该站点是与统计和数据分析有关的姐妹站点。
Fomite
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.