物流增长数据的误差分布是什么?


10

在生态学中,我们经常使用逻辑增长方程:

Nt=KN0ertK+N0ert1

要么

Nt=KN0N0+(KN0)ert

其中是承载能力(达到最大密度),是初始密度,是增长率,是从初始开始的时间。KN0rt

的值具有一个的上限和一个下限,下限为。Nt(K)(N0)0

此外,在我的特定上下文中,使用光密度或荧光进行测量,这两者均具有理论最大值,因此具有很强的上限。Nt

因此,围绕的误差最好用有界分布来描述。Nt

在值,该分布可能具有很强的正偏度,而在值接近K时,该分布可能具有很强的负偏度。因此,该分布可能具有可以链接到的形状参数。NtNtNt

方差也可以随着增加。Nt

这是一个图形示例

在此处输入图片说明

K<-0.8
r<-1
N0<-0.01
t<-1:10
max<-1

可以用

library(devtools)
source_url("https://raw.github.com/edielivon/Useful-R-functions/master/Growth%20curves/example%20plot.R")
  • 考虑到模型和提供的经验信息,围绕的理论误差分布是?Nt

  • 此分布的参数与或时间值关系(如果使用参数,则该模式不能与直接关联,例如logis正态)?NtNt

  • 这个分布是否具有在实现的密度函数?R

到目前为止探索的方向:

  • 假设附近的正态(导致估计过高)NtK
  • Logit正态分布在,但难以拟合形状参数alpha和betaNt/max
  • 围绕的逻辑进行Nt/max

1
通过关注错误的分布,该问题反映了对模型的复杂思考,但是请注意,功能形式的错误分布不一定与形式本身有任何关系。相反,可以在以下信息中找到有效答案的成分:有关增长的方式,有关和随时间的自然变化(一定会吸收到误差中),关于可能的模型错误指定以及(和)被测量。KrNtt
ub

@whuber,我尝试在最近的修改中解决您的一些评论。
EtienneLow-Décarie'04年

1
5认为,如果您可以用自己的方式表征噪声分布的特性,则可以选择具有这些特性的参数形式。我认为总结一下家庭必须1.在有限的间隔内定义,2.允许左偏斜,右偏斜和对称。3.具有随Nt增加而增加的方差。Beta分布适合1和2的帐单。固定间隔为[0,1]。因此,为了允许方差增加,我们可以添加参数c,将分布扩展到intervsl [0,c]。
Michael R. Chernick

Answers:


3

正如迈克尔·切尔尼克(Michael Chernick)所指出的那样,按比例分配beta发行版对此最为合理。但是,出于所有实际目的,并希望您永远不会如果模型完全正确,则最好根据逻辑增长方程通过非线性回归对均值建模,然后用对异方差稳定的标准误差进行包装。将其置于最大可能性上下文中会产生高度准确性的错误感觉。如果生态学理论能够产生分布,则应拟合该分布。如果您的理论仅产生均值的预测,则应坚持这种解释,不要尝试提供任何其他方法,例如全面的分布。(皮尔逊的曲线系统肯定是100年前幻想的,但是随机过程并不遵循微分方程来生成密度曲线,这是他使用这些密度曲线的动机-而是,Nt本身-我以泊松分布为例-并且我不完全确定缩放的beta分布会捕获这种影响;相反,当您将平均值拉向其理论上限时,它可能会被压缩,您可能必须这样做。如果您的测量设备具有测量的上限,则并不意味着您的实际过程必须有上限;我想说的是,随着过程达到合理准确地进行测量的上限,设备引入的测量误差变得至关重要。如果您将测量结果与基础过程混淆了,则应该明确地认识到这一点,但是我想您比对描述设备的工作原理更感兴趣。(此过程将在10年后开始;可能会使用新的测量设备,因此您的工作将过时。)


谢谢一群!我同意将过程和措施分开很有趣。但是,我建议大多数测量方法都具有较高的上限,但是将其隔离可能很重要。如果我在哪里使用缩放后的beta,尽管警告过MLE拟合置信度,关于如何将形状参数与此系统关联以建模变量以允许MLE的任何建议?
EtienneLow-Décarie2012年

如果您确信边界对您的应用程序确实很重要,则可以坚持使用此扩展beta。我只是说我不相信。有一些截断数据的模型,您所知道的是实际值超出了您可以测量的最大值。它们有时与收入的最高编码一起使用,而出于保密原因,大于10万美元/年的收入被截断为10万美元/年。
StasK

1

@whuber是正确的,此模型的结构部分与误差项的分布之间没有必要的关系。因此,对于理论误差分布,您的问题没有答案。

但这并不意味着它不是一个好问题-答案必须主要根据经验。

您似乎假设随机性是可加的。我认为没有任何理由(除了计算方便)。替代方案是在模型的其他位置存在随机元素吗?例如,参见以下内容,其中随机性被引入为均值为1的正态分布,方差是唯一要估计的东西。我没有理由认为这是正确的做法,除了它会产生看起来似乎与您想要看到的结果相符的合理结果。使用这样的东西作为估计我不知道的模型的基础是否可行。

loggrowth <- function(K, N, r, time, rand=1){
    K*N*exp(rand*r*time)/(K+N*exp(rand*r*time-1)))}

plot(1:100, loggrowth(100,20,.08,1:100, rnorm(100,1,0.1)), 
    type="p", ylab="", xlab="time")
lines(1:100, loggrowth(100,20,.08,1:100))

在此处输入图片说明


在这种情况下,您的Nt值可能会低于零且高于硬上限。此外,在所有参数中都预期会出现噪声(不一定是参数与时间的乘积),因此响应变量上会出现噪声。我仍然会对您的方法的最大似然解释感兴趣。
EtienneLow-Décarie'5

这不允许对每个Nt限制分布,也不允许倾斜噪声分量。我不知道在文献中是否使用过按比例分配beta的想法,但它可以很好地满足这些限制。我没有尝试过,但也许可以尝试最大的可能性。我不确定,但是如果将c包括在似然估计中,可能会有问题。也许可以仅基于Nt单独估算c,然后可以通过每个固定Nt的最大似然拟合模型的其余部分。
Michael R. Chernick

我只是想大声一点。有没有人认为这个问题可以变成一份很好的研究论文?
Michael R. Chernick

1966年的一篇论文确实对此进行了一些研究,但是我最近没有看到。从那以后我也许已经改变了?jstor.org/discover/10.2307/…– EtienneLow
-Décarie

如果您决定走这条路,请告诉我。
EtienneLow-Décarie2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.