挑战性数据集的哪种模型?(数百个具有大量嵌套的时间序列)


9

我要分析的数据集非常复杂,我找不到适合的解决方案。

这是东西:

1.原始数据实质上是昆虫歌曲的录音。每首歌曲均由多个突发组成,而每个突发均由子单元组成。所有个人都记录了5分钟。个体之间的猝发数及其在录音中的位置以及每个猝发的子单元数可能会非常不同。

2.我有每个子单元的载波频率(基本频率),这就是我要分析的内容。

我的问题:

1.突发中的频率显然不是独立的(尽管它相当稳定,但是子单元n-1的频率会影响子单元n)。

2.突发在录音中也不是独立的。

3.随着频率随着时间的推移而下降,它们变得更加独立(个人厌倦了唱歌,因此歌曲的频率越来越低)。下降似乎是线性的。

4.嵌套=我在A和B两个位置有3个重复种群。所以我有A1,A2,A3和B1,B2,B3。

我想做的是:

1.表征两个地点之间的频率差异(进行统计测试)

2.刻画两个位置之间的频率下降特性(看看其中之一下降得更快)

怎么做:

那就是为什么我需要帮助:我不知道。看来,我的案例结合了通常看不到的问题。我已经读过关于混合模型,关于GAM,关于ARIMA,随机和固定效果的信息,但是我不能真正确定做到这一点的最佳方法。当我绘制它的频率(频率〜子单元编号n)时,两个位置之间的差异非常明显。我还必须考虑其他变量,例如温度(使频率更高)等。

我想到了:

  • 将个体嵌套在其来源的副本中,然后将副本嵌套在位置(单个/副本/位置)中。

  • 使用随机的“突发”效果,因此我考虑了每个突发中的可变性。

  • 使用固定的“记录中的突发位置”效果来测量频率下降(希望它实际上是线性的)。

正确吗?

我可以在这种情况下使用一种特殊类型的模型吗?


欢迎来到这个网站,乔。无需登录您的帖子,您的名字将始终显示在您的头像下:)
chl 2012年

好的,谢谢!这是一个非常不错的网站,制作精良。
2012年

与非嵌套形式相比,“将副本中的个体嵌套在副本中,并将副本嵌套在位置(单个/副本/位置)中”听起来像是个好主意。您的六个子群中的LOESS看起来像什么?
神父

1
非常感谢您的回答,非常感谢。好吧,我花了很长时间,但是我设法分析了这个(血腥)数据集。我想我太有野心了,想同时为所有模型建模。因此,针对每个问题(平均频率差异,频率增加等),我将工作分为几个模型。结论:有时候分工更好!
2012年

Answers:


2

这些只是一些一般性建议,您可能会发现有帮助,而不是制定路线图。

  • 我的本能是建立贝叶斯分层模型,因为它适合进行迭代模型开发-我认为您不会找到一个拥有您所需要的所有东西的现有模型。但是,这使假设检验更加困难,我不知道假设检验对您有多必要。
  • 听起来您脑子里有个关于昆虫行为的非正式模型。您说诸如“累”之类的事情,并且您知道温度会使频率升高,这大概是因为动物具有更多的能量。听起来您似乎对昆虫如何产生歌曲有点想法。
  • 这个问题听起来太复杂了,无法“一口气”建模。我认为您必须逐步建立一些东西。我将从一些“强而简单的假设”开始-即,丢弃数据集的大部分复杂性,并计划在有一个简单的模型起作用后再将其添加回去。

因此,首先,我将像在逐个脉冲串的基础上将子单元频率预处理为类似(平均频率,频率趋势)对那样的事情-使用OLS进行此操作,然后对频率的均值和趋势进行建模爆发,而不是子单位本身。或者,如果子单元的数量与昆虫的疲劳程度有关,则可以(平均值,趋势,子单元数)进行操作。然后建立贝叶斯分层模型,其中突发的均值和趋势的分布由记录的均值趋势确定,而反过来又由位置的均值趋势确定。

然后添加温度作为记录平均值/趋势的一个因素。

这个简单的模型应使您能够查看由温度和位置确定的记录中各个突发的平均值和趋势。尝试使它起作用。

然后,我尝试通过将其添加为由位置和记录确定的变量来估计突发平均频率之间的差异(或趋势,通过划分突发之间的静默时间)。下一步是记录中突发平均值的AR模型。

给定一些关于突发性质的先验和非常强的假设(所有信息均由均值和趋势给出),此基本模型将告诉您:

  • 突发的平均频率如何按位置和温度按位置不同
  • 爆裂趋势如何随位置和温度随温度而变化
  • 外部爆发趋势如何按位置和温度按温度不同

一旦有了类似的工作,那么也许是时候对子单元进行建模并丢弃原始OLS估计了。我将在此时查看数据,以了解哪种时间序列模型可能适用,并对时间序列模型的参数(而不是(均值,趋势)对)进行建模。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.