我可以测试先前给定数据的有效性吗?


10

问题

我正在编写一个R函数,该函数执行贝叶斯分析以在已知先验和数据的情况下估计后验密度。我希望该功能在用户需要重新考虑之前发出警告。

在这个问题上,我有兴趣学习如何评估先验。先前的问题涵盖了陈述知情先验的机制(此处此处)

在以下情况下,可能需要重新评估先验值:

  • 数据代表了一个极端的情况,在陈述之前
  • 数据中的错误(例如,如果先验单位为kg,则数据单位为g)
  • 由于代码中的错误,因此从一组可用的优先级中选择了错误的优先级

在第一种情况下,先验通常仍然足够分散,除非数据值在不受支持的范围内(例如,logN或Gamma <0),否则数据通常会使它们不堪重负。其他情况是错误或错误。

问题

  1. 关于使用数据评估先验的有效性是否存在任何问题?
  2. 是否有任何特定测试最适合此问题?

例子

这是两个与较差的数据集,因为它们来自具有(红色)或(蓝色)的。ØGñ01个ñ05ñ80.5

蓝色数据可能是有效的先验+数据组合,而红色数据将需要先验分布,该分布支持负值。

在此处输入图片说明

 set.seed(1)
 x<- seq(0.01,15,by=0.1)
 plot(x, dlnorm(x), type = 'l', xlim = c(-15,15),xlab='',ylab='')
 points(rnorm(50,0,5),jitter(rep(0,50),factor =0.2), cex = 0.3, col = 'red')
 points(rnorm(50,8,0.5),jitter(rep(0,50),factor =0.4), cex = 0.3, col = 'blue')

Answers:


4

您需要弄清楚“先验”的意思。例如,如果您对我之前对英国的预期寿命感兴趣,那肯定是错的。这是我的信念!它可能与观察到的数据不一致,但这完全是另一回事。

上下文也很重要。例如,假设我们对某些事物感兴趣。我的先前观点断言该数量必须严格为非负数。但是,观察到的数据有误,我们的测量结果为负。在这种情况下,先验不是无效的,它只是潜在过程的先验。

为了回答您的问题,

  1. 关于使用数据评估先验的有效性是否存在任何问题?

纯粹主义者会辩称,您不应两次使用数据。但是,务实的人只会反驳说,您首先没有对先验思想。

2是否有任何特定测试最适合此问题?

这实际上取决于所考虑的模型。我想最基本的是,您可以将先前范围与数据范围进行比较。


感谢您的回答,特别是对#1很有帮助。对于测试,我已经想到了这一点,但是大多数优先级的范围都将在处有一个界限,因此我在考虑也许比较分位数间隔的界限,例如,如果出现以下情况,请发送警告:第80个数据分位数>第99个分位数先验的或是否存在的:任何数据都大于第100-10e-log(n)个分位数),尽管我将不得不处理这些数字,以便捕捉正确的错误。
David LeBauer 2011年

3

这是我的两分钱:

  1. 我认为您应该关注与比率相关的先验参数。

  2. 您谈论的是信息性先验,但是我认为您应该警告用户合理的非信息性先验是什么。我的意思是,有时平均数为零且方差为100的法线是完全无效的,有时则是信息性的,具体取决于所使用的量表。例如,如果您要退还的身高(厘米)工资比上述先验信息丰富。但是,如果您将身高的原木工资(以米为单位)进行回归,则上述先验信息并不能提供足够的信息。

  3. 如果您使用的是一个先前分析的结果的先验,即新的先验实际上是先前分析的旧后验,则情况会有所不同。我假设这是事实。


您能否澄清第1点?回复:第2点,正如OP中所提到的,我对这个关于如何设置优先级的问题不那么感兴趣;要点3:许多知情先验来自对可用数据的分析(使数据适合于适当的分布),而另一些则基于专家知识(通常较少约束)。
David LeBauer 2011年

假设您正在拟合一个模型,例如:y〜a + b * x / z。如果对Z值没有限制(如果它们可以是正值或负值),那么很难知道对b信号的期望。此外,如果Z可以接近零,则b可能太低或太大。这会使您的先前不合理。请参阅Gelman博客上的以下条目:stat.columbia.edu/~cook/movabletype/archives/2011/06/…–
Manoel Galdino

#3:如前所述,请小心使用两次数据。例如,在稀疏上是一个层次模型,而另一个模型是选择一个与可能性一致的先验模型。在稍后的内容中,我将对此进行分析。我将选择更多优先级作为正则化工具。
Manoel Galdino
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.