包含测量不确定度的统计测试


11

假设我得到了两组质量测量值(以mg为单位),分别称为y1和y2。我想做一个测试,以确定两个样本是否均来自具有不同均值的总体。例如(在R中):

y1 <- c(10.5,2.9,2.0,4.4,2.8,5.9,4.2,2.7,4.7,6.6)
y2 <- c(3.8,4.3,2.8,5.0,9.3,6.0,7.6,3.8,6.8,7.9)
t.test(y1,y2)

我得到的p值为0.3234,在显着性水平为0.05的情况下,不要拒绝零假设,即两组均来自具有相同均值的总体。现在,我得到了每次测量的不确定性:

u1 <- c(2.3,1.7,1.7,1.7,2.0,2.2,2.1,1.7,2.3,2.2)
u2 <- c(2.4,1.8,1.6,2.3,2.5,1.8,1.9,1.5,2.3,2.3)

其中u1 [1]是测量值y1 [1]的组合标准不确定度(以此类推)。如何将这些不确定性纳入统计检验?


这些配对测量与否?(我假设不是。)可以使用不确定性来得出权重,这可以改善您的推断,但是不确定性的变化很小,因此即使不确定性是准确的,也不会有太大的收益。
Glen_b-恢复莫妮卡

这些是实际未配对数据的子集。该示例主要用于澄清问题。我真正要寻找的是关于如何将测量不确定度最佳地纳入假设检验(如检验)的一般指导。在我看来,如果不使用测量不确定性,我们将浪费大量有价值的信息,但是我一直无法在文献中找到关于该主题的明确指导。
汤姆(Tom)

为了充分利用它们,您需要将它们合并到观测的概率模型中。测量不确定度实际上代表什么?(您无法
手动执行

Answers:


1

听起来您想进行加权分析。请参阅SAS文档“概念”部分中的“加权统计示例”


因此,我们仅使用加权均值和加权标准差进行t检验,其中u1和u1是权重?
汤姆

是。您将假设第i个观测值的方差为Var / w_i,其中w_i是第i个观测值的权重,而Var> 0。
里克

1

为什么不模拟它?也就是说,将不确定性添加为每个观测的噪声实现。然后重复假设检验。大约执行1000次,看看有多少次空值被拒绝。您将需要选择噪声的分布。正常似乎是一种选择,但它可能产生负面观察结果,这是不现实的。


1

您可以将其变成回归问题,并使用不确定性作为权重。即,通过回归预测来预测组(1或2?)。

不确定性大约是恒定的,因此使用它们似乎也不会改变太多。

您在10.5处有一个异常的异常值,这通过减小均值之间的差异而使问题复杂化。但是,如果您可以相信不确定性,那么该价值就不会比其他任何事物都值得怀疑。

t检验不知道您的替代假设是两个样本来自不同的总体。它所知道的只是在某些假设下比较均值。基于排名的测试是一种替代方法,但是如果您对这些数据作为度量感兴趣,那么听起来并不适合您的目标。


点了。我改变了问题,以手段来表达它。
汤姆(Tom)

0

在普通最小二乘法(例如lm(y〜x))中,您可以在给定x值的情况下考虑y值附近的可变性(不确定性)。如果在(lm(x〜))处翻转回归,则会使x处的误差最小。在这两种情况下,都假定误差是相当均匀的。

如果您知道响应变量的每个观测值周围的方差量,并且当按x排序时方差不是恒定的,那么您将要使用加权最小二乘。您可以将y值加权为1 /(方差)。

如果您担心x和y都具有不确定性,并且两者之间的不确定性不相同,那么您就不想简单地最小化垂直于一根轴的残差(地址不确定性)。理想情况下,您将使垂直于拟合趋势线的不确定性最小化。为此,您可以使用PCA回归(也称为正交回归或总最小二乘。有用于PCA回归的R包,并且以前在此网站上有关于此主题的帖子然后在其他地方进行了讨论。此外,我认为(即,我可能是错的...)您仍然可以利用对方差的了解来对该回归进行加权处理。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.